spark 分布式计算-慕课网

1回答

Michael_PK 回答被采纳获得+3积分 2021-02-03 10:31:25

spark的图计算也可以，用业界的其他图数据库存储都是可以的。你所说的在一个机器上存数据？这个不是太明白，图数据库很多都是集群的呢，也就是说都是分布式的

0 回复有任何疑惑可以回复我~

提问者奶茶三兄弟d #1

就是我们现在数据分析的时候，其实都是在一台机器上，做内存分析的，没有集群的概念，然后这个solr + hbase这个图库其实分析的时候没有用到（很多原因。。。），然后现在数据量大就很慢，现在想要做的就是替换成spark，把机器给利用上，这样应该不管是spark直接对关系型数据分析也好，还是图数据也好，应该会快的，老师，这边您的哪一个课程，能让我快速了解，或者说是专门讲spark分布式计算这块的，

回复有任何疑惑可以回复我~ 2021-02-03 10:43:30

Michael_PK 回复提问者奶茶三兄弟d #2

那你这个需要定一个方案，看看如何把单机的东西进行迁移到集群的方式就可以呢。单机的数据量肯定是有瓶颈的，早晚有一天会不够的。你描述的一些技术solr或者hbase或者spark，都是支持分布式的执行的呢，用spark对hbase或者solr的数据进行读写、分析均可以

回复有任何疑惑可以回复我~ 2021-02-04 18:35:47

提问者奶茶三兄弟d 回复 Michael_PK #3

目前应该是要用spark，想让我们调研技术栈，老师您有推荐的课程可以看看嘛，谢谢

回复有任何疑惑可以回复我~ 2021-02-05 13:48:43

点开查看后面4条评论

spark 分布式计算

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

Java api 操作hdfs

老问题could only be replicated to 0 nodes instead of minReplication (=1).

在idea中上传文件到HDFS失败，找不到文件，文件不存在

JAVA 运行mkdir()出错

没有正常启动dfs.sh

热搜

最近搜索清空