采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
spark的图计算也可以,用业界的其他图数据库存储都是可以的。你所说的在一个机器上存数据?这个不是太明白,图数据库很多都是集群的呢,也就是说都是分布式的
就是我们现在数据分析的时候,其实都是在一台机器上,做内存分析的,没有集群的概念,然后这个solr + hbase这个图库其实分析的时候没有用到(很多原因。。。),然后现在数据量大就很慢,现在想要做的就是替换成spark,把机器给利用上,这样应该不管是spark直接对关系型数据分析也好,还是图数据也好,应该会快的,老师,这边您的哪一个课程,能让我快速了解,或者说是专门讲spark分布式计算这块的,
那你这个需要定一个方案,看看如何把单机的东西进行迁移到集群的方式就可以呢。单机的数据量肯定是有瓶颈的,早晚有一天会不够的。你描述的一些技术solr或者hbase或者spark,都是支持分布式的执行的呢,用spark对hbase或者solr的数据进行读写、分析均可以
目前应该是要用spark,想让我们调研技术栈,老师您有推荐的课程可以看看嘛,谢谢
登录后可查看更多问答,登录/注册
【毕设】大数据零基础入门必备,轻松掌握Hadoop开发核心技能
1.2k 30
2.4k 28
1.2k 17
1.3k 16
950 13