请稍等 ...

wide_deep实战问题系列2

老师，您好，实战过程中又遇到两个问题：
问题一：
老师，您好，刚才看了您的回答，如果我的海量数据在HDFS要转化成您课程中的csv格式，我是20个G的数据，用pandas转化的话，一次读进20G的数据，估计内存要爆炸，我还担心转化成您课程中的csv格式20个G数据是不是要花很久很久？
问题二：
我的原始特征libsvm数据是浮点型的，转化成libsvm如果还是浮点型的话，进入模型你报错，我强制把每一列特征都改成int就不报错了，老师，这个强制改int我可以用什么办法避免吗？是不是读取数据的时候哪里默认格式是int了？

慕哥0458965 2019-01-27 19:27:54

源自：10-3 wide and deep网络结构与数学原理介绍

927

收起

提交取消

1回答

David 回答被采纳获得+3积分 2019-01-27 20:19:10

你的数据在hdfs上你写一个mr，就是map reduce，并行处理转化很快的20G。
你如果是按我的程度demo，那里读入的时候有_CSV_COLUMN_DEFAULTS, 你把float的地方弄成0.0试一下。

0 回复有任何疑惑可以回复我~

提问者慕哥0458965 #1
```
谢谢老师，我试一下～
```
回复有任何疑惑可以回复我~ 2019-01-27 20:25:03

相似问题

wide_deep实战问题系列3

wide_deep模型实战问题

这个实战感觉与实战两个字差异不少

虚拟列表是面试中的高频问题

课程实战部分什么时候开始？

登录后可查看更多问答，登录/注册

BAT大牛亲授个性化推荐算法实战

参与学习 844 人
解答问题 254 个

让你掌握一套完整的，能落地的个性化推荐算法体系。可用于毕设。

了解课程

本课精华内容

问答

wide & deep的column放置问题

1.5k 7

这课除了代码其他讲的都真差劲

1.5k 6

LFM代码加载txt文件问题

1.5k 6

老师，下载您的word2vec文件，运行提示无法执行二进制文件：可执行文件格式错误

2.6k 5

老师，为什么我的文件读不出来

1.4k 5

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号