请稍等 ...

fit函数训练数据时每次读取的是filenames中一部分数据，是否有影响

老师，我看您写的代码，代码中每次读取一个parquet文件训练，这样是否会影响模型结果？是否需要全读取完成后再训练？

for filename in filenames:
	df = pd.read_parquet(filename)
	model.fit(
            [train_x1, train_x2, train_x3, train_x4], 
            。。。。
        )

1107156171 2022-11-03 22:27:42

源自：5-15 搭建并训练MLP模型（下）

798

收起

提交取消

1回答

Daniel 2022-11-04 10:52:55

不会影响的，即使全部读进来模型肯定也是一条一条记录的训练，所以没有必要哈。

而且全部读进内存对于大数据集而言几乎是不可能的

0 回复有任何疑惑可以回复我~

收起回答

提问者 1107156171 #1

是因为这个fit函数在调用时是在不断在原有模型基础上训练的嘛？所以才会不影响性能

回复有任何疑惑可以回复我~ 2022-11-04 11:14:21

Daniel #2

嗯对的！没错
绝大部分模型都是可以增量训练的哈

回复有任何疑惑可以回复我~ 2022-11-04 11:15:01

提问者 1107156171 回复 Daniel #3
```
好的，谢谢老师
```
回复有任何疑惑可以回复我~ 2022-11-05 08:10:21

相似问题

keras读入数据的方式

请教老师如果评论数据每天有增加，是不是每天都要搞个训练这个论评？

关于one_hot编码方法导致的在训练数据和测试数据上生成的数据维度不等时的处理方法

感觉如果验证数据叫测试数据，测试数据叫验证数据是不是更好些？

数据集全量训练，是不是16G的显存不够用了？

登录后可查看更多问答，登录/注册

全局视角系统学习《推荐系统》，实战中提升竞争力

参与学习 385 人
解答问题 99 个

模块化拆解底层架构，带你掌控全局，掌握核心技术和关键模型

了解课程

本课精华内容

问答作业

老师您好，关于不能fit问题

771 10

老师，请问http：5001/recall 是在哪里输呀

1.1k 8

5001/recall成功，但是5002/rank中调用recall失败

979 7

@udf自定义函数出错

1.2k 6

Py4JJavaError

780 5

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

fit函数训练数据时每次读取的是filenames中一部分数据，是否有影响

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师您好，关于不能fit问题

老师，请问http：5001/recall 是在哪里输呀

5001/recall成功，但是5002/rank中调用recall失败

@udf自定义函数出错

Py4JJavaError

【任务】选择合适得参数找出最优

【任务】使用Spark ALS实现协同过滤

【任务】认识一下其他算法与LSH得优缺点

【任务】Node2Vec中的两种不同策略得优劣

【任务】按要求找出物品信息

热搜

最近搜索清空

fit函数训练数据时每次读取的是filenames中一部分数据，是否有影响

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师您好，关于不能fit问题

老师，请问http：5001/recall 是在哪里输呀

5001/recall成功，但是5002/rank中调用recall失败

@udf自定义函数出错

Py4JJavaError

【任务】选择合适得参数找出最优

【任务】使用Spark ALS实现协同过滤

【任务】认识一下其他算法与LSH得优缺点

【任务】Node2Vec中的两种不同策略得优劣

【任务】按要求找出物品信息

正在回答回答被采纳积分+3