请稍等 ...

batch是在解析之后完成的，为什么会更改解析的结果呢？

老师，我可以理解当batch_size=1时，dataset每一个元素是（x(shape=(8,),y(shape=(1,)）形式，但是当batch_size=2时，为什么dataset每一个元素是（x(shape=(2,8),y(shape=(2,1)）而不是(x(shape=(8,),y(shape=(1,),x(shape=(8,),y(shape=(1,))这样的呢，batch是在解析之后完成的呀，解析的结果不就是一行数据变成x,y两个结果，为什么batch之后两行数据也是x,y两个结果呢，而不是x,y,x,y这样的类型呢？

def csv_reader_dataset(filenames, n_readers=5,
                       batch_size=32, n_parse_threads=5,
                       shuffle_buffer_size=10000):
    dataset = tf.data.Dataset.list_files(filenames)
    dataset = dataset.repeat()
    dataset = dataset.interleave(
        lambda filename: tf.data.TextLineDataset(filename).skip(1),
        cycle_length = n_readers
    )
    dataset.shuffle(shuffle_buffer_size)
    dataset = dataset.map(parse_csv_line,
                          num_parallel_calls=n_parse_threads)
    dataset = dataset.batch(batch_size)
    return dataset

weixin_慕勒7004644 2021-01-04 20:55:12

源自：4-5 tf.data读取csv文件并与tf.keras结合使用

766

收起

提交取消

1回答

正十七回答被采纳获得+3积分 2021-01-07 21:08:08

因为神经网络都是矩阵运算，所以如果做batch，dataset会把x变成矩阵，y变成矩阵，而不是x,y, x, y的类型。变成矩阵后可以一次把x输入给神经网络。这才是做batch的意义。

0 回复有任何疑惑可以回复我~

提问者 weixin_慕勒7004644 #1
```
想了很久，问了老师恍然大悟，感谢！
```
回复有任何疑惑可以回复我~ 2021-01-07 21:20:22

相似问题

在解析的过程，有多个url被yield跟进爬取时，如何保证都解析完成，才被yield给pipelines

ejs解析

epub解析

Orderer节点为什么要存数据呢？orderer节点部署方有什么利益可以获取吗？

老师，我网络请求成功了，但解析可能出问题了

登录后可查看更多问答，登录/注册

Google老师亲授 TensorFlow2.0 入门到进阶

参与学习 1849 人
解答问题 896 个

Tensorflow2.0实战—以实战促理论的方式学习深度学习

了解课程

本课精华内容

问答

如何确定神经网络的层数以及每一层的神经元数目？

3.4k 1

tensorflow如何进行超参数搜索呢？

2.0k 3

老师我运行那个第二章第一个程序的第二段出现下面的问题时咋回事啊

1.8k 19

使用函数式API训练wide and deep模型出错

1.9k 13

RuntimeError: 。。does not set or modifies parameter layer_size

2.8k 7

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号