1、老师,请问是每传入一个样本就只计算一次θ吗?θ是不是前面说的 w 和偏置 b ?
2、是不是必须先定义好神经网络的输出结果的所有可能性(种数和种类)才能传样本训练?
3、计算损失值 不仅让1减输出值,还要让其它各个类别上的值当0,再让他们分别减在各个类别上预测的值,然后把它们的绝对值加起来(或平方差函数或交叉熵函数),对吗?用1和0这两种数减预测值是不是仅限于sigmoid函数?用其它激活函数也是用 1 和 0 减预测值吗?
4、加入输出结果有C1,C2,C3,C4 四种,传入一个样本预测其为C1,这时开始计算损失值loss,然后调整w(或θ?),θ2=θ1-学习率*偏导,此时是只求与这个结果相连的那些w吗?与其它结果(C2,C3,C4)相连的那些几组w也要改变吗?
请老师多打点字讲解,如果能画图更好。我实在太菜。谢谢你。
理论知识与实战项目双管齐下,让AI技术不再脱离实际,做到真正的落地应用。适合毕设展示。
了解课程