请稍等 ...

想知道PolynomialFeatures的fit做了什么

老师见谅，问题好像有点多了。。。。
初始化的时候设置好degress后，为什么还要fit呢
由上一节内容，知道了degree，对应地用hstack对X操作就得到了【X，X2,…，Xdegress】矩阵不就好了吗，那么PolynomialFeatures的fit方法是做了什么呢？
还有个问题就是，之前讲LinearRegression里面的fit包括了将特征矩阵添加了一列全为1的X0
,方便来求theta0,也就是intercept_. 那么这里的
poly = PolynomialFeatures(degree=2)
poly.fit(X)
X2 = poly.transform(X)

也会因为表示X的零次幂，也得到了第一列全为1的X2,那么X2放进Ln_reg.fit（）中的时候，此时X2就应该有头两列都是1的列向量了，一列来自ln_reg.fit中，一列来自poly.transform中的求X的零次幂。。。而梯度下降更新theta的时候，求梯度这个向量的时候，梯度这个向量里的每一个元素分别是代价函数对各theta的偏导。为什么X的第一列（全是1)和X的第二列（也全是1），求出来的theta0（对应intercept_ ?) 和 theta1(coef_的第一个元素，为0）会不一样呢，

IT_god 2019-04-24 20:01:57

源自：8-2 scikit-learn中的多项式回归与Pipeline

1184

收起

提交取消

1回答

liuyubobobo 回答被采纳获得+3积分 2019-04-25 07:50:38

1）

PolynomialFeatures的fit没有作用。这只是sklearn设计的一个标准。

整体，这样的设计，和StandardScaler为什么要y参数，原因是一样的。满足一个固定的标准，在Pipeline内部，统一他们的流程化调用过程。可以参考这个问答：https://coding.imooc.com/learn/questiondetail/69934.html

2）

对，这个X2有两列1，但其实，知识你知道有两列1而已。算法不知道。算法只知道一列1；第二列1，其实是多项式特征做出的一个特征，他是一个x，但是，你知道，这组x的值，对于任何一个样本，都为1而已。

他们求出对应的theta是不一样的，因为他们完全是两个参数，在我们的梯度向量的两个不同的维度里。但是，我们的梯度下降，最终会得到最优解。所以，这并不影响我们最终的预测结果。

你可以理解成，我们给整个X添加了一个新特征，这个新特征对任何一个样本都是1，所以，添加不添加，没有关系。对预测没有影响。但是，添加了以后，我们的梯度的维度就变了。在梯度下降法的过程中，我们会为这个新特征找到一个对应的theta。

当然了，由于你知道这个特征肯定是1，将这列特征直接删掉，也没有任何问题：）

继续加油！：）

1 回复有任何疑惑可以回复我~

提问者 IT_god #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2019-04-25 13:17:05

相似问题

4.2 为什么predict还需要一个私有的predict，而fit没有？

老师我想问问，我做了一年多基础前端，切图的那种，然后学过php，现在也写一些php，我不知道怎么突破这样瓶颈

PolynomialFeatures 带有截距项

老师，我封装了order函数【跟您的思路一样】，但是我不知道该函数要做什么事情？

怎么知道kotlin反射需要引入jar包的?

登录后可查看更多问答，登录/注册

Python3入门机器学习经典算法与应用

参与学习 5839 人
提交作业 275 份
解答问题 2437 个

Python3+sklearn，兼顾原理、算法底层实现和框架使用。

了解课程

本课精华内容

问答作业

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

2.4k 19

关于线性回归中归一化处理和不对归一化处理的问题

3.4k 17

数据归一化为什么有用？对归一化无法直观理解

2.9k 15

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

1.6k 15

学好具体算法和机器学习的实际应用之间有哪些距离？

1.4k 14

查看更多本课问答

意见反馈帮助中心 APP下载