采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师你好。请问下,连续变量离散化方法中的自因变量优化工程实现的代码怎么写呢?(Python)
同学你好,不太理解你说的自因变量优化工程指哪块内容,希望补充。
老师你好,就是你说那个离散化那节提到, 分箱的原因和方法 1、克服数据缺陷——等频 2、某些算法要求(朴素贝叶斯)——等宽 3、非线性映射——自因变量优化(找拐点) Python中怎么实现第三种呢?有相应代码吗?
同学你好,关于这点,指的多是关于业务层面的优化,例子里的拐弯点可以拿一个实例说明:比如一个公司业务发展,销售额先飞速发展,后来趋于平稳,我们可以把销售额的离散成发展期(比如用0表示)和平稳期(比如用1表示),这样有助于分析决策的理解与可读。这方面目前没找到直接可以调用的包,逻辑可能得自己写啦。
登录后可查看更多问答,登录/注册
快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!
1.2k 18
985 13
890 10
824 10
1.0k 9