采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师好,我视频看到现在,感觉前面介绍了不少算法,但还是不知道如何应用在业务里,像前面介绍的FM特征交叉,标签权重计算这些,不知道每个算法的在本课程业务模块里的应用效果是什么?如何将这些算法串联起来根据业务行为数据生成标签呢?
同学你好,每个算法是生成某个类别的标签,在真正的项目里,每个算法模块都会单独出来,例如将朴素贝叶斯预测性别作为一个单独模块运行,然后在每天的凌晨对昨天的用户行为进行标签的生成。最后将各个算法分别生成的标签都存入到一张标签流水表里。为后面的业务逻辑,如人群圈选,提供数据支持。
老师,我再问下,第4章 特征工程和第5章 标签体系构建,第6章 群体用户画像构建这几章节在我们的项目里面的调用关系是什么,是先要执行特征工程再执行标签体系构建,接着再群体用户画像构建,然后生成用户标签流水表和用户标签主题表吗?
用户标签流水表和用户标签主题表,在项目表结构导入的脚本中,就已经建好了。这个课程整体来看,可以分为2个部分:1.通过算法对用户打标签 2. 人群圈选。通过算法对用户打标签主要是在第6章 群体用户画像构建,通过算法进行挖掘,肯定要进行特征处理之类的,所以在第4章是介绍了特征工程的知识。对用户购物偏好的挖掘,又会涉及到标签权重。所以在第5章介绍了标签权重计算,标签存储的知识。可以说,第4章和第5章是第6章的一个知识铺垫。
好的老师,我大概了解了,就是说第6章之前的都是一些知识的铺垫,第6章打标签时会使用到之前的特征工程和权限的代码,完成项目功能一的部分,然后第7章人群管理完成项目功能二的部分。
登录后可查看更多问答,登录/注册
大数据主流技术,数据挖掘核心算法,用户画像完整知识轻松掌握
854 12
337 10
915 8
780 7
202 6