采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
有两个问题: 1、mysql数据库tags表,tag_rule、tag_level、tag_level_second怎么理解? 2、复合标签如何存储?
同学你好,tag_rule是标签值需要满足的条件,例如,标签值是"品牌忠诚客户",它对应的tag_rule也就是需要满足"月购买某个品牌的次数大于5次",spark在打标签的时候就会判断用户是否满足这个tag_rule,若满足就会给这个用户打上"品牌忠诚客户"这个标签。tag_level、tag_level_second就是标签的层级,例如用户属性这个标签可以划分为社会属性和偏好属性,tag_level、tag_level_second这两个字段是给前端用的,就像菜单的一级菜单和二级菜单。复合标签,就是在现有标签进行组合,例如,“美妆达人” = “购买口红次数” + "购买面膜次数",“美妆达人”就是复合标签,它是由“购买口红次数”和 "购买面膜次数"这两个标签计算出来,所以复合标签的存储和普通标签的存储是一样的,只是可以加多几个字段,来标注这是个复合标签,以及这个复合标签的组合公式。祝学习愉快!
有点懵逼,看tags表结构和样例数据,串不起来,比如: 1、tag_level、tag_level_second都是有值的,但是不知道属于哪个标签分类 2、针对复合标签,有多个简单标签和组合逻辑(AND / OR)组成,在该表的存储格式是什么样子呢?
是的,项目是没有把标签分类表,以及标签的规则表做做出来。标签规则,也就是tag_rule那里是简单化了,只是用个数字来映射,实际上应该是还要做个标签规则表来做映射
登录后可查看更多问答,登录/注册
大数据主流技术,数据挖掘核心算法,用户画像完整知识轻松掌握
884 12
362 10
933 8
803 7
227 6