| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 标签预测思路分析 -> 正文阅读 |
|
[人工智能]标签预测思路分析 |
标签预测模型思路: 1. 问题描述通过老用户的静态特征(手机品牌、性别、地域、安装的APP列表),以及用户的兴趣标签tag分数,构造模型预测新用户的兴趣标签tag。 2. 特征说明及预处理1. 手机品牌组 原始手机品牌非常杂乱,包括各大厂商的子品牌,共计6W个。 取京东上有售的118个手机品牌,从0-118进行编号,其中0为缺省值。 这部分作为一个特征。 2. 地域组 一共237个地区(包括国外地区),由于国外地区人数分布比较多,将其保留,并从0-237进行编号,其中0为缺省值。 这部分作为一个特征。 3. 性别组 包括男性、女性、未知,从0-2进行编号,其中0为缺省值。 这部分作为一个特征。 4. applist组 这部分为128个特征。 3. 样本选择取一个月活跃度最高的100万用户样本(用户文章曝光数>1000,点击率>0.1)。 模型输入:4组共计131维特征,DT算法对特征是数值型还是类别型不敏感。 模型输出:用户画像中兴趣标签的分数。其中,输出的标签是通过选取最近1个月点击率前5000的tag(选取的tag最小点击为0.183)。 最终输出:预测用户在这5000个tag中最喜欢的分数最高的50个tag,作为用户tag画像。 4. 模型分析多标签回归问题,也可作为多标签分类问题处理,但缺点是样本的输 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 20:43:14- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |