[人工智能] 直播推荐、搜索中的召回、相关性、多目标精排、特征、重排 - 多目标精排(3)

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

[人工智能]直播推荐、搜索中的召回、相关性、多目标精排、特征、重排 - 多目标精排(3) - loss权重的4种方案

一、多目标学习在推荐系统的应用(MMOE/ESMM/PLE) - 知乎

这篇文章中主要针对回归任务、分类任务两种目标来对不同任务设置不同的参数。博主主要记录下里面的公式推导部分和这样做的原因

(1)

这里为什么可以取高斯分布也就是正态分布，因为高斯分布呈钟形曲线，和回归任务一样，大多数样本的取值也都是集中在一个值上，然后再向两边越来越少。这里的fw(x)从文章中是多目标网络中ysl这一个网络的预测值，正常情况下定义一个高斯分布，很少有把均值定义成变量的，但是这里这个回归任务服从的高斯分布的均值就是个变量fw(x)

(2)

分类任务定义softmax也是正常做法，除了这种定义外，还有sigmoid，但是这里还是softmax对公式推导方便些

(3) 如何求loss，我们这里先参考下分类任务中常见的交叉熵求loss的公式?

简单的交叉熵损失函数，你真的懂了吗？ - 知乎

我们如果要求两个目标任务的loss，自然也是对两个两个概率取log，也就是对数似然函数?

上面公式的具体推导，主要是涉及到logMN = logM + logN，log(M/N)=logM-logN这样一些简单的函数运算，博主将这些推导详细的解释了下

再后面将两个任务的loss相加

?博主觉得第2行有点多余，自己修改了一点

第4 5两行，文章中已经给了很详细的推导

文章中最后化简的loss推导部分

(4) 使用的时候看看方法。可以看到前面那么一大段推导，并且将s1 s2定义logx^2，但是使用的时候就是简单定义两个变量

首先是给分类任务2倍的e^(-ctr_log_var)权重，而ysl任务只有e^(-ysl_log_var)权重，给ctr的权重会大一点，而且最终还把两个权重也加进来作为loss的一部分

二、gradNorm，应该不是像上面这样只针对回归任务、分类任务设计的，多目标的时候多个分类任务、多个回归任务、回归分类混杂，都可以使用这种方法，因为是把“模型参数梯度”当做loss_weight的优化方向

具体参考博主写的这篇文章：多任务学习中的梯度归一，GradNorm_learner_ctr的博客-CSDN博客

代码：找到一个写的很好的源码

https://github.com/brianlan/pytorch-grad-norm

gradnorm源码-pytorch实现-机器学习文档类资源-CSDN下载

三、

阅读世界，共赴山海

423全民读书节，邀你共读

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-04-24 09:26:47 更:2022-04-24 09:30:05

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/28 20:35:38-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码