| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【高斯和拉普拉斯为什么分别对应L2和L1?】差分隐私系统学习记录(五) -> 正文阅读 |
|
[人工智能]【高斯和拉普拉斯为什么分别对应L2和L1?】差分隐私系统学习记录(五) |
The Algorithmic Foundations of Differential Privacy (五)写在前面的话有一段时间没更新这个系列了,今天组会完晚上休息一下,再看看这本书。纯属个人笔记,如有问题请看原文或者留下评论。 Laplace versus Gauss什么是先验分布?后验分布?似然估计?x: 观察得到的数据(结果) y : 决定数据分布的参数(原因) 先验分布(因):Pr(y) 后验分布(先果后因:贝叶斯公式):Pr(y|x) 似然估计(先因后果):Pr(x|y) 举个例子:我有一个图像分类模型,有很多数据,每个数据有自己的特征。同时我设定了一些类别。这个时候我拿一个数据问你,这个数据属于哪一类? Pr(类别|特征)=Pr(类别)×{Pr(特征|类别)/Pr(特征)} Pr(类别|特征)表示后验,在该特征下属于这个类别的概率。 Pr(类别)表示先验,样本中该类别的概率。 Pr(特征|类别)表示似然,该类别下,是该特征的概率。 Pr(特征|类别)/Pr(特征)越大则偏向这个类别,越小则不是这个类别。 Pr(特征)表示全概率公式计算。 Ps.先验是非常重要的,特别对于机器学习来说,先验就是优化的开始, 可以在较小的数据集中有良好的泛化性能,从信息论的角度看,向系统加入了正确先验这个信息会提高系统的性能。 为什么拉普拉斯对应L1,高斯对应L2原因是L1和L2正则先验分别是服从拉普拉斯分布和高斯分布的。至于先验分布是什么前面有解释。即先验分布是拉普拉斯分布时,正则化项为L1范数;当先验分布是高斯分布时,正则化项为L2范数。关于这两者的深入理解可以看看这篇博客。 回到书上
这两种机制在组合下产生相同的累积损失,因此即使对于每个单独合成来说,隐私保证较弱,但在许多计算中的累积影响是可比较的。此外,如果 δ 足够小(例如,亚多项式),在实践中,我们将永远不会遇到差分隐私保证的不足之处。 也就是说,相对于拉普拉斯噪声,高斯噪声在理论上是有缺点的。考虑 Report Noisy Max(带有拉普拉斯噪声)算法下,每个候选输出在数据库 x 上的效用得分与其在相邻数据集 y 上的效用分数相同。该机制产生 (ε,0)-差分隐私,与候选输出的数量无关。如果我们使用高斯噪声并报告最大值,并且如果候选值的数量比 1/δ 大,那么我们将精确地选择发生概率小于 δ 的具有大高斯噪声的事件。当我们远离高斯分布的尾时,我们不再能保证在 x,y 数据库的观测概率的差别在e±ε因子内。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 4:00:29- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |