| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 数据结构与算法 -> DP敏感度(全局,局部,平滑) -> 正文阅读 |
|
[数据结构与算法]DP敏感度(全局,局部,平滑) |
L2灵敏度明显低于L1灵敏度。 1.全局敏感度:独立于所查询的实际数据集(适用于相邻的任何选择) 添加行或删除行会导致相邻数据集距离为1,修改行会导致数据集距离为2. 2.局部敏感度:全局敏感度考虑的是任意的数据集,这似乎是悲观的,因为我们将在实际的数据集上运行我们的差分隐私机制,我们难道不应该考虑该数据集的邻居吗?将两个数据集中的一个固定为正在查询的实际数据集,并考虑其所有邻居。 ???????将其中一个数据集固定为被查询的数据集(给定的一个数据集)。当全局灵敏度较大时,必须向输出中添加大量的噪声,以实现差分隐私,这可能会严重损害数据效用.所以提出LSD。 ?例如,考虑一个数据库,其中的值在0和M>0之间,以及两个相邻的数据库D(0、0、0、0、0、M、M)和D0(0、0、0、0、M、M、M)。设f为中值函数。然后,f(D)=0和f(D0)=0,以及相应的局部灵敏度为LSf(D)=0和LSf(D0)=M(定义)。相应地,如果噪声分别根据0和M进行校准,以计算A(D)和A(D0),那么它们很容易被对手区分。如果采用局部灵敏度,算法A不满足(?,δ)DP的。为了弥合差距,提出了一个局部灵敏度的光滑上界来确定所添加的噪声的大小。 平滑上界考虑的是改变多条记录的最大敏感度,再乘以一个平滑上界函数,这个函数的目的在于做一个惩罚,这个函数一定小于1。 ? ? 注意:K代表最多K个条目被修改时的敏感度变化,下图例子K=9,最对9个例子被修改 网上例子: 4.Clip裁剪:这种对距离的特殊定义导致了通常所说的无界差分隐私。 对于将数据集映射到实数的函数,我们可以执行类似的分析。我们将考虑表示常见聚合数据库查询的函数:计数、总和平均值。 具有无限敏感度的查询无法使用拉普拉斯机制使用差分隐私回答,所以提出来一个裁剪clipping,基本思想就是对属性值强制实施上限和下限。 ?可以从直方图看出来,上限是90岁,但是这不满足DP,因为边界本身可能会揭示有关数据的某些信息。通常,剪切边界是通过使用数据集的属性来决定的,该属性无需查看数据即可知道(例如,数据集包含的年龄可能介于 0 和 125 之间),或者通过执行差分隐私查询来评估剪切边界的不同选择。 差分隐私查询:通过将下限设置为0,然后不断向上增加上限,直到查询的输出停止更改。尝试计算0到100的clip边界年龄总和,添加噪声。在upper=80时候变化不大,随意上限可以选择80. 这种方法允许我们使用少量查询测试大量可能的边界,但代价是确定完美边界的精度较低。 随着上限变得非常大,噪声将开始淹没信号。 请注意,对于最大的裁剪参数,总和会剧烈波动!关键是要寻找图形中相对平滑(意味着低噪声)且不增加(意味着裁剪边界足够)的区域。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 11:48:39- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |