| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 数据结构与算法 -> Locally Differential Private Frequency Estimation with Consistency: LDP的主流后处理算法 -> 正文阅读 |
|
[数据结构与算法]Locally Differential Private Frequency Estimation with Consistency: LDP的主流后处理算法 |
Locally Differential Private Frequency Estimation with Consistency目录
论文链接.
1. INTRODUCTION国内外研究现状:
利用先验知识引入bias偏差在利用这些先验知识的时候,会给最终的估计结果引入bias 偏差
实验
2. PROBLEM SETTING略 3. FREQUENCY ORACLE PROYOCOLS使用pure protocol来表示FO协议 3.1 Generalized Random Response ——GRRf ~ ( v ) = I v / n ? q ? p ? ? q ? = I v / n ? 1 e ε + d ? 1 e ε ? 1 e ε + d ? 1 \widetilde{f}(v)=\frac{I_v/n-q^*}{p^*-q^*}=\frac{I_v/n-\frac{1}{e^{\varepsilon}+d-1}}{\frac{e^{\varepsilon}-1}{e^{\varepsilon}+d-1}} f ?(v)=p??q?Iv?/n?q??=eε+d?1eε?1?Iv?/n?eε+d?11?? 3.2 Optimized Local Hashing OLH
f ~ ( v ) = I v / n ? q ? p ? ? q ? = I v / n ? 1 g p ? ? 1 g \widetilde{f}(v)=\frac{I_v/n-q^*}{p^*-q^*}=\frac{I_v/n-\frac{1}{g}}{p^*-\frac{1}{g}} f ?(v)=p??q?Iv?/n?q??=p??g1?Iv?/n?g1?? 3.3 Accuracy参考论文 论文链接. 由于cv服从Binomial分布,通过中心极限定理得: f ~ v ≈ f v + N ( 0 , σ v ) \widetilde{f}_v \approx f_v+\mathcal{N}(0,\sigma_v) f ?v?≈fv?+N(0,σv?) 当d较大,而ε不是特别大得时候,可以通过忽略fv得到下式: 💜4. TOWARDS CONSISTENT FREQUENCY ORACLESBase不做 post-processing,没有偏差,方差可以通过理论计算 4.1 Baseline Methods4.1.1 Base-Pos在执行FO协议后,将所有负频率估计都转化为0
Lemma1 所有的值v 经过Base-Pos都引入了正偏差 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EuDle974-1636380936690)(C:/Users/CLOUDNESS/AppData/Roaming/Typora/typora-user-images/image-20211102195537086.png)] [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8UiZhqIT-1636380936691)(C:/Users/CLOUDNESS/AppData/Roaming/Typora/typora-user-images/image-20211102195545352.png)] p o s i t i v e ? b i a s = E [ f v ’ ] ? f v > 0 positive\ bias =E[f^{’}_v]-f_v>0 positive?bias=E[fv’?]?fv?>0 4.1.2 Post-Pos对于每个查询(query:这里可以是单个值的频率、频繁项的频率以及子集的频率)结果,如果是负值,则转化为0
4.1.3 Base-Cut在执行FO协议后,将所有小于敏感度阈值的频率估计都转化为0
阈值公式T = F ? 1 ( 1 ? α d ) σ T=F^{-1}(1-\frac{\alpha}{d})\sigma T=F?1(1?dα?)σ d:域大小 F-1(x):是标准正态分布的累计函数的反函数 σ:LDP机制的标准差 α:控制低频但频率估计高于阈值的项的数量, α参数的选择是在false positive和false negatives 之间进行的权衡 对于一个真实频率为0的值,其经过FO协议后的频率估计大于T的概率至多为 α/d 已知一个频率估计大于T,则这个值的真实频率为0的概率至多为 d × α / d = α d \times \alpha/d = \alpha d×α/d=α
方法评价
4.2 Normalization Method通过归一化方法,确保整个域的频率估计和为1 Lemma 2 通过归一化方法调整无偏估计,使得频率估计的和为1,那么整个域引入的偏差和也为0 4.2.1 Norm在执行FO协议后,给每个频率估计加上δ,以实现总和为1
Lemma 3 Norm 为每一个值提供无偏估计
Lemma 4 通过归一化方法调整无偏估计,使得频率估计的和为1的同时所有值非负,那么会对接近0的值引入正偏差 证明:对于一些足够接近0的值,其存在估计为正的可能性,也存在估计为负的可能性,但经过归一化方法后,只能为正,所以引入了一个 positive bias 引理4说明:任何同时满足下图两个约束的方法引入的偏差都不能全为0 4.2.2 Norm-Mul在执行FO协议后,将所有负频率估计都转化为0,再给每个频率估计乘以一个乘数因子γ,以实现总和为1 f v ‘ = m a x ( γ × f ~ v , 0 ) f^‘_v=max(\gamma \times \widetilde{f}_v,0) fv‘?=max(γ×f ?v?,0)
4.2.3 Norm-Sub在执行FO协议后,给所有频率加上δ,再将所有负值都转化为0,以实现总和为1 f v ‘ = m a x ( δ + f ~ v , 0 ) f^‘_v=max(\delta + \widetilde{f}_v,0) fv‘?=max(δ+f ?v?,0)
4.2.4 Norm-Cut在执行FO协议后,将所有的负值和较小的正值都转化为0,以实现总和为1
4.3 Constrained Least Squares**CLS:**在执行FO协议后,使用带有约束条件的最小二乘法来恢复估计值 通过KKT求得最优解过程如下
Norm-Sub 就是 CLS公式的解δ = ? 1 D 1 ( ∑ v ∈ D 1 f ~ v ? 1 ) \delta = -\frac{1}{D_1}(\sum_{v\in D_1}\widetilde{f}_v-1) δ=?D1?1?(v∈D1?∑?f ?v??1) 4.4 Maximum Likelihood Estimation将问题视为恢复真实的概率值 4.4.1 MLE-Apx在执行FO协议后,计算带有约束条件的MLE(最大似然函数)来恢复估计值 最大似然函数公式推导 同理使用KKT求解最优值 可将公式改写为
4.5 Least Expected Square Error首先假设数据遵循某种类型的分布(但参数未知),然后通过最小期望平方误差来拟合分布的参数、 4.5.1 Power参考论文 论文链接. 假设真实频率服从Power-Law分布,然后最小化期望的平方误差. 此方法需要已知数据的概率分布,或数据的知识来获得对应的概率分布
4.5.2 PowerNS由于Power方法独立对每个 f v ‘ f_v^‘ fv‘?进行校正,所以其无法满足约束2)sum=1,故我们对Power的结果使用Norm-Sub后处理方法 4.6 Summary5. EVALUATION对于全域查询full-domain query,Base-Cut表现最佳 对于子集查询set-value query,PowerNS表现最佳 对于频繁项查询high-frequency-value query,Norm表现最佳 5.1 Experimental Setup数据集两个数据集
度量方法使用MSE方法度量
5.2 Bias-variance EvaluationFigure 1针对Zipf数据集吗,蓝线为真实概率分布,绿线为不同的后处理后的概率估计 Figure 2
Figure 3方差
5.3 Full domain Evaluation具体见论文 5.4 Set-value Evaluation具体见论文 5.5 Frequent-value Evaluation具体见论文 5.6 Discussion
后处理准则
6. RELATED WORK7. CONCLUSION |
|
|
上一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/9 1:53:54- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |