| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 词嵌入除偏(Debiasing Word Embeddings) -> 正文阅读 |
|
[人工智能]词嵌入除偏(Debiasing Word Embeddings) |
来源:Coursera吴恩达深度学习课程 现在机器学习和人工智能算法正渐渐地被信任用以辅助或是制定极其重要的决策,因此我们想尽可能地确保它们不受非预期形式偏见影响(they’re free of undesirable forms of bias),比如说性别歧视(gender bias)、种族歧视(ethnicity bias)等。本文章将展示词嵌入中一些有关减少或是消除这些形式的偏见的办法。 本文章中使用术语bias时,不是指bias本身这个词或是偏见,而是指性别、种族、性取向方面的偏见,那是不同的偏见,同时这也通常用于机器学习的学术讨论中。不过我们讨论的大部分内容是词嵌入是怎样学习类比像Man:Woman,就像King:Queen,另外,如果Man对应Computer Programmer,那么Woman会对应什么呢?所以这篇论文Man is to Computer Programmer as Woman is to Homemaker??Debiasing Word Embeddings发现了一个十分可怕的结果,一个已经完成学习的词嵌入可能会输出Man:Computer Programmer,同时输出Woman:Homemaker,那个结果看起来是错的,并且它执行了一个十分不良的性别歧视。如果算法输出的是Man:Computer Programmer,同时Woman:Computer Programmer这样子会更合理。同时他们也发现如果Father:Doctor,那么Mother应该对应什么呢?一个十分不幸的结果是,有些完成学习的词嵌入会输出Mother:Nurse。 因此根据训练模型所使用的文本,词嵌入能够反映出性别、种族、年龄、性取向等其他方面的偏见,Andrew尤其热衷的一件事是,这些偏见都和社会经济状态相关,每个人不论你出身富裕还是贫穷,亦或是二者之间,每个人都应当拥有好的机会,同时因为机器学习算法正用来制定十分重要的决策(make very important decisions),它也影响着世间万物,从大学录取到人们找工作的途径,到贷款申请,再到刑事司法系统,甚至是判决标准,学习算法都在作出非常重要的决策,所以Andrew认为我们尽量修改学习算法来尽可能减少或是理想化消除这些非预期类型的偏见是十分重要的。 至于词嵌入,它们能够轻易学会用来训练模型的文本中的偏见内容,所以算法获取到的偏见内容就可以反映出人们写作中的偏见。在漫长的世纪里,Andrew认为人类已经在减少这些类型的偏见上取得了进展,幸运的是对于人工智能来说,实际上Andrew认为有更好的办法来实现更快地减少AI领域中相比与人类社会中的偏见。虽然Andrew认为我们仍未实现人工智能,仍然有许多研究许多难题需要完成来减少学习算法中这些类型的偏见。 接下来看一个例子(example)。 假设说我们已经完成一个词嵌入的学习,那么babysitter,doctor,grandmother,grandfather分布在左上方的坐标系中,也许girl嵌入在这里,boy嵌入在这里,也许she嵌在这里,he在这里,所以首先我们要做的事就是辨别出我们想要减少或想要消除的特定偏见的趋势。 为了便于说明,Andrew会集中讨论性别歧视,分析思路对上述其他类型的偏见都是通用的。这个例子中,怎样辨别出与这个偏见相似的趋势呢?主要有以下三个步骤: (1)对于性别歧视这种情况来说,我们能做的是e_he - e_she,因为它们的性别不同,然后将e_male - e_female,然后将这些差简单地求平均。这个趋势看起来就是性别趋势或说是偏见趋势,然后这个趋势与我们想要尝试处理的特定偏见并不相关,因此这就是个无偏见趋势。在这种情况下,偏见趋势可以将它看做1D子空间,所以这个无偏见趋势就会是299D的子空间。原文章中的描述这个偏见趋势可以比1维更高,实际上它会用一个更加复杂的算法叫做SVU(singular value decomposition奇异值分解),这个算法的一些方法和主成分分析 (Principle Component Analysis-PCA)其实很类似。 (2)中和步骤(neutralize),对于那些定义不确切的词可以将其处理一下,避免偏见。有些词本质上就和性别有关,像grandmother、grandfather、girl、boy、she、he,不过也有一些词像doctor和babysitter我们希望在性别方面是中立的,即种族中立的(ethnicity neutral)或是性取向中立的(sexual orientation neutral)。对于那些定义不明确的词,它的基本意思是不像grandmother和grandfather这种定义里有着十分合理的性别含义的,因为从定义上来说grandmothers是女性,grandfather是男性。所以对于像doctor和babysitter这种单词我们就可以将它们在这个轴上进行处理,来减少或是消除他们的性别歧视趋势的成分,即减少他们在这个水平方向上的距离,这就是第二个中和步。 (3)均衡步(equalization),对于这样的词对,grandmother和grandfather或者是girl和boy,我们只希望其区别是性别。那为什么要那样呢?在这个例子中,babysitter和grandmother之间的距离(相似度)实际上是小于babysitter和grandfather之间的,因此这可能会加重不良状态,或者可能是非预期的偏见,也就是说grandmothers相比于grandfathers最终更有可能输出babysitting。所以在最后的均衡步中,我们想要确保的是像grandmother和grandfather这样的词都能够有一致的相似度(相等的距离),和babysitter或是doctor这样性别中立的词一样。这其中会有一些线性代数的步骤,但它主要做的就是将grandmother和grandfather移至与中间轴线等距的一对点上,现在性别歧视的影响也就是这两个词与babysitter的距离就完全相同了。所以总体来说,会有许多对象grandmother-grandfather,boy-girl,sorority-fraternity,girlhood-boyhood,sister-brother,niece-nephew,daughter-son这样的词对,你可能想要通过均衡步来解决他们。 最后一个细节是我们怎样才能够决定哪个词是中立的呢?对于这个例子来说doctor看起来像是一个应该对其中立的单词来使之性别不确定(non-gender-specific)或是种族不确定(non-ethnicity-specific)。相反地,grandmother和grandfather就不应是性别不确定的词。也会有一些像是beard词,一个统计学上的事实是男性相比于比女性更有可能拥有胡子,因此也许beard应该比female更靠近male一些。 因此论文作者做的就是训练一个分类器来尝试解决哪些词是有明确定义的,哪些词是性别确定的,哪些词不是。结果表明英语里大部分词在性别方面上是没有明确定义的,意思就是说性别并是其定义的一部分,只有一小部分词像是grandmother-grandfather,girl-boy,sorority-fraternity等等,不是性别中立的。因此一个线性分类器能够告诉你哪些词能够通过中和步来预测这个偏见趋势,或将其与这个本质是299D的子空间进行处理。 最后,我们需要平衡的词对的数实际上是很小的,至少对于性别歧视这个例子来说,用手都能够数出来你需要平衡的大部分词对。完整的算法会比这里展示的更复杂一些,可以看一下这篇论文了解详细内容。 总结一下,减少或者是消除学习算法中的偏见问题是个十分重要的问题,因为这些算法会用来辅助制定越来越多的社会中的重要决策,在本节视频中分享了一套如何尝试处理偏见问题的办法,不过这仍是一个许多学者正在进行(ongoing)主要研究的领域。 说明:记录学习笔记,如果错误欢迎指正!转载请联系我。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 9:42:58- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |