IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 开发工具 -> Word2vec -> 正文阅读

[开发工具]Word2vec

Word2vec是一个学习单词向量的框架

IDEA:

  • 我们有大量的文本 (corpus means ‘body’ in Latin. 复数为corpora)
    固定词汇表中的每个单词都由一个向量表示
  • 文本中的每个位置 t,其中有一个中心词 c 和上下文(“外部”)单词 o
  • 使用 c和 o的词向量的相似性来计算给定 c的 o的概率
  • 不断调整词向量来最大化这个概率

在这里插入图片描述

目标函数
L ( θ ) = ∏ t = 1 T ∏ ? m ≤ j ≤ m j ≠ 0 P ( w t + j ∣ w t ; θ ) L(\theta)=\prod_{t=1}^{T} \prod_{-m \leq j \leq m \atop j \neq 0} P\left(w_{t+j} \mid w_{t} ; \theta\right) L(θ)=t=1T?j?=0?mjm??P(wt+j?wt?;θ)

损失函数
J ( θ ) = ? 1 T log ? L ( θ ) = ? 1 T ∑ t = 1 T ∑ m ≤ j ≤ m j ≠ 0 log ? P ( w t + j ∣ w t ; θ ) J ( θ ) = ? 1 T log ? L ( θ ) = ? 1 T ∑ t = 1 T ∑ m ≤ j ≤ m j ≠ 0 log ? P ( w t + j ∣ w t ; θ ) J(\theta)=-\frac{1}{T} \log L(\theta)=-\frac{1}{T} \sum_{t=1}^{T} \sum_{m \leq j \leq m \atop j \neq 0} \log P\left(w_{t+j} \mid w_{t} ; \theta\right)J(\theta)=-\frac{1}{T} \log L(\theta)=-\frac{1}{T} \sum_{t=1}^{T} \sum_{m \leq j \leq m \atop j \neq 0} \log P\left(w_{t+j} \mid w_{t} ; \theta\right) J(θ)=?T1?logL(θ)=?T1?t=1T?j?=0mjm??logP(wt+j?wt?;θ)J(θ)=?T1?logL(θ)=?T1?t=1T?j?=0mjm??logP(wt+j?wt?;θ)

  • L为目标函数,具体含义就是,遍历该语句,语句长度为T,意味着中心词的移动;
  • 因为每次中心词时都要求该中心上下m个背景词和中心词的概率,所以背景词是t+j,j在-m到m之间,且不等于0;
  • θ是超参数矩阵;
  • 我们希望目标函数的值最大化,但是往往最大化不容易求解,而最小值更容易求解,所以将上述L转化为J,J为损失函数,也就是L的等价变化的负值。

Predict Function
P ( w t + j ∣ w t ; θ ) P\left(w_{t+j} \mid w_{t} ; \theta\right) P(wt+j?wt?;θ)如何计算?
每个单词都由两个向量表示:

  • v w v_{w} vw? 当 w 是中心词时
  • u w u_{w} uw? 当 w 是上下文词时

P ( o ∣ c ) = exp ? ( u o T v c ) ∑ w ∈ V exp ? ( u w T v c ) P(o \mid c)=\frac{\exp \left(u_{o}^{T} v_{c}\right)}{\sum_{w \in V} \exp \left(u_{w}^{T} v_{c}\right)} P(oc)=wV?exp(uwT?vc?)exp(uoT?vc?)?

使用梯度下降来更新参数
? ? v c log ? P ( o ∣ c ) = ? ? v c log ? exp ? ( u o T v c ) ∑ w ∈ V exp ? ( u w T v c ) = ? ? v c ( log ? exp ? ( u o T v c ) ? log ? ∑ w ∈ V exp ? ( u w T v c ) ) = ? ? v c ( u o T v c ? log ? ∑ w ∈ V exp ? ( u w T v c ) ) = u o ? ∑ w ∈ V exp ? ( u w T v c ) u w ∑ w ∈ V exp ? ( u w T v c ) = u 0 ? ∑ x ∈ V p ( x ∣ x ) u x \begin{aligned} \frac{\partial}{\partial v_{c}} \log P(o \mid c) &=\frac{\partial}{\partial v_{c}} \log \frac{\exp \left(u_{o}^{T} v_{c}\right)}{\sum_{w \in V} \exp \left(u_{w}^{T} v_{c}\right)} \\ &=\frac{\partial}{\partial v_{c}}\left(\log \exp \left(u_{o}^{T} v_{c}\right)-\log \sum_{w \in V} \exp \left(u_{w}^{T} v_{c}\right)\right) \\ &=\frac{\partial}{\partial v_{c}}\left(u_{o}^{T} v_{c}-\log \sum_{w \in V} \exp \left(u_{w}^{T} v_{c}\right)\right) \\ &=u_{o}-\frac{\sum_{w \in V} \exp \left(u_{w}^{T} v_{c}\right) u_{w}}{\sum_{w \in V} \exp \left(u_{w}^{T} v_{c}\right)}\\&=u_{0}-{\sum_{x\in V}p(x \mid x)u_{x}} \end{aligned} ?vc???logP(oc)?=?vc???logwV?exp(uwT?vc?)exp(uoT?vc?)?=?vc???(logexp(uoT?vc?)?logwV?exp(uwT?vc?))=?vc???(uoT?vc??logwV?exp(uwT?vc?))=uo??wV?exp(uwT?vc?)wV?exp(uwT?vc?)uw??=u0??xV?p(xx)ux??

  开发工具 最新文章
Postman接口测试之Mock快速入门
ASCII码空格替换查表_最全ASCII码对照表0-2
如何使用 ssh 建立 socks 代理
Typora配合PicGo阿里云图床配置
SoapUI、Jmeter、Postman三种接口测试工具的
github用相对路径显示图片_GitHub 中 readm
Windows编译g2o及其g2o viewer
解决jupyter notebook无法连接/ jupyter连接
Git恢复到之前版本
VScode常用快捷键
上一篇文章      下一篇文章      查看所有文章
加:2021-09-01 12:08:05  更:2021-09-01 12:10:00 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/22 23:31:33-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计