IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 2021-08-29 学习成果 -> 正文阅读

[人工智能]2021-08-29 学习成果

一. 吴恩达深度学习第五课序列模型第一周

1.1 为什么选择序列模型

语音识别:给出一段语音,要求输出对应的文本。

在这里插入图片描述

语音识别,音乐生成,情感分类,DNA序列分析,机器翻译,视频行为识别,名字实体识别。

1.2 数学符号

1.3 循环神经网络

在这里插入图片描述

标准神经网络存在的问题:

输入和输出在不同的样本中有不同的长度;通过文本的不同位置不能够共享学习到的特征。

在这里插入图片描述

单向循环神经网络只能记录上文信息,而不能利用下文信息,为了解决这个问题,可以采取双向循环神经网络。

在这里插入图片描述

在这里插入图片描述

1.4 通过时间的反向传播

在这里插入图片描述

穿越时间的反向传播,图上做的是名字实体识别任务,判断一个单词是否是名字,则每个对应的 y ^ < i > \hat{y}^{<i>} y^?<i>是一个概率值。

1.5 不同类型的循环神经网络

情感分类,多对一结构的RNN:

在这里插入图片描述

音乐生成,一对多结构的RNN:

在这里插入图片描述

机器翻译,不同长度多对多结构的RNN:

在这里插入图片描述

汇总:

在这里插入图片描述

1.6 语言模型和序列生成

语言模型是RNN的应用之一,就是用来训练语料库,生成新序列。

在这里插入图片描述

此处的第一个输入为零向量,使输出逼近cat使,之后的每一个输入都是前一个词向量,注意不是指 y ^ \hat{y} y^?,而是真实值y。

1.7 新序列采样

采样的意思就是利用已经训练好的模型来生成序列。

基于字符的语言模型训练成本较高,且不如基于词汇的语言模型可以捕捉长范围的关系。

在这里插入图片描述

1.8 带有神经网络的梯度消失

普通的RNN不擅长捕获长距离依赖关系。反向传播时最后神经元的梯度的影响很难传到最前面几个神经元。

在这里插入图片描述

梯度爆炸可以很明显被发现,使用梯度修剪可以解决。

1.9 GRU单元

在这里插入图片描述

画红线的加号左边表示加入多少新的候选值,右边表示保留多少上个记忆细胞的值。因为变量经过sigmoid函数操作后输出的函数值十分接近零或者一,所以sigmoid函数就可以控制保留还是剔除。加入这个记忆门gamma很好地解决了梯度消失的问题,因为gamma如果一直接近零时,记忆细胞的值可以长距离传输。

在这里插入图片描述

GRU的另一种变形,Full GRU,加入gamma_r用来控制上一层记忆细胞的值有多少传输给这一层记忆细胞候选值。

1.10 长短期记忆网络(LSTM)

在这里插入图片描述

GRU的模型结构更简单,更适合去组建复杂的网络。LSTM更加灵活和强大。

在这里插入图片描述

1.11双向神经网络

在这里插入图片描述

双向传播,注意不是那个正宗的反向传播。a1 - a2- a3-a4-a3-a2-a1。

疑问:这个传播的参数,都是用的相同的吗?上面的式子为啥不加输入变量x?

1.12 深层循环神经网络

在这里插入图片描述

二. CCF CSP201903

  1. 小中大
#include <iostream>
#include <set>
#include <utility>
#include <algorithm>
# include <algorithm>

using namespace std;

const int MAX = 100010;
int n;
int x,y;
int amount[10];
int max_v,min_v,mid_v;
int a[MAX];
int flag = 0;
int main(){
    scanf("%d",&n);
    for(int i = 1; i<=n;i++) scanf("%d",&a[i]);
    if(a[n] > a[1]){
        max_v = a[n];
        min_v = a[1];
    }else{
        max_v = a[1];
        min_v = a[n];
    }
    if(n%2!=0){
        mid_v = a[n/2 + 1];
    }else{
        if((a[n/2] +a[n/2 +1])%2 ==0){
            mid_v = (a[n/2] +a[n/2 +1])/2;
        }else{
            flag = 1;
            mid_v = (a[n/2] +a[n/2 +1])/2;
        }
    }
    if(!flag){
        printf("%d %d %d",max_v,mid_v,min_v);
    }else{
        printf("%d %d.5 %d",max_v,mid_v,min_v);
    }
    return 0;
}
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-30 12:03:49  更:2021-08-30 12:05:42 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年3日历 -2024/3/28 21:07:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码