| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 新兴产业概念扫盲3-AI人工智能-3深度学习 -> 正文阅读 |
|
[人工智能]新兴产业概念扫盲3-AI人工智能-3深度学习 |
3 深度学习3.1 概述数据的井喷和计算力的飙升,推动深度学习取得巨大进步。如果说深度学习是一台探矿机,大数据就是那座有待挖掘的金矿,计算能力的进展则为这台探矿机提供了源源不断的动力。深度学习实际上是基于具有多个隐藏层的神经网络的学习;深度学习的思想来源于人类处理视觉信息的方式。 一个最成功的例子就是AlphaGo-zero。?深蓝是专注于国际象棋的、以暴力穷举为基础的专用人工智能;2016年3月,AlphaGo横空出世,作为几乎没有特定领域知识的、基于机器学习的、更加通用的人工智能,击败李世石。后升级为Master。2017 年 10 月,其升级版 AlphaGo Zero 诞生。自学成才 AlphaGo Zero 完全抛弃了来自棋谱数据的人类经验,而是通过左右互搏(自己和自己对弈)迅速提升棋力.11月,DeepMind 又推出了 AlphaGo Zero 的升级版:AlphaZero。AlphaZero 一不需要人工特征,二不需要棋谱知识,三不需要特定优化,可就是这个“三无”算法实现了对围棋、国际象棋和日本将棋的通吃,横扫棋类游戏,充分展示深度学习的能力。 3.2? 技术介绍3.2.1深度前馈网络深度前馈网络利用深度架构实现工程上可实现的对任意函数的通用逼近;深度前馈网络使用梯度下降的方法进行学习;深度前馈网络的损失函数通常是交叉熵或最小均方误差;深度前馈网络的隐藏神经元通常使用整流线性单元作为传递函数。 3.2.2 正则化正则化就是一类通过显式设计降低泛化误差,以提升算法通用性的策略的统称。从概率论角度看,许多正则化技术对应的是在模型参数上施加一定的先验分布,其作用是改变泛化误差的结构。正则化是对欠拟合和过拟合的折中,在不过度增加偏差的情况下显著减少方差。正则化能够改变数据分布,让通过模型得到的数据分布尽可能和真实的数据生成过程相匹配。正则化(Regularization)作为抑制过拟合的手段,是机器学习和深度学习之中必不可少的环节,具有举足轻重的地位。 正则化策略就可以分为以下几类:
3.2.3?深度学习的优化? ? ? ? ? 由于深度神经网络中的隐藏层数目较多,出于效率和精确性的考虑,在深度学习的优化上需要使用专门的技术。要点: 深度学习中的优化需要解决病态矩阵、局部极小值和鞍点等问题; 深度学习优化中的降噪方法包括动态采样、梯度聚合和迭代平均; 深度学习优化中的二阶导数近似方法是对原始牛顿法的各种改进; 其他优化方法包括动量方法、加速下降方法和坐标下降方法。? 3.2.4自编码器
3.2.5 强化学习作为人工智能方法的强化学习则力图使计算机在没有明确指导的情况下实现自主学习,完成从数据到决策的转变。强化学习(reinforcement learning)实质上是智能系统从环境到行为的学习过程,智能体通过与环境的互动来改善自身的行为,改善准则是使某个累积奖励函数最大化。强化学习的特点在于由环境提供的强化信号只是对智能体所产生动作的好坏作一种评价,和监督学习中清晰明确的判定结果相比,环境的反馈只能提供很少的信息。描述强化学习最常用的模式是马尔可夫决策过程(Markov decision process)。 深度强化学习(deep reinforcement learning)是深度学习和强化学习的结合,它将深度学习的感知能力和强化学习的决策能力熔于一炉,用深度学习的运行机制达到强化学习的优化目标,从而向通用人工智能迈进。根据实施方式的不同,深度强化学习方法可以分成三类,分别是基于价值、基于策略和基于模型的深度强化学习。
3.3 深度学习+神经网络3.3.1深度信念网络是一种生成模型,能够建立输入和输出的联合概率分布; 受限玻尔兹曼机是构成深度信念网络的基本单元,是由可见层和隐藏层构成的神经网络; 受限玻尔兹曼机的训练方法是对比散度法,通过可见层和隐藏层的多轮交互实现; 深度神经网络的通用训练方式是无监督逐层预训练和有监督微调的结合。 3.3.2卷积神经网络人脸识别乃至图像识别中的一项关键技术,就是卷积神经网络。卷积神经网络(convolutional neural network)指的是至少在某一层中用卷积运算(convolution)来代替矩阵乘法的神经网络。卷积运算的特性决定了神经网络适用于处理具有网格状结构的数据。最典型的网格型数据就是数字图像,因而卷积神经网络自诞生以来,便广泛地应用于图像与文本识别之中,并逐渐扩展到自然语音处理等其他领域。
3.3.3?循环神经网络在深度学习中,RNN这个缩写有两层含义,它既可以表示循环神经网络(Recurrent Neural Network),也可以表示递归神经网络(Recursive Neural Network)。两个 RNN 之间的关系还很密切:循环神经网络可以看成是递归神经网络的特例,递归神经网络则可以视为循环神经网络的推广。卷积神经网络,它具有空间上的参数共享的特性,也就是同样的核函数可以应用在图像的不同区域之上。如果把参数共享调整到时间的维度上,让神经网络使用相同的权重系数来处理具有先后顺序的数据,得到的就是循环神经网络。 前馈网络适用于表示客观性的知识,相对客观稳定的。循环网络则适用于表示主观性的知识,相对上下文情景关联的。很多主观性知识正隐藏在数据的顺序之中,输入序列的内部信息存储在循环神经网络的隐藏层中,并随着时间的推移在隐藏层中流转。 3.3.4生成式对抗网络
3.3.5长短期记忆网络长短期记忆网络(long short-term memory)的作用就是实现长期记忆,更准确地说,是实现任意长度的记忆。 长短期记忆网络是由相应的基本单元构成的。长短期记忆的基本单元的作用在需要时取出并聚焦记忆,通常包括四个功能不同的隐藏层:记忆模块(memory cell)、输入门(input gate)、输出门(output gate)和遗忘门(forget gate),这比只有一个激活函数的一般循环神经网络要复杂得多。记忆模块的作用时存储数值或是状态,存储的时限既可以是长期也可以是短期。另外的“三重门”则用于控制信息的有选择通过,三者都使用对数几率函数作为传递函数。长短期记忆网络根据当前的输入、当前的记忆和前一时刻的输出确定当前的输出;长短期记忆网络能够解决梯度弥散的问题。目前,长短期记忆网络最著名的应用恐怕非谷歌翻译莫属。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 0:32:55- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |