IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 视觉与图形学领域的封神论文-基于强化学习的神经架构搜索 -> 正文阅读

[人工智能]视觉与图形学领域的封神论文-基于强化学习的神经架构搜索

图片

通过一个controller在搜索空间(search space)中得到一个网络结构(child network),然后用这个网络结构在数据集上训练得到准确率,再将这个准确率回传给controller,controller继续优化得到另一个网络结构,如此反复进行直到得到最佳的结果。这里使用RNN网络目的是在一个variable-length space中搜索模型,而原先其他超参数优化只能在一个fixed-length space中搜索模型。

摘要

神经网络是一种功能强大且灵活的模型,适用于图像、语音和自然语言理解中的许多困难学习任务。尽管取得了成功,神经网络仍然很难设计。在本文中,我们使用一个递归网络来生成神经网络的模型描述,并使用强化学习来训练该RNN,以最大限度地提高在验证集上生成结构的预期精度。在CIFAR-10数据集上,我们的方法从零开始,可以设计一种新的网络体系结构,在测试集精度方面可以与人类发明的最佳体系结构相媲美。我们的CIFAR-10模型实现了3.65的测试错误率,比以前使用类似架构方案的最先进模型高0.09%,快1.05倍。在Penn Treebank数据集上,我们的模型可以组成一个新的循环单元,其性能优于广泛使用的LSTM单元和其他最先进的算法。我们的单元在Penn Treebank数据集上的测试复杂度为62.4,比之前最先进的模型好3.6复杂度。该单元还可以转移到PTB上的字符语言建模任务中,并实现1.214的最新复杂度。

图片

控制器递归神经网络如何对简单卷积网络进行采样。它预测一层和重复层的滤波器高度、滤波器宽度、步幅高度、步幅宽度和滤波器数量。每个预测都由softmax分类器执行,然后作为输入输入输入到下一时间步。

神经结构搜索的分布式训练。我们使用一组S参数服务器来存储参数并将参数发送到K控制器副本。然后,每个控制器副本对m个体系结构进行采样,并并行运行多个子模型。记录每个子模型的精度以计算关于θ的梯度,然后将其发送回参数服务器。由此可见,2017年发表的这篇文章,需要较高的硬件资源

图片

控制器使用定位点,并设置“选择注意”以形成跳过连接。引入跳连接后,也带来了一些问题,具体可看论文。

图片

由具有两个叶节和一个内部节点的树构造的递归单元示例。左:定义控制器要预测的计算步骤的树。中心:控制器对树中每个计算步骤所做的预测的示例集。右:根据控制器的示例预测构建的递归单元的计算图。

实验结果:CIFAR-10上神经结构搜索和其他最先进模型的性能

图片

微信公众号:

图片

下载对应的论文,在公众号中回复:paper

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-24 10:34:02  更:2021-09-24 10:34:13 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 12:44:20-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码