| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> [声纹识别]语音识别的发展史 -> 正文阅读 |
|
[人工智能][声纹识别]语音识别的发展史 |
? ? ? ? 语音识别研究经历了知识积累、模板匹配、模式识别、统计模型、机器学习和深度学习等五个发展阶段[1]。 ? ? ? 1.知识积累阶段,20世纪30-50年代,针对特定语音或小词表的孤立词,设计专门的语音识别算法或装置。? ? ? ? 2.模板匹配阶段,50-60年代,基于声学和语音学知识设计语音识别系统,主要使用模板匹配方法识别音位、音素和数字。 ? ? ? 3.模式识别阶段,60-80年代,使用模式识别方法进行中小规模的孤立词或连续词串语音识别。 ? ? ? 4.统计模型阶段,1980-2000年,隐马尔可夫模型用以处理语音中的动态问题,并用于连续语音识别系统设计,基于统计模型的方法慢慢确立成为语音识别主流框架。 ? ? ? 5.机器学习和深度学习阶段,2000-2010年,机器学习的发展,特别是2011年至今深度学习的崛起,大大促进了大规模连续语音识别系统的性能提升和实用化。 ? ? ? 1879年,爱迪生发明第一台听写机;? ? ? ? 1952年Bell实验室发布能识别0-9数字精度达到90%; ? ? ? 1962年IBM Shoebox“鞋盒”能理解16个口语单词; ? ? ? 1971年,Harpy能理解1011个单词和一些短语; ? ? ? 1986年,IBM使用HMM模型可以预测下一个音素; ? ? ? 2008年,Google发布语音识别APP把语音识别代入移动设备; ? ? ? 2011年Apple发布语音助手Siri。 ? ? ? ?下图展示的是Swichboard语音识别国际会议上,使用电话语音库,训练和测试语音识别系统性能的发布会,2017年语音识别错误率达5.1%,已超过人类。 ? ? ? ? ? 在研究者眼中的语音识别是通过三个步骤完成: ? ? ? ? ?1.录入语音信号; ? ? ? ? ?2.搜素训练数据集包含(声音模型、词库、语言模型); ? ? ? ? ?3.解码输出文本。也就是说音频->提取为声学特征->转成音素(这部分为声学模型)->组成字/词->按时序组成句子(这部分为语言模型)。 ? ?参考文献:? [1] 王东. 语音识别技术的现状与未来. 2017年 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 10:25:46- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |