当前行业提供的大部分人工智能数据都以朗读式训练数据为主,然而人与机器之间的交互不应该只是一问一答的简单对话或者命令控制,而是要理解语言的上下文,识别人的情感需求并做出相应的反馈”。
随着技术突破带来的用户体验的提升,对话式语音交互成为AI巨头发力的重点,谷歌、亚马逊、阿里、腾讯、百度、小米等纷纷推出了支持多轮连续对话的智能音箱、智能助理、智慧客服、智能机器人等产品。AI系统连续对话能力将引发金融、教育、科技互联网、交通出行、移动通信、科技制造等行业的交互变革。
作为全球领先的人工智能数据服务服务商,数据堂已采集包含普通话、方言、外语等三大类,数十种语言的自然对话语音数据集系列,覆盖了各种发音特点、口音轻重,并完成对数据集的音标、重音标注、韵律标注,可以加强语音识别、声纹识别的研究交流。
普通话自然对话语音数据集
普通话自然对话语音数据集
近2000名发音人参与录制,录制时长约为1500小时,以自然方式进行面对面交流,针对给定的数个话题自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达97%,可应用于语音识别,声纹识别等任务
方言自然对话语音数据集
四川方言自然对话语音数据集
近2000名四川本地发音人参与录制,录制时长约为800小时,以自然方式进行面对面交流,不限制话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。
河南方案自然对话语音数据集
近1000名河南本地发音人参与录制,录制时长约为500小时,以自然方式进行面对面交流,针对指定的多个话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。
外语自然对话语音数据集
美式英语自然对话语音数据集
约2000名发音人参与录制,以自然方式进行面对面交流,针对给定的数个话题自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。
法语自然对话语音数据集
近1000名发音人参与录制,录制时长约为500小时,以自然方式进行面对面交流,针对指定的多个话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。
西班牙语自然对话语音数据集
近1000名发音人参与录制,录制时长约为500小时,以自然方式进行面对面交流,针对指定的多个话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。
如果以上数据不能满足客户当前的需求,数据堂还可以针对特定人群、特定场景、特定语种提供相应的数据定制化服务,全力帮助客户得到满意的数据服务。
|