| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 智能硬件语音控制的时频图分类挑战赛2.0(思路以及结果,目前top5) -> 正文阅读 |
|
[人工智能]智能硬件语音控制的时频图分类挑战赛2.0(思路以及结果,目前top5) |
智能硬件语音控制的时频图分类挑战赛2.0这里记录一下,有关我学习的一些思路和过程,在2022年讯飞的开发者大赛中做的一些比赛,以及去得的一些成功 比赛地址:http://challenge.xfyun.cn/topic/info?type=time-frequency-2022&option=ssgy 一、赛事背景2014年11月,亚马逊推出了一款全新概念的智能音箱Echo,通过语音指令交互控制硬件设备。截止2016年4月,Echo的累计销量已经突破300万台。2017年12月累计数千万台。亚马逊Echo音箱的推出标志着以语音交互为实用化的落地方案。 以智能音箱为代表的声控智能硬件在我国已经得到了商业化的大规模推广。2020年我国占有全球智能音箱销售量的51%,位居全球第一,而同期美国的份额从44%下降到了24%。 二、赛事任务赛题提供具有24句语音交互指令的语音时频谱数据集(spectrogram dataset),选手需要完成搭建网络模型,基于密集多层网络、卷积网络和循环网络等基本结构的组合,进行有效预测。 三、评审规则1.数据说明本次比赛为参赛选手提供了语音信号及其对应的语句标签。出于数据安全保证的考虑,所有数据均为脱敏处理后的数据。 2.评估指标本模型依据提交的结果文件,采用Macro-F1进行评价。 3.评测及排行1、初赛和复赛均提供下载数据,选手在本地进行算法调试,在比赛页面提交结果。 2、每支团队每天最多提交3次。 3、排行按照得分从高到低排序,排行榜将选择团队的历史最优成绩进行排名。 四、作品提交要求1、文件格式:按照csv格式提交测试结果 2、文件大小:无要求 3、文件详细说明:
五、赛程规则本赛题实行一轮赛制 赛程周期 7月1日-8月1日1、7月1日10:00发布相关数据集(即开启比赛榜单) 2、比赛作品提交截止日期为8月1日17:00 现场答辩1、最终前三名团队将受邀参加科大讯飞全球1024开发者节并于现场进行答辩 2、答辩以(10mins陈述+5mins问答)的形式进行 3、根据作品成绩和答辩成绩综合评分(作品成绩占比70%,现场答辩份数占比30%) 六、奖项设置
七、尝试Tricks和思路
八、详细参数以及运行数据增强处理
后续增加数据增强,我发现从结果上来看,由于我们的图片中亮度变化比较明显,如果对亮度进行变化的话,我们的数据增强几乎是没什么效果的,个人感觉对比度也是,所以增加的数据增强主要是对图像的平移,或者掩盖等等。如果结果不错的话,再考虑用亮度和对比度的增强进行测试 增加了A.CoarseDropout(p=0.5)以后,结果提高了1%左右
ResNet18 首先借鉴baseline中的ResNet18进行训练,然后加上自己的框架和一点点修改进行训练,第一次训练达到了91.5%的评分
训练方式
结果会发现,我们用小模型的训练往往能得到不错的结果,特别是EfficientNetv2系列的模型,在验证集中能得到比较高的准确率 这之中都是利用预训练模型进程测试的,因为含有一定量知识的模型才能得到更好的结果,并且在下列模型中,都先冻结训练了5个迭代 除此之外,添加了早停策略,防止过拟合 这里展示的是模型的最优结果
实际上现有模型都是小模型进行训练,之后也可以尝试利用大模型查看能否得到比较好的结果 九、提交结果2022.7.15,目前排名第7,得分0.93121 2022.7.15,目前排名第5,得分0.94377,这一次只加了一个数据增强就得到了不错的结果
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 0:52:38- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |