IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Matlab-基于短时神经网络的声音分类 -> 正文阅读

[人工智能]Matlab-基于短时神经网络的声音分类

这个例子展示了如何使用深度学习过程对声音进行分类。

1、数据集生成

生成1000个白噪声信号、1000个棕色噪声信号和1000个粉色噪声信号。假设采样率为44.1 kHz,每个信号表示0.5秒的持续时间。

fs = 44.1e3;duration = 0.5;N = duration*fs;
wNoise = 2*rand([N,1000]) - 1;wLabels = repelem(categorical("white"),1000,1);
bNoise = filter(1,[1,-0.999],wNoise);bNoise = bNoise./max(abs(bNoise),[],'all');bLabels = repelem(categorical("brown"),1000,1);
pNoise = pinknoise([N,1000]);pLabels = repelem(categorical("pink"),1000,1);

2、数据可视化

听声音信号,并使用melSpectrogram函数将其可视化。

sound(wNoise(:,1),fs)melSpectrogram(wNoise(:,1),fs)title('White Noise')

 
sound(bNoise(:,1),fs)melSpectrogram(bNoise(:,1),fs)title('Brown Noise')

图片

 
sound(pNoise(:,1),fs)melSpectrogram(pNoise(:,1),fs)title('Pink Noise')

图片

3、将数据集分为训练集和验证集

创建一个由800个白噪声信号、800个棕色噪声信号和800个粉色噪声信号组成的训练集。

audioTrain = [wNoise(:,1:800),bNoise(:,1:800),pNoise(:,1:800)];labelsTrain = [wLabels(1:800);bLabels(1:800);pLabels(1:800)];

使用剩余的200个白噪声信号、200个棕色噪声信号和200个粉色噪声信号创建验证集。

audioValidation = [wNoise(:,801:end),bNoise(:,801:end),pNoise(:,801:end)];labelsValidation = [wLabels(801:end);bLabels(801:end);pLabels(801:end)];

4、信号提取

音频数据是高维的,通常包含冗余信息。通过首先提取特征,然后使用提取的特征训练模型,可以降低维数。创建audioFeatureExtractor对象以提取mel光谱随时间变化的质心和斜率。

aFE = audioFeatureExtractor("SampleRate",fs, ...    "SpectralDescriptorInput","melSpectrum", ...    "spectralCentroid",true, ...    "spectralSlope",true);

调用extract从音频训练数据中提取特征。

featuresTrain = extract(aFE,audioTrain);[numHopsPerSequence,numFeatures,numSignals] = size(featuresTrain)

5、数据准备

在下一步中,您将把提取的特征视为序列,并使用sequenceInputLayer作为深度学习模型的第一层。当使用SequenceInputLayers作为网络中的第一层时,trainNetwork希望将训练和验证数据格式化为序列的单元数组,其中每个序列随时间由特征向量组成。sequenceInputLayer要求时间维度沿第二维度。

featuresTrain = permute(featuresTrain,[2,1,3]);featuresTrain = squeeze(num2cell(featuresTrain,[1,2]));
numSignals = numel(featuresTrain)numSignals = 2400
[numFeatures,numHopsPerSequence] = size(featuresTrain{1})numFeatures = 2
numHopsPerSequence = 42

提取特征

featuresValidation = extract(aFE,audioValidation);featuresValidation = permute(featuresValidation,[2,1,3]);featuresValidation = squeeze(num2cell(featuresValidation,[1,2]));


6、定义和训练网络

定义网络架构。

layers = [ ...    sequenceInputLayer(numFeatures)    lstmLayer(50,"OutputMode","last")    fullyConnectedLayer(numel(unique(labelsTrain)))    softmaxLayer    classificationLayer];


要定义train选项,请使用option选项(深度学习工具箱)。

options = trainingOptions("adam", ...    "Shuffle","every-epoch", ...    "ValidationData",{featuresValidation,labelsValidation}, ...    "Plots","training-progress", ...    "Verbose",false);

要训练网络,请使用trainNetwork(深度学习工具箱)。

net = trainNetwork(featuresTrain,labelsTrain,layers,options);

图片

7、验证网络

使用经过训练的网络对新的白噪声、棕色噪声和粉色噪声信号进行分类。

wNoiseTest = 2*rand([N,1]) - 1;classify(net,extract(aFE,wNoiseTest)')ans = categorical     white

bNoiseTest = filter(1,[1,-0.999],wNoiseTest);bNoiseTest= bNoiseTest./max(abs(bNoiseTest),[],'all');classify(net,extract(aFE,bNoiseTest)')ans = categorical     brown

pNoiseTest = pinknoise(N);classify(net,extract(aFE,pNoiseTest)')ans = categorical     pink

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-16 18:49:57  更:2021-11-16 18:50:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 5:50:07-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码