[人工智能] python 提取MFCC特征、一阶差分及二阶差分

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> python 提取MFCC特征、一阶差分及二阶差分 -> 正文阅读

[人工智能]python 提取MFCC特征、一阶差分及二阶差分

作者:recommend-item-box type_blog clearfix

依赖库：
python-speech-features-0.6

import python_speech_features
import numpy as np
import scipy.io.wavfile
from matplotlib import pyplot as plt
import os

'''
signal - 需要用来计算特征的音频信号，应该是一个N*1的数组
samplerate - 我们用来工作的信号的采样率
winlen - 分析窗口的长度，按秒计，默认0.025s(25ms)
winstep - 连续窗口之间的步长，按秒计，默认0.01s（10ms）
numcep - 倒频谱返回的数量，默认13
nfilt - 滤波器组的滤波器数量，默认26
nfft - FFT的大小，默认512
lowfreq - 梅尔滤波器的最低边缘，单位赫兹，默认为0
highfreq - 梅尔滤波器的最高边缘，单位赫兹，默认为采样率/2
preemph - 应用预加重过滤器和预加重过滤器的系数，0表示没有过滤器，默认0.97
ceplifter - 将升降器应用于最终的倒谱系数。 0没有升降机。默认值为22。
appendEnergy - 如果是true，则将第0个倒谱系数替换为总帧能量的对数。 
'''

def get_mfcc(data, fs, winSize, winStep):
    # MFCC
    wav_feature = python_speech_features.mfcc(data, fs,
                  numcep=13, winlen=winSize, winstep=winStep,  # winstep = 0.01
                  nfilt=26, nfft=512, lowfreq=0, highfreq=None, preemph=0.97)
    # 一阶差分 二阶差分 MFCC 
    d_mfcc_feat = python_speech_features.delta(wav_feature, 1)
    d_mfcc_feat2 = python_speech_features.delta(wav_feature, 2)
    feature = np.hstack((wav_feature, d_mfcc_feat, d_mfcc_feat2))
	# 三者叠加 尺寸为 【len：39】
    return feature


def readWavToMFCCnpy(path, destination, win=0.025, step=0.025):
    idx = 0
    for wav in os.listdir(path):
        idx += 1
        if idx % 100 == 1:
            print("======= ",idx,"MFCC npy done =======")
        sample_rate, signal = scipy.io.wavfile.read(path +"/"+ wav)
        mfcck = get_mfcc(signal, sample_rate, win, step)
        np.save(destination + "/" + "win{}step{}-{}.npy"
                .format(win*1000, step*1000, wav.split(".wav")[0]), mfcck)

    print("----------------------finish get_mfcc----------------------")


if __name__ == '__main__':
	# 源wav路径 和 npy存放路径 和 窗长 和 移动长
    source_path = "D:/ASVsproof/2017v2/ASVspoof2017_V2_train"
    des_path = "D:/ASVsproof/2017v2npy/train"
    readWavToMFCCnpy(source_path, des_path, win=0.025, step=0.01)

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-04-07 22:41:41 更:2022-04-07 22:45:21

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/19 11:36:16-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码