IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> python 提取MFCC特征、一阶差分及二阶差分 -> 正文阅读

[人工智能]python 提取MFCC特征、一阶差分及二阶差分

作者:recommend-item-box type_blog clearfix

依赖库:
python-speech-features-0.6

import python_speech_features
import numpy as np
import scipy.io.wavfile
from matplotlib import pyplot as plt
import os

'''
signal - 需要用来计算特征的音频信号,应该是一个N*1的数组
samplerate - 我们用来工作的信号的采样率
winlen - 分析窗口的长度,按秒计,默认0.025s(25ms)
winstep - 连续窗口之间的步长,按秒计,默认0.01s(10ms)
numcep - 倒频谱返回的数量,默认13
nfilt - 滤波器组的滤波器数量,默认26
nfft - FFT的大小,默认512
lowfreq - 梅尔滤波器的最低边缘,单位赫兹,默认为0
highfreq - 梅尔滤波器的最高边缘,单位赫兹,默认为采样率/2
preemph - 应用预加重过滤器和预加重过滤器的系数,0表示没有过滤器,默认0.97
ceplifter - 将升降器应用于最终的倒谱系数。 0没有升降机。默认值为22。
appendEnergy - 如果是true,则将第0个倒谱系数替换为总帧能量的对数。 
'''

def get_mfcc(data, fs, winSize, winStep):
    # MFCC
    wav_feature = python_speech_features.mfcc(data, fs,
                  numcep=13, winlen=winSize, winstep=winStep,  # winstep = 0.01
                  nfilt=26, nfft=512, lowfreq=0, highfreq=None, preemph=0.97)
    # 一阶差分 二阶差分 MFCC 
    d_mfcc_feat = python_speech_features.delta(wav_feature, 1)
    d_mfcc_feat2 = python_speech_features.delta(wav_feature, 2)
    feature = np.hstack((wav_feature, d_mfcc_feat, d_mfcc_feat2))
	# 三者叠加 尺寸为 【len:39】
    return feature


def readWavToMFCCnpy(path, destination, win=0.025, step=0.025):
    idx = 0
    for wav in os.listdir(path):
        idx += 1
        if idx % 100 == 1:
            print("======= ",idx,"MFCC npy done =======")
        sample_rate, signal = scipy.io.wavfile.read(path +"/"+ wav)
        mfcck = get_mfcc(signal, sample_rate, win, step)
        np.save(destination + "/" + "win{}step{}-{}.npy"
                .format(win*1000, step*1000, wav.split(".wav")[0]), mfcck)

    print("----------------------finish get_mfcc----------------------")


if __name__ == '__main__':
	# 源wav路径 和 npy存放路径 和 窗长 和 移动长
    source_path = "D:/ASVsproof/2017v2/ASVspoof2017_V2_train"
    des_path = "D:/ASVsproof/2017v2npy/train"
    readWavToMFCCnpy(source_path, des_path, win=0.025, step=0.01)
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-07 22:41:41  更:2022-04-07 22:45:21 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:48:53-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码