IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 【python】计算mel频率可能比你想象的要复杂一点 -> 正文阅读

[Python知识库]【python】计算mel频率可能比你想象的要复杂一点

Mel计算公式

计算mel频率可以直接套用公式,

公式如下,

m = 2595 l o g 10 ( 1 + f 700 ) m = 2595 log_{10}(1+ \frac{f} {700}) m=2595log10?(1+700f?)

所以实现上如下

import numpy as np
import librosa

def mel_calculate(freq):
    return 2595 * np.log10(1+freq/700)

for f in np.linspace(10,1000,num=10):
    my_mel = mel_calculate(f)
    mel = librosa.hz_to_mel(f)
    print(f"freq {f}, cal:{my_mel}, librosa:{mel}")

为了做结果上的验证,我使用了librosa来核对计算结果。
在这里插入图片描述
但是发现结果居然跟librosa的不一样,这是为什么呢?

查看librosa的官方文档,有关hz_to_mel的使用,其实是有一个参数

在这里插入图片描述
查寻源码发现,只有在htk=True的时候,才使用开头的公式。

下图是hz_to_mel源码部分中htk的判断
hz_to_mel源码部分

那么这个htk是什么含义呢?

什么是htk

在另外一个函数librosa.mel_frequencies的api介绍中,有关于htk的说明

By default, librosa replicates the behavior of the well-established MATLAB Auditory Toolbox of Slaney.
librosa默认使用slaney实现,这是在MATLAB Auditory Toolbox中的实现。
According to this default implementation, the conversion from Hertz to mel is linear below 1 kHz and logarithmic above 1 kHz.
在这种实现下,转换在1千赫以下是线性的,在1千赫以上是对数的
Another available implementation replicates the Hidden Markov Toolkit (HTK) :
另外一种实现来源Hidden Markov Toolkit ,即HTK

然后针对slaney和HTK,这里信号给了两个参考引用连接

Slaney, M. Auditory Toolbox: A MATLAB Toolbox for Auditory Modeling Work. Technical Report, version 2, Interval Research Corporation, 1998.
Young, S., Evermann, G., Gales, M., Hain, T., Kershaw, D., Liu, X., Moore, G., Odell, J., Ollason, D., Povey, D., Valtchev, V., & Woodland, P. The HTK book, version 3.4. Cambridge University, March 2009.

基本都是20年前的东西了。 但是相比而言,slaney是比HTK稍微新一些的了。

翻阅了一些材料,HTK是针对隐马尔可夫框架做的一个工具包,它有一个在线的htkbook 大部分的介绍也是基于ASR的。

还有一个是Auditory Toolbox,它里面应该就对应着Slaney的实现吧。(没有具体研究)

所以回到开头,如果要匹配到公式实现,所以在参数中需要指定htk=True。即mel = librosa.hz_to_mel(f,htk=True)

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-09-04 01:07:23  更:2022-09-04 01:08:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/26 13:47:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计