简介
MFA(Montreal Forced Aligner)是一个命令行实用程序,使用 Kaldi 执行语音数据集的强制对齐。 有关安装使用,参阅文档。
准备
MAF
下载源码v2.0.0a22.tar.g[1] 解压即可
$ wget https://github.com/MontrealCorpusTools/Montreal-Forced-Aligner/archive/refs/tags/v2.0.0a22.tar.gz
$ tar -zxvf v2.0.0a22.tar.gz
$ cd Montreal-Forced-Aligner-2.0.0a22
$ ls
continuous-integration LICENSE pyproject.toml requirements.txt setup.py
docs montreal_forced_aligner README.md rtd_requirements.txt tests
下载语言模型[2], Mandarin
安装
$ conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch
$ conda activate aligner
$ pip install montreal-forced-aligner
$ mfa thirdparty download
$ conda install -c conda-forge sox
mfa thirdparty download需要多等一会 如果很不幸使用的不是 Ubuntu 18.04 或者 MacOSX 10.15 (Catalina) 需要编译安装kaldi 以及执行
$ kaldi /path/to/kaldi/repo
$ mfa thirdparty validate
升级
$ conda activate aligner
$ pip install montreal-forced-aligner -U
MFA 2.0.0a5 以及更早的版本使用 Pynini version 2.1.0. MFA 2.0.0a6, 已经升级到最新的 Pynini 版本,具体参考手册[3]。
参考
[1]. github代码 [2]. 自带的语言模型 [3]. Installation [4]. 字幕制作
|