rapid_paraformer是一个基于阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-pytorch的语音识别工具。
🎉该项目核心代码已经并入FunASR
本仓库仅对模型做了转换,只采用ONNXRuntime推理引擎
- 整合vad + asr + pun三个模型,打造可部署使用的方案
pip install rapid_paraformer
方法一:从Hugging Face上下载(link)
from rapid_paraformer import download_hf_model
download_hf_model(repo_id="SWHL/RapidParaformer", save_dir=".")
方法二:(Google Drive | 百度网盘)
resources
├── [ 700] config.yaml
└── [4.0K] models
├── [ 11K] am.mvn
├── [824M] asr_paraformerv2.onnx
└── [ 50K] token_list.pkl
基于modescope下的notebook环境自助转换:
- 打开快速体验
- 打开notebook → Cell中输入以下命令, 执行即可。
!python -m funasr.export.export_model --model-name 'damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch' --export-dir "./export"
from rapid_paraformer import RapidParaformer
config_path = "resources/config.yaml"
paraformer = RapidParaformer(config_path)
wav_path = [
"test_wavs/0478_00017.wav",
"test_wavs/asr_example_zh.wav",
]
result = paraformer(wav_path)
print(result)
# ['y', '欢迎大家来体验达摩院推出的语音识别模型']