Skip to content

Latest commit

 

History

History

python

Rapid Paraformer

PyPI SemVer2.0

简介

rapid_paraformer是一个基于阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-pytorch的语音识别工具。

🎉该项目核心代码已经并入FunASR

本仓库仅对模型做了转换,只采用ONNXRuntime推理引擎

TODO

  • 整合vad + asr + pun三个模型,打造可部署使用的方案

安装

pip install rapid_paraformer

模型下载

方法一:从Hugging Face上下载(link

from rapid_paraformer import download_hf_model

download_hf_model(repo_id="SWHL/RapidParaformer", save_dir=".")

方法二:(Google Drive | 百度网盘)

resources
├── [ 700]  config.yaml
└── [4.0K]  models
    ├── [ 11K]  am.mvn
    ├── [824M]  asr_paraformerv2.onnx
    └── [ 50K]  token_list.pkl

模型转换

基于modescope下的notebook环境自助转换:

  1. 打开快速体验
  2. 打开notebook → Cell中输入以下命令, 执行即可。
    !python -m funasr.export.export_model --model-name 'damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch' --export-dir "./export"

使用

from rapid_paraformer import RapidParaformer

config_path = "resources/config.yaml"

paraformer = RapidParaformer(config_path)

wav_path = [
    "test_wavs/0478_00017.wav",
    "test_wavs/asr_example_zh.wav",
]

result = paraformer(wav_path)
print(result)
# ['y', '欢迎大家来体验达摩院推出的语音识别模型']