语音识别demo(后端使用modelscope的Paraformer识别语音, 百度飞浆paddle punctual补充标点)
使用docker安装对应的服务端环境
两个镜像分别需要15G+ 和20G+的磁盘空间..加上容器本身至少需要70G+空间, 如果没有多余空间只有考虑按照教程自己配置环境
docker容器参数示例
- [Paddle]
端口可以去
/home/PaddleSpeech/demos/streaming_asr_server/conf/punc_application.yaml里面配置
docker run -itd --name paddle --gpus all -v $PWD:/mnt -p 36000:8080 -p 36100:8900 paddlecloud/paddlespeech:develop-gpu-cuda11.2-cudnn8-c8196d- [Modelscope]
docker run -itd --name modelscope --gpus all -p 37000:9000 registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.4.1Modelscope的Paraformer模型比百度飞浆的效果更好, 所以优先建议使用Modelscope语音识别
- 把
work.py和asr.sh扔到根目录/里面
docker cp asr.sh modelscope:/asr.shdocker cp work.py modelscope:/work.py
- 进入容器操作
docker exec -it modelscope /bin/bashchmod +x asr.sh
- 安装一些执行环境
pip config set global.index-url https://mirror.sjtu.edu.cn/pypi/web/simplepip install uvicorn[standard]pip install pydubpip install pydantic
- 启动/停止服务, 默认端口
9000
/asr.sh goor/asr.sh stop来启动或停止服务
- 查看日志
tail -f /work.log
- 容器外启动
docker exec -d modelscope sh -c "/asr.sh go"
- 将脚本扔到docker容器里面去
docker cp punc.sh paddle:/punc.sh
- 进入容器操作
docker exec -it modelscope /bin/bashchmod +x /punc.sh
- 修改punctual服务端口, 默认
8080
vim /home/PaddleSpeech/demos/streaming_asr_server/conf/punc_application.yaml- 将
port修改为你映射的端口如8080
- 启动/停止服务
/punc.sh goor/punc.sh stop来启动或停止服务
- 查看日志
tail -f /home/punc.log
- 容器外启动
docker exec -d paddle sh -c "/punc.sh go"