本地Asp.Net Core WebApi, 上传文件进行语音识别,自带中文小模型,可替换其他语言模型。
Service部分大量参考(抄自) https://github.com/DimQ1/vosk-http-server
中文单词的断句,目前是两个单词间隔大于0.4秒断句,期待找到更合理的方法
如使用其他模型,将下载的Model解压后拷贝到Release下的TextModel文件夹下;
或替换工程里的Textmodel文件夹,将内容设为始终复制。
CN的大模型需要较大内存。