whisper是一个强大且开源的语音转文字工具,支持多种语言,支持导出txt、srt、vtt等多种格式文件,并且经过测试whisper的准确率非常高!除了可以处理音频文件,还可以直接处理视频文件,并且允许捕获和转录或翻译来自麦克风的实时音频,功能非常强大!
项目的github主页:https://github.com/Const-me/Whisper
从该存储库的“Releases”部分下载 WhisperDesktop.zip,解压 ZIP,即可运行 WhisperDesktop.exe,是一个无需安装的绿色版本;
模型下载地址:https://huggingface.co/ggerganov/whisper.cpp/tree/main
理论上来说模型越大识别的准确度越高,但是也有人测试到说ggml-medium.bin的准确度最高,关于这一点我没有做过量化的对比,大家自行测试!
下面是我整理好的完整文件,包括主程序和3个模型文件,你可以直接点击下载即可直接使用:
使用方法
原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/whisperyuyinzhuanwenzigongjuzhichiduozhongyuyanwindowsbendeluseban/.html