VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程

VALL-E X 是一个强大而创新的多语言文本转语音(TTS)模型,最初由微软发布。支持对中文、英文和日语的语音进行合成和克隆;

项目的github地址为:https://github.com/Plachtaa/VALL-E-X/

环境部署

需要提前部署的环境组件包括:Python 3.10、Git、CUDA 11.7 ~ 12.0、PyTorch 2.0+、ffmpeg

安装方法皆可参考《roop图片|视频|直播 一键换脸windows本地搭建教程》一文中的“基本环境安装”章节;

VALL-E X安装步骤

克隆程序到本地

在任意磁盘目录(空间大于10G以上)空白处点击右键-Git Bash Here,在命令窗口输入如下的命令:

git clone https://github.com/Plachtaa/VALL-E-X.git

回车执行该条命令(可能需要科学上网)之后,将会将程序的主要文件拷贝到本地磁盘;

VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程

创建单独的虚拟环境

进入到该文件夹,在路径栏输入“cmd”

VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程

在命令窗口输入如下的命令,创建一个虚拟环境的文件夹

python -m venv venv

再输入如下的命令激活该虚拟环境

call venv\scripts\activate

VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程

该行命令运行后会自动跳转到虚拟环境命令窗口,然后在虚拟环境命令窗口运行下面的命令开始安装项目的依赖组件:

pip install -r requirements.txt

如果有强迫症的(比如我),看到如下的提示

[notice] A new release of pip available: 22.3.1 -> 23.2.1
[notice] To update, run: python.exe -m pip install --upgrade pip

可以直接运行下面的代码给pip升一下级

python.exe -m pip install --upgrade pip

VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/vall-e-xduoyuyanwenbendaoyuyinhechengyuyuyinkelongwindows10bendebushujiaocheng/.html

(1)
打赏 微信扫一扫 微信扫一扫
朋远方的头像朋远方
上一篇 2023年8月29日 下午1:16
下一篇 2023年9月10日 上午10:13

相关推荐

发表回复

登录后才能评论