VALL-E X 是一个强大而创新的多语言文本转语音(TTS)模型,最初由微软发布。支持对中文、英文和日语的语音进行合成和克隆;
项目的github地址为:https://github.com/Plachtaa/VALL-E-X/
环境部署
需要提前部署的环境组件包括:Python 3.10、Git、CUDA 11.7 ~ 12.0、PyTorch 2.0+、ffmpeg
安装方法皆可参考《roop图片|视频|直播 一键换脸windows本地搭建教程》一文中的“基本环境安装”章节;
VALL-E X安装步骤
克隆程序到本地
在任意磁盘目录(空间大于10G以上)空白处点击右键-Git Bash Here,在命令窗口输入如下的命令:
git clone https://github.com/Plachtaa/VALL-E-X.git
回车执行该条命令(可能需要科学上网)之后,将会将程序的主要文件拷贝到本地磁盘;
创建单独的虚拟环境
进入到该文件夹,在路径栏输入“cmd”
在命令窗口输入如下的命令,创建一个虚拟环境的文件夹
python -m venv venv
再输入如下的命令激活该虚拟环境
call venv\scripts\activate
该行命令运行后会自动跳转到虚拟环境命令窗口,然后在虚拟环境命令窗口运行下面的命令开始安装项目的依赖组件:
pip install -r requirements.txt
如果有强迫症的(比如我),看到如下的提示
[notice] A new release of pip available: 22.3.1 -> 23.2.1 [notice] To update, run: python.exe -m pip install --upgrade pip
可以直接运行下面的代码给pip升一下级
python.exe -m pip install --upgrade pip
原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/vall-e-xduoyuyanwenbendaoyuyinhechengyuyuyinkelongwindows10bendebushujiaocheng/.html