声音处理
-
Ubuntu22.04 单张 2080Ti 22G 部署 VoxCPM2:本地声音克隆 + OpenClaw Agent API 实战
VoxCPM2 是 OpenBMB 推出的本地语音合成与声音克隆模型,支持文本转语音、参考音频克隆、文本规范化、中文数字日期处理等能力。本文记录在 Ubuntu 22.04 服务器…
-
在Ubuntu服务器部署GPT-SoVits服务端教程
克隆库文件到服务器 因为我们要克隆到本地的库并不是“main”,而是“fast_inference_”分支,所以我们要运行如下的命令 git clone -b fast_infer…
-
paddlepaddle(TTS)本地部署流程
客户端(Windows) 安装paddlepaddle 安装可以参考 paddlepaddle 官网,根据自己机器的情况进行选择。 python -m pip install pa…
-
Win10+Ollama+Open webui本地部署LLM(llama3/Codeqwen/llava等)与交互式可视化聊天|本地ChatGPT|SD整合方案
Ollama Ollama介绍 ollama是一个开源大模型综合管理和使用平台,不仅单模态模型,还支持多模态模型,以及正在开发支持扩散模型! ollama目前在macOS、Linu…
-
开源AI声音克隆程序GPT-SoVITS本地运行教程 | AI声音克隆教程
GPT-SoVITS是目前为止我亲测过的效果最好的AI声音克隆程序,我甚至已经用这个程序克隆的声音做了一期完整的视频!相比较于《VALL-E X多语言文本到语音合成与语音克隆win…
-
部署一个自己专属的文本转语音网站
这个方案是“草凡语音大师”的web应用方案,对于有些不喜欢本地运行exe文件的小伙伴来说,将“草凡语音大师”部署在vps服务器上面,再搭配一个专属的域名,增加一些自己的品牌信息,打…
-
草凡语音大师本地使用教程
“草凡语音大师”是本人用Python开发的一个文本转语音的工具,调用的是微软的语音API接口,支持全球将近150种主流的语言或方言,支持多种情绪风格的语气表达,是做自媒体配音的好帮…
-
如何获取微软免费的文本转语音API接口
毫无疑问,微软的文本转语音是目前质量最好,效果最接近真人的文本转语音,它不但支持全球主流的140多种语言,还支持同一个语音不同的情绪不同的风格的转换。 目前有很多知名的AI生成类网…
-
AI音乐生产程序AudioCraft本地部署教程|免费开源
Audiocraft 是一个通过深度学习进行音频处理和生成的库。它具有最先进的 EnCodec 音频压缩器/标记器,以及 MusicGen,这是一个简单且可控的音乐生成 LM,具有…
-
Ultimate Vocal Remover | 最强人声与伴奏分离程序 | 免费开源
AI人声伴奏音频分离软件UVR5(Ultimate Vocal Remover 5.5)是一款功能强大的伴奏制作/人声提取工具,其表现不仅优于RX9、RipX和SpectraLay…