声音处理

人工智能

Ubuntu22.04 单张 2080Ti 22G 部署 VoxCPM2：本地声音克隆 + OpenClaw Agent API 实战

VoxCPM2 是 OpenBMB 推出的本地语音合成与声音克隆模型，支持文本转语音、参考音频克隆、文本规范化、中文数字日期处理等能力。本文记录在 Ubuntu 22.04 服务器…

朋远方
2026年5月12日
011210
人工智能

在Ubuntu服务器部署GPT-SoVits服务端教程

克隆库文件到服务器因为我们要克隆到本地的库并不是“main”，而是“fast_inference_”分支，所以我们要运行如下的命令 git clone -b fast_infer…

朋远方
2024年7月2日
001.1K0
人工智能

paddlepaddle（TTS）本地部署流程

客户端（Windows）安装paddlepaddle 安装可以参考 paddlepaddle 官网，根据自己机器的情况进行选择。 python -m pip install pa…

朋远方
2024年6月28日
001.9K0
AI绘画

Win10+Ollama+Open webui本地部署LLM(llama3/Codeqwen/llava等)与交互式可视化聊天|本地ChatGPT|SD整合方案

Ollama Ollama介绍 ollama是一个开源大模型综合管理和使用平台，不仅单模态模型，还支持多模态模型，以及正在开发支持扩散模型！ ollama目前在macOS、Linu…

朋远方
2024年4月24日
0415.0K3
声音处理

开源AI声音克隆程序GPT-SoVITS本地运行教程 | AI声音克隆教程

GPT-SoVITS是目前为止我亲测过的效果最好的AI声音克隆程序，我甚至已经用这个程序克隆的声音做了一期完整的视频！相比较于《VALL-E X多语言文本到语音合成与语音克隆win…

朋远方
2024年2月11日
039.3K0
声音处理

部署一个自己专属的文本转语音网站

这个方案是“草凡语音大师”的web应用方案，对于有些不喜欢本地运行exe文件的小伙伴来说，将“草凡语音大师”部署在vps服务器上面，再搭配一个专属的域名，增加一些自己的品牌信息，打…

朋远方
2023年10月1日
021.4K0
声音处理

草凡语音大师本地使用教程

“草凡语音大师”是本人用Python开发的一个文本转语音的工具，调用的是微软的语音API接口，支持全球将近150种主流的语言或方言，支持多种情绪风格的语气表达，是做自媒体配音的好帮…

朋远方
2023年9月27日
011.5K3
声音处理

如何获取微软免费的文本转语音API接口

毫无疑问，微软的文本转语音是目前质量最好，效果最接近真人的文本转语音，它不但支持全球主流的140多种语言，还支持同一个语音不同的情绪不同的风格的转换。目前有很多知名的AI生成类网…

朋远方
2023年9月27日
022.1K0
声音处理

AI音乐生产程序AudioCraft本地部署教程|免费开源

Audiocraft 是一个通过深度学习进行音频处理和生成的库。它具有最先进的 EnCodec 音频压缩器/标记器，以及 MusicGen，这是一个简单且可控的音乐生成 LM，具有…

朋远方
2023年9月19日
025.1K0
互联网技术

Ultimate Vocal Remover | 最强人声与伴奏分离程序 | 免费开源

AI人声伴奏音频分离软件UVR5（Ultimate Vocal Remover 5.5）是一款功能强大的伴奏制作/人声提取工具，其表现不仅优于RX9、RipX和SpectraLay…

朋远方
2023年9月18日
004.1K0

1 / 2
1
2