Ubuntu 22.04 本地部署 DeepSeek-V4-Flash：1张 RTX 2080Ti 22G + 256G内存用 fastllm 实测 12+ tokens/s

朋远方 • 2026年5月12日下午9:34 • 人工智能 • 阅读 466

本文详细记录如何在 Ubuntu 22.04 服务器上，使用 1 张 RTX 2080Ti 22G 显卡和 256GB 内存，通过 fastllm / ftllm 部署运行 DeepSeek-V4-Flash-FP8-Q4。本教程包含 Miniconda 环境创建、依赖安装、NUMA 优化、fastllm 启动命令、API 测试、One API 接入方法和 FASTLLM_NUMA_THREADS 调优经验，实测可获得 12+ tokens/s 的本地推理速度，适合低成本本地大模型服务器、Agent 自动化和私有 AI 服务部署参考。

✦

月会员起

PREMIUM ACCESS

月会员及以上专属内容

此资源至少需要“月会员”。低于该等级的会员套餐无法下载。登录后系统会自动识别你的会员权限。

月会员年会员永久会员至尊会员

查看可用会员套餐登录账号

原创文章，作者：朋远方，如若转载，请注明出处：https://caovan.com/ubuntu-2204-bendebushu-deepseek-v4-flash1zhang-rtx-2080ti-22g-256gneicunyong-fastllm-shice-13/.html

2080ti 22G CPU GPU 混合推理 DeepSeek-V4-Flash DeepSeek本地推理 fastllm ftllm 低成本本地大模型服务器

赞 (3)

打赏

微信扫一扫

0 0

Ubuntu22.04 单张 2080Ti 22G 部署 VoxCPM2：本地声音克隆 + OpenClaw Agent API 实战

Ubuntu22.04 单张 2080Ti 22G 部署 VoxCPM2：本地声音克隆 + OpenClaw Agent API 实战

上一篇 2026年5月12日下午8:03

Ubuntu 22.04 指定显卡部署 Fast-Whisper：搭建 GPU 语音识别 WebUI 与 OpenClaw API

Ubuntu 22.04 指定显卡部署 Fast-Whisper：搭建 GPU 语音识别 WebUI 与 OpenClaw API

下一篇 2026年5月13日上午7:57

AI绘画

AI人脸替换工具离线版V2.0下载|支持直播换脸|支持高清人脸修复

054.3K0

朋远方
2023年8月29日
声音处理

如何获取微软免费的文本转语音API接口

022.1K0

朋远方
2023年9月27日
AI绘画

Stable Diffusion Prompt 辞典

1910629.6K2

朋远方
2023年7月7日
人工智能

RTX 2080Ti CAOVAN vLLM SM75 Turbo3 推理加速插件（v0.4.13版）从零安装教程

001.9K25

朋远方
2026年6月6日
AI绘画

如何用stable diffusion修改图片的背景

2619.5K4

朋远方
2023年12月27日
AI绘画

关于ComfyUI的insightface节点中的antelopev2模型经常被自动删除的解决方案

015.6K0

朋远方
2024年2月10日

发表回复

登录后才能评论

CS

在线客服欢迎咨询，我们将尽快回复您

客服当前在线，可直接开始聊天

在线客服匿名访客，无需填写个人资料

在线客服

您好，我是在线客服，请直接告诉我您需要咨询的问题。

实时聊天未及时回复？可通过以下渠道继续联系官方。