大模型推理
-
caovan-vLLM SM75 Turbo3 v0.4.22 升级到 v0.4.33
本文详细介绍 Caovan vLLM SM75 Turbo3 v0.4.33 的安装与使用方法,适用于 2×RTX 2080Ti 22G / SM75 显卡运行 Qwen3.6-2…
-
caovan-vLLM SM75 Turbo3 v0.4.13 升级到 v0.4.22
caovan-vLLM SM75 Turbo3 是面向 RTX 2080Ti / SM75 架构显卡的 vLLM 外部加速插件,主要用于在老架构显卡上尽可能释放大模型推理性能。本文…
-
RTX 2080Ti CAOVAN vLLM SM75 Turbo3 推理加速插件(v0.4.13版)从零安装教程
这篇教程面向没有 Linux 部署经验的新手用户,从一台空白 Ubuntu 22.04 机器开始,逐步安装 Miniconda、创建 Python 环境、安装 vLLM 与 Cao…
