oneapi

人工智能

4 x 2080Ti 22G Ubuntu服务器部署大语言模型+企业知识库的最优方案

经过反复试验测试，在四张22G的2080Ti Ubuntu操作系统的服务器上，部署企业知识库的最优方案如下： Xinference + MaxKB或RAGFlow + Open-W…

朋远方
2025年3月3日
00430
自然语言处理

4张定制版22G 2080ti 搭建AI服务器用vllm框架跑Qwen1.5-110B模型非常丝滑！

操作系统和显卡/nvlink 服务器的系统采用Ubuntu22.04 显卡驱动选择“使用 NVIDIA driver metapackage 来自 nvidia-driver-53…

朋远方
2024年6月6日
031.7K0
人工智能

vllm让LLM的本地推理速度坐上火箭！| 以Qwen1.5-14B为例

在上一篇文章中，我们讲解了如何将本地部署的Qwen1.5-14B模型导入FastGPT，感兴趣的可以查阅《Windows+WSL+Docker Desktop+FastGPT+m3…

朋远方
2024年3月19日
039.4K0
人工智能

Windows+WSL+Docker Desktop+FastGPT+m3e+oneapi+Qwen-14B部署本地AI知识库

在上一篇文章里面，我们详细地讲解了如何在windows系统下面安装WSL、Docker Desktop、FastGPT、m3e、oneapi来部署本地的AI知识库！只不过我们调用的…

朋远方
2024年3月19日
002.1K0
人工智能

Windows+WSL+Docker Desktop+FastGPT+m3e+oneapi+ChatGLM3部署本地AI知识库

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排，从而实现复杂的问答场景！简而言…

朋远方
2024年3月15日
039.2K0