GGUF相关文章列表 | 草凡博客

人工智能

最近我在 Ubuntu 22.04 服务器上测试了一款比较有意思的 GGUF 大模型：Qwopus3.6-27B-v2-MTP-GGUF。这个模型基于 Qwen3.6-27B，重…

2026年5月24日

001.1K1

人工智能

在本文中，我们将探讨几种(量化)的方式，除此以外，还会介绍分片及不同的保存和压缩策略。说明：每次加载LLM示例后，建议清除缓存，以防止出现OutOfMemory错误。 del m…

2024年4月7日

002.5K0