中文(支持中文的)大语言模型(LLM)汇总

综合能力排行榜

综合能力得分为分类能力、信息抽取能力、阅读理解能力、数据分析能力四者得分的平均值。

中文(支持中文的)大语言模型(LLM)汇总

类别 大模型 总分 排名
商用 gpt4 96.08 1
商用 chatgpt-3.5 93.58 2
商用 微软new-bing 93.00 3
商用 GLM4(new) 92.33 4
商用 文心4.0 91.43 5
商用 阿里qwen-max(new) 88.65 6
开源 Qwen-72B-Chat 87.25 7
开源 tigerbot-70b-chat-v2 86.50 8
商用 文心一言v2.2 86.50 9
开源 openbuddy-deepseek-67b(new) 86.18 10
商用 讯飞星火v3 85.75 11
开源 XVERSE-65B-Chat(new) 85.00 12
商用 谷歌bard 84.08 13
开源 tigerbot-70b-chat-v3 83.50 14
开源 openbuddy-llama2-70b-v10.1 83.18 15
开源 tigerbot-13b-chat-v4 83.00 16
商用 chatglm-turbo 83.00 17
开源 Yi-34B-Chat 82.93 18
开源 aquilachat2-34b 82.50 19
商用 商汤senseChat 81.93 20
商用 Baichuan2-53B 81.75 21
开源 BELLE-Llama2-13B-chat-0.4M 79.75 22
商用 字节跳动豆包 79.50 23
开源 Baichuan2-13B-Chat 79.43 24
开源 qwen-14b-chat 79.43 25
开源 Baichuan2-7B-Chat 79.08 26
商用 阿里通义千问 79.00 27
开源 belle-llama-13b-2m 78.67 28
开源 openbuddy-zephyr-7b(new) 77.75 29
开源 BlueLM-7B-Chat(new) 77.75 30
开源 openbuddy-llama-65b-v8 76.83 31
开源 xverse-13b-chat 76.58 32
商用 chatglm-std 76.00 33
商用 chatglm-pro 75.75 34
商用 讯飞星火v1.5 75.50 35
开源 openbuddy-mistral-7b-v13.1 75.08 36
商用 chatglm-130b-v1 74.67 37
开源 openbuddy-llama-30b-v7.1 74.33 38
商用 360智脑 74.25 39
开源 Llama-2-70b-chat 73.58 40
开源 Qwen-7B-Chat 73.50 41
商用 讯飞星火v2.0 72.83 42
开源 Baichuan-13B-Chat-v2 72.68 43
开源 chatglm3-6b 72.18 44
开源 tulu-30b 72.08 45
开源 belle-llama-13b-ext 71.17 46
开源 internlm-chat-20b 69.83 47
开源 Ziya-LLaMA-13B-v1.1 69.75 48
开源 Yi-6B-Chat 68.67 49
开源 Linly-Chinese-LLaMA2-13B 67.33 50
开源 ziya2-13b-chat 67.33 51
开源 chatglm2-6b 66.75 52
开源 Qwen-1_8B-Chat 66.42 53
商用 minimax 66.33 54
开源 vicuna-33b 66.08 55
开源 wizardlm-13b 60.00 56
开源 InternLM-Chat-7B 59.00 57
开源 AquilaChat-7B 58.00 58
开源 openbuddy-openllama-3b-v10 56.50 59

10B以下大模型排行榜

类别 大模型 分类能力 信息抽取能力 阅读理解能力 表格问答 总分 排名
开源 Baichuan2-7B-Chat 88 76 83.3 69 79.1 1
开源 openbuddy-zephyr-7b(new) 82 83 74.0 72 77.8 2
开源 BlueLM-7B-Chat(new) 82 83 74.0 72 77.8 3
开源 openbuddy-mistral-7b-v13.1 79 72 73.3 76 75.1 4
开源 Qwen-7B-Chat 89 72 74.0 59 73.5 5
开源 chatglm3-6b 82 68 78.7 60 72.2 6
开源 Yi-6B-Chat 73 71 66.0 64.7 68.7 7
开源 chatglm2-6b 70 68 72.0 57 66.8 8
开源 Qwen-1_8B-Chat 73 66 75.3 51.3 66.4 9
开源 InternLM-Chat-7B 62 55 66.0 53 59.0 10
开源 AquilaChat-7B 70 51 56.0 55 58.0 11
开源 openbuddy-openllama-3b-v10 64 60 61.3 40.7 56.5 12

10B~20B大模型排行榜

类别 大模型 分类能力 信息抽取能力 阅读理解能力 表格问答 总分 排名
开源 tigerbot-13b-chat-v4 85 82 80.0 85 83.0 1
开源 BELLE-Llama2-13B-chat-0.4M 90 74 76.0 79 79.8 2
开源 Baichuan2-13B-Chat 83 83 74.7 77 79.4 3
开源 qwen-14b-chat 84 72 84.7 77 79.4 4
开源 belle-llama-13b-2m 82 75 80.7 77 78.7 5
开源 xverse-13b-chat 86 72 81.3 67 76.6 6
开源 Baichuan-13B-Chat-v2 82 69 72.7 67 72.7 7
开源 belle-llama-13b-ext 74 65 76.7 69 71.2 8
开源 internlm-chat-20b 74 64 77.3 64 69.8 9
开源 Ziya-LLaMA-13B-v1.1 72 69 80.0 58 69.8 10
开源 ziya2-13b-chat 76 54 71.3 68 67.3 11
开源 Linly-Chinese-LLaMA2-13B 78 67 67.3 57 67.3 12
开源 linly-chatflow-13b 72 63 74.7 59 67.2 13
开源 wizardlm-13b 68 52 72.0 48 60.0 14

20B以上大模型排行榜

类别 大模型 分类能力 信息抽取能力 阅读理解能力 表格问答 总分 排名
开源 Qwen-72B-Chat 89 80 92.7 87.3 87.3 1
开源 tigerbot-70b-chat-v2 97 84 80.0 85 86.5 2
开源 openbuddy-deepseek-67b(new) 86 89 84.7 85 86.2 3
开源 XVERSE-65B-Chat(new) 83 84 84.0 89 85.0 4
开源 tigerbot-70b-chat-v3 94 85 84.0 71 83.5 5
开源 openbuddy-llama2-70b-v10.1 86 84 86.7 76 83.2 6
开源 Yi-34B-Chat 88 82 84.7 77 82.9 7
开源 aquilachat2-34b 77 82 88.0 83 82.5 8
开源 openbuddy-llama-65b-v8 68 84 79.3 76 76.8 9
开源 openbuddy-llama-30b-v7.1 82 74 81.3 60 74.3 10
开源 Llama-2-70b-chat 86 66 73.3 69 73.6 11
开源 tulu-30b 76 76 75.3 61 72.1 12
开源 vicuna-33b 82 65 63.3 54 66.1 13

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/zhongwendayuyinmoxingllmhuizong/.html

(0)
打赏 微信扫一扫 微信扫一扫
朋远方的头像朋远方
上一篇 2024年2月28日 下午3:16
下一篇 2024年2月28日 下午6:49

相关推荐

发表回复

登录后才能评论