综合能力排行榜
综合能力得分为分类能力、信息抽取能力、阅读理解能力、数据分析能力四者得分的平均值。
类别 |
大模型 |
总分 |
排名 |
商用 |
gpt4 |
96.08 |
1 |
商用 |
chatgpt-3.5 |
93.58 |
2 |
商用 |
微软new-bing |
93.00 |
3 |
商用 |
GLM4(new) |
92.33 |
4 |
商用 |
文心4.0 |
91.43 |
5 |
商用 |
阿里qwen-max(new) |
88.65 |
6 |
开源 |
Qwen-72B-Chat |
87.25 |
7 |
开源 |
tigerbot-70b-chat-v2 |
86.50 |
8 |
商用 |
文心一言v2.2 |
86.50 |
9 |
开源 |
openbuddy-deepseek-67b(new) |
86.18 |
10 |
商用 |
讯飞星火v3 |
85.75 |
11 |
开源 |
XVERSE-65B-Chat(new) |
85.00 |
12 |
商用 |
谷歌bard |
84.08 |
13 |
开源 |
tigerbot-70b-chat-v3 |
83.50 |
14 |
开源 |
openbuddy-llama2-70b-v10.1 |
83.18 |
15 |
开源 |
tigerbot-13b-chat-v4 |
83.00 |
16 |
商用 |
chatglm-turbo |
83.00 |
17 |
开源 |
Yi-34B-Chat |
82.93 |
18 |
开源 |
aquilachat2-34b |
82.50 |
19 |
商用 |
商汤senseChat |
81.93 |
20 |
商用 |
Baichuan2-53B |
81.75 |
21 |
开源 |
BELLE-Llama2-13B-chat-0.4M |
79.75 |
22 |
商用 |
字节跳动豆包 |
79.50 |
23 |
开源 |
Baichuan2-13B-Chat |
79.43 |
24 |
开源 |
qwen-14b-chat |
79.43 |
25 |
开源 |
Baichuan2-7B-Chat |
79.08 |
26 |
商用 |
阿里通义千问 |
79.00 |
27 |
开源 |
belle-llama-13b-2m |
78.67 |
28 |
开源 |
openbuddy-zephyr-7b(new) |
77.75 |
29 |
开源 |
BlueLM-7B-Chat(new) |
77.75 |
30 |
开源 |
openbuddy-llama-65b-v8 |
76.83 |
31 |
开源 |
xverse-13b-chat |
76.58 |
32 |
商用 |
chatglm-std |
76.00 |
33 |
商用 |
chatglm-pro |
75.75 |
34 |
商用 |
讯飞星火v1.5 |
75.50 |
35 |
开源 |
openbuddy-mistral-7b-v13.1 |
75.08 |
36 |
商用 |
chatglm-130b-v1 |
74.67 |
37 |
开源 |
openbuddy-llama-30b-v7.1 |
74.33 |
38 |
商用 |
360智脑 |
74.25 |
39 |
开源 |
Llama-2-70b-chat |
73.58 |
40 |
开源 |
Qwen-7B-Chat |
73.50 |
41 |
商用 |
讯飞星火v2.0 |
72.83 |
42 |
开源 |
Baichuan-13B-Chat-v2 |
72.68 |
43 |
开源 |
chatglm3-6b |
72.18 |
44 |
开源 |
tulu-30b |
72.08 |
45 |
开源 |
belle-llama-13b-ext |
71.17 |
46 |
开源 |
internlm-chat-20b |
69.83 |
47 |
开源 |
Ziya-LLaMA-13B-v1.1 |
69.75 |
48 |
开源 |
Yi-6B-Chat |
68.67 |
49 |
开源 |
Linly-Chinese-LLaMA2-13B |
67.33 |
50 |
开源 |
ziya2-13b-chat |
67.33 |
51 |
开源 |
chatglm2-6b |
66.75 |
52 |
开源 |
Qwen-1_8B-Chat |
66.42 |
53 |
商用 |
minimax |
66.33 |
54 |
开源 |
vicuna-33b |
66.08 |
55 |
开源 |
wizardlm-13b |
60.00 |
56 |
开源 |
InternLM-Chat-7B |
59.00 |
57 |
开源 |
AquilaChat-7B |
58.00 |
58 |
开源 |
openbuddy-openllama-3b-v10 |
56.50 |
59 |
10B以下大模型排行榜
类别 |
大模型 |
分类能力 |
信息抽取能力 |
阅读理解能力 |
表格问答 |
总分 |
排名 |
开源 |
Baichuan2-7B-Chat |
88 |
76 |
83.3 |
69 |
79.1 |
1 |
开源 |
openbuddy-zephyr-7b(new) |
82 |
83 |
74.0 |
72 |
77.8 |
2 |
开源 |
BlueLM-7B-Chat(new) |
82 |
83 |
74.0 |
72 |
77.8 |
3 |
开源 |
openbuddy-mistral-7b-v13.1 |
79 |
72 |
73.3 |
76 |
75.1 |
4 |
开源 |
Qwen-7B-Chat |
89 |
72 |
74.0 |
59 |
73.5 |
5 |
开源 |
chatglm3-6b |
82 |
68 |
78.7 |
60 |
72.2 |
6 |
开源 |
Yi-6B-Chat |
73 |
71 |
66.0 |
64.7 |
68.7 |
7 |
开源 |
chatglm2-6b |
70 |
68 |
72.0 |
57 |
66.8 |
8 |
开源 |
Qwen-1_8B-Chat |
73 |
66 |
75.3 |
51.3 |
66.4 |
9 |
开源 |
InternLM-Chat-7B |
62 |
55 |
66.0 |
53 |
59.0 |
10 |
开源 |
AquilaChat-7B |
70 |
51 |
56.0 |
55 |
58.0 |
11 |
开源 |
openbuddy-openllama-3b-v10 |
64 |
60 |
61.3 |
40.7 |
56.5 |
12 |
10B~20B大模型排行榜
类别 |
大模型 |
分类能力 |
信息抽取能力 |
阅读理解能力 |
表格问答 |
总分 |
排名 |
开源 |
tigerbot-13b-chat-v4 |
85 |
82 |
80.0 |
85 |
83.0 |
1 |
开源 |
BELLE-Llama2-13B-chat-0.4M |
90 |
74 |
76.0 |
79 |
79.8 |
2 |
开源 |
Baichuan2-13B-Chat |
83 |
83 |
74.7 |
77 |
79.4 |
3 |
开源 |
qwen-14b-chat |
84 |
72 |
84.7 |
77 |
79.4 |
4 |
开源 |
belle-llama-13b-2m |
82 |
75 |
80.7 |
77 |
78.7 |
5 |
开源 |
xverse-13b-chat |
86 |
72 |
81.3 |
67 |
76.6 |
6 |
开源 |
Baichuan-13B-Chat-v2 |
82 |
69 |
72.7 |
67 |
72.7 |
7 |
开源 |
belle-llama-13b-ext |
74 |
65 |
76.7 |
69 |
71.2 |
8 |
开源 |
internlm-chat-20b |
74 |
64 |
77.3 |
64 |
69.8 |
9 |
开源 |
Ziya-LLaMA-13B-v1.1 |
72 |
69 |
80.0 |
58 |
69.8 |
10 |
开源 |
ziya2-13b-chat |
76 |
54 |
71.3 |
68 |
67.3 |
11 |
开源 |
Linly-Chinese-LLaMA2-13B |
78 |
67 |
67.3 |
57 |
67.3 |
12 |
开源 |
linly-chatflow-13b |
72 |
63 |
74.7 |
59 |
67.2 |
13 |
开源 |
wizardlm-13b |
68 |
52 |
72.0 |
48 |
60.0 |
14 |
20B以上大模型排行榜
类别 |
大模型 |
分类能力 |
信息抽取能力 |
阅读理解能力 |
表格问答 |
总分 |
排名 |
开源 |
Qwen-72B-Chat |
89 |
80 |
92.7 |
87.3 |
87.3 |
1 |
开源 |
tigerbot-70b-chat-v2 |
97 |
84 |
80.0 |
85 |
86.5 |
2 |
开源 |
openbuddy-deepseek-67b(new) |
86 |
89 |
84.7 |
85 |
86.2 |
3 |
开源 |
XVERSE-65B-Chat(new) |
83 |
84 |
84.0 |
89 |
85.0 |
4 |
开源 |
tigerbot-70b-chat-v3 |
94 |
85 |
84.0 |
71 |
83.5 |
5 |
开源 |
openbuddy-llama2-70b-v10.1 |
86 |
84 |
86.7 |
76 |
83.2 |
6 |
开源 |
Yi-34B-Chat |
88 |
82 |
84.7 |
77 |
82.9 |
7 |
开源 |
aquilachat2-34b |
77 |
82 |
88.0 |
83 |
82.5 |
8 |
开源 |
openbuddy-llama-65b-v8 |
68 |
84 |
79.3 |
76 |
76.8 |
9 |
开源 |
openbuddy-llama-30b-v7.1 |
82 |
74 |
81.3 |
60 |
74.3 |
10 |
开源 |
Llama-2-70b-chat |
86 |
66 |
73.3 |
69 |
73.6 |
11 |
开源 |
tulu-30b |
76 |
76 |
75.3 |
61 |
72.1 |
12 |
开源 |
vicuna-33b |
82 |
65 |
63.3 |
54 |
66.1 |
13 |
原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/zhongwendayuyinmoxingllmhuizong/.html