综合能力排行榜

综合能力得分为分类能力、信息抽取能力、阅读理解能力、数据分析能力四者得分的平均值。

类别	大模型	总分	排名
商用	gpt4	96.08	1
商用	chatgpt-3.5	93.58	2
商用	微软new-bing	93.00	3
商用	GLM4(new)	92.33	4
商用	文心4.0	91.43	5
商用	阿里qwen-max(new)	88.65	6
开源	Qwen-72B-Chat	87.25	7
开源	tigerbot-70b-chat-v2	86.50	8
商用	文心一言v2.2	86.50	9
开源	openbuddy-deepseek-67b(new)	86.18	10
商用	讯飞星火v3	85.75	11
开源	XVERSE-65B-Chat(new)	85.00	12
商用	谷歌bard	84.08	13
开源	tigerbot-70b-chat-v3	83.50	14
开源	openbuddy-llama2-70b-v10.1	83.18	15
开源	tigerbot-13b-chat-v4	83.00	16
商用	chatglm-turbo	83.00	17
开源	Yi-34B-Chat	82.93	18
开源	aquilachat2-34b	82.50	19
商用	商汤senseChat	81.93	20
商用	Baichuan2-53B	81.75	21
开源	BELLE-Llama2-13B-chat-0.4M	79.75	22
商用	字节跳动豆包	79.50	23
开源	Baichuan2-13B-Chat	79.43	24
开源	qwen-14b-chat	79.43	25
开源	Baichuan2-7B-Chat	79.08	26
商用	阿里通义千问	79.00	27
开源	belle-llama-13b-2m	78.67	28
开源	openbuddy-zephyr-7b(new)	77.75	29
开源	BlueLM-7B-Chat(new)	77.75	30
开源	openbuddy-llama-65b-v8	76.83	31
开源	xverse-13b-chat	76.58	32
商用	chatglm-std	76.00	33
商用	chatglm-pro	75.75	34
商用	讯飞星火v1.5	75.50	35
开源	openbuddy-mistral-7b-v13.1	75.08	36
商用	chatglm-130b-v1	74.67	37
开源	openbuddy-llama-30b-v7.1	74.33	38
商用	360智脑	74.25	39
开源	Llama-2-70b-chat	73.58	40
开源	Qwen-7B-Chat	73.50	41
商用	讯飞星火v2.0	72.83	42
开源	Baichuan-13B-Chat-v2	72.68	43
开源	chatglm3-6b	72.18	44
开源	tulu-30b	72.08	45
开源	belle-llama-13b-ext	71.17	46
开源	internlm-chat-20b	69.83	47
开源	Ziya-LLaMA-13B-v1.1	69.75	48
开源	Yi-6B-Chat	68.67	49
开源	Linly-Chinese-LLaMA2-13B	67.33	50
开源	ziya2-13b-chat	67.33	51
开源	chatglm2-6b	66.75	52
开源	Qwen-1_8B-Chat	66.42	53
商用	minimax	66.33	54
开源	vicuna-33b	66.08	55
开源	wizardlm-13b	60.00	56
开源	InternLM-Chat-7B	59.00	57
开源	AquilaChat-7B	58.00	58
开源	openbuddy-openllama-3b-v10	56.50	59

10B以下大模型排行榜

类别	大模型	分类能力	信息抽取能力	阅读理解能力	表格问答	总分	排名
开源	Baichuan2-7B-Chat	88	76	83.3	69	79.1	1
开源	openbuddy-zephyr-7b(new)	82	83	74.0	72	77.8	2
开源	BlueLM-7B-Chat(new)	82	83	74.0	72	77.8	3
开源	openbuddy-mistral-7b-v13.1	79	72	73.3	76	75.1	4
开源	Qwen-7B-Chat	89	72	74.0	59	73.5	5
开源	chatglm3-6b	82	68	78.7	60	72.2	6
开源	Yi-6B-Chat	73	71	66.0	64.7	68.7	7
开源	chatglm2-6b	70	68	72.0	57	66.8	8
开源	Qwen-1_8B-Chat	73	66	75.3	51.3	66.4	9
开源	InternLM-Chat-7B	62	55	66.0	53	59.0	10
开源	AquilaChat-7B	70	51	56.0	55	58.0	11
开源	openbuddy-openllama-3b-v10	64	60	61.3	40.7	56.5	12

10B~20B大模型排行榜

类别	大模型	分类能力	信息抽取能力	阅读理解能力	表格问答	总分	排名
开源	tigerbot-13b-chat-v4	85	82	80.0	85	83.0	1
开源	BELLE-Llama2-13B-chat-0.4M	90	74	76.0	79	79.8	2
开源	Baichuan2-13B-Chat	83	83	74.7	77	79.4	3
开源	qwen-14b-chat	84	72	84.7	77	79.4	4
开源	belle-llama-13b-2m	82	75	80.7	77	78.7	5
开源	xverse-13b-chat	86	72	81.3	67	76.6	6
开源	Baichuan-13B-Chat-v2	82	69	72.7	67	72.7	7
开源	belle-llama-13b-ext	74	65	76.7	69	71.2	8
开源	internlm-chat-20b	74	64	77.3	64	69.8	9
开源	Ziya-LLaMA-13B-v1.1	72	69	80.0	58	69.8	10
开源	ziya2-13b-chat	76	54	71.3	68	67.3	11
开源	Linly-Chinese-LLaMA2-13B	78	67	67.3	57	67.3	12
开源	linly-chatflow-13b	72	63	74.7	59	67.2	13
开源	wizardlm-13b	68	52	72.0	48	60.0	14

20B以上大模型排行榜

类别	大模型	分类能力	信息抽取能力	阅读理解能力	表格问答	总分	排名
开源	Qwen-72B-Chat	89	80	92.7	87.3	87.3	1
开源	tigerbot-70b-chat-v2	97	84	80.0	85	86.5	2
开源	openbuddy-deepseek-67b(new)	86	89	84.7	85	86.2	3
开源	XVERSE-65B-Chat(new)	83	84	84.0	89	85.0	4
开源	tigerbot-70b-chat-v3	94	85	84.0	71	83.5	5
开源	openbuddy-llama2-70b-v10.1	86	84	86.7	76	83.2	6
开源	Yi-34B-Chat	88	82	84.7	77	82.9	7
开源	aquilachat2-34b	77	82	88.0	83	82.5	8
开源	openbuddy-llama-65b-v8	68	84	79.3	76	76.8	9
开源	openbuddy-llama-30b-v7.1	82	74	81.3	60	74.3	10
开源	Llama-2-70b-chat	86	66	73.3	69	73.6	11
开源	tulu-30b	76	76	75.3	61	72.1	12
开源	vicuna-33b	82	65	63.3	54	66.1	13