阅读理解能力排行榜

阅读理解能力是一种符合能力，考查针对给定信息的理解能力。依据给定信息的种类，可以细分为：文章问答、表格问答、对话问答……

类别	大模型	阅读理解能力	排名
商用	gpt4	99.3	1
商用	GLM4(new)	97.3	2
商用	chatgpt-3.5	95.3	3
商用	阿里qwen-max(new)	95.3	4
商用	文心4.0	94.7	5
商用	微软new-bing	94.0	6
开源	Qwen-72B-Chat	92.7	7
商用	chatglm-turbo	90.0	8
商用	文心一言v2.2	88.0	9
商用	Baichuan2-53B	88.0	10
商用	讯飞星火v3	88.0	11
开源	aquilachat2-34b	88.0	12
开源	openbuddy-llama2-70b-v10.1	86.7	13
商用	谷歌bard	85.3	14
开源	openbuddy-deepseek-67b(new)	84.7	15
开源	Yi-34B-Chat	84.7	16
开源	qwen-14b-chat	84.7	17
开源	tigerbot-70b-chat-v3	84.0	18
开源	XVERSE-65B-Chat(new)	84.0	19
开源	Baichuan2-7B-Chat	83.3	20
商用	商汤senseChat	82.7	21
开源	openbuddy-llama-30b-v7.1	81.3	22
开源	xverse-13b-chat	81.3	23
商用	阿里通义千问	81.0	24
开源	belle-llama-13b-2m	80.7	25
开源	tigerbot-70b-chat-v2	80.0	26
开源	tigerbot-13b-chat-v4	80.0	27
商用	字节跳动豆包	80.0	28
开源	Ziya-LLaMA-13B-v1.1	80.0	29
开源	openbuddy-llama-65b-v8	79.3	30
商用	讯飞星火v2.0	79.3	31
开源	chatglm3-6b	78.7	32
开源	internlm-chat-20b	77.3	33
开源	belle-llama-13b-ext	76.7	34
商用	讯飞星火v1.5	76.0	35
开源	BELLE-Llama2-13B-chat-0.4M	76.0	36
商用	chatglm-std	76.0	37
商用	chatglm-pro	76.0	38
开源	Qwen-1_8B-Chat	75.3	39
开源	tulu-30b	75.3	40
开源	Baichuan2-13B-Chat	74.7	41
开源	openbuddy-zephyr-7b(new)	74.0	42
开源	BlueLM-7B-Chat(new)	74.0	43
开源	Qwen-7B-Chat	74.0	44
商用	360智脑	74.0	45
开源	openbuddy-mistral-7b-v13.1	73.3	46
开源	Llama-2-70b-chat	73.3	47
商用	minimax	73.3	48
开源	Baichuan-13B-Chat-v2	72.7	49
商用	chatglm-130b-v1	72.7	50
开源	chatglm2-6b	72.0	51
开源	wizardlm-13b	72.0	52
开源	ziya2-13b-chat	71.3	53
开源	Linly-Chinese-LLaMA2-13B	67.3	54
开源	Yi-6B-Chat	66.0	55
开源	InternLM-Chat-7B	66.0	56
开源	vicuna-33b	63.3	57
开源	openbuddy-openllama-3b-v10	61.3	58
开源	AquilaChat-7B	56.0	59