中文(支持中文的)大语言模型(LLM)汇总

阅读理解能力排行榜

阅读理解能力是一种符合能力,考查针对给定信息的理解能力。 依据给定信息的种类,可以细分为:文章问答、表格问答、对话问答……

中文(支持中文的)大语言模型(LLM)汇总

类别 大模型 阅读理解能力 排名
商用 gpt4 99.3 1
商用 GLM4(new) 97.3 2
商用 chatgpt-3.5 95.3 3
商用 阿里qwen-max(new) 95.3 4
商用 文心4.0 94.7 5
商用 微软new-bing 94.0 6
开源 Qwen-72B-Chat 92.7 7
商用 chatglm-turbo 90.0 8
商用 文心一言v2.2 88.0 9
商用 Baichuan2-53B 88.0 10
商用 讯飞星火v3 88.0 11
开源 aquilachat2-34b 88.0 12
开源 openbuddy-llama2-70b-v10.1 86.7 13
商用 谷歌bard 85.3 14
开源 openbuddy-deepseek-67b(new) 84.7 15
开源 Yi-34B-Chat 84.7 16
开源 qwen-14b-chat 84.7 17
开源 tigerbot-70b-chat-v3 84.0 18
开源 XVERSE-65B-Chat(new) 84.0 19
开源 Baichuan2-7B-Chat 83.3 20
商用 商汤senseChat 82.7 21
开源 openbuddy-llama-30b-v7.1 81.3 22
开源 xverse-13b-chat 81.3 23
商用 阿里通义千问 81.0 24
开源 belle-llama-13b-2m 80.7 25
开源 tigerbot-70b-chat-v2 80.0 26
开源 tigerbot-13b-chat-v4 80.0 27
商用 字节跳动豆包 80.0 28
开源 Ziya-LLaMA-13B-v1.1 80.0 29
开源 openbuddy-llama-65b-v8 79.3 30
商用 讯飞星火v2.0 79.3 31
开源 chatglm3-6b 78.7 32
开源 internlm-chat-20b 77.3 33
开源 belle-llama-13b-ext 76.7 34
商用 讯飞星火v1.5 76.0 35
开源 BELLE-Llama2-13B-chat-0.4M 76.0 36
商用 chatglm-std 76.0 37
商用 chatglm-pro 76.0 38
开源 Qwen-1_8B-Chat 75.3 39
开源 tulu-30b 75.3 40
开源 Baichuan2-13B-Chat 74.7 41
开源 openbuddy-zephyr-7b(new) 74.0 42
开源 BlueLM-7B-Chat(new) 74.0 43
开源 Qwen-7B-Chat 74.0 44
商用 360智脑 74.0 45
开源 openbuddy-mistral-7b-v13.1 73.3 46
开源 Llama-2-70b-chat 73.3 47
商用 minimax 73.3 48
开源 Baichuan-13B-Chat-v2 72.7 49
商用 chatglm-130b-v1 72.7 50
开源 chatglm2-6b 72.0 51
开源 wizardlm-13b 72.0 52
开源 ziya2-13b-chat 71.3 53
开源 Linly-Chinese-LLaMA2-13B 67.3 54
开源 Yi-6B-Chat 66.0 55
开源 InternLM-Chat-7B 66.0 56
开源 vicuna-33b 63.3 57
开源 openbuddy-openllama-3b-v10 61.3 58
开源 AquilaChat-7B 56.0 59

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/zhongwendayuyinmoxingllmhuizong/.html

(0)
打赏 微信扫一扫 微信扫一扫
朋远方的头像朋远方
上一篇 2024年2月28日 下午3:16
下一篇 2024年2月28日 下午6:49

相关推荐

发表回复

登录后才能评论