Skip to content

Latest commit

 

History

History
91 lines (88 loc) · 2.94 KB

table-qa.md

File metadata and controls

91 lines (88 loc) · 2.94 KB
类别 大模型 数据分析能力 排名
商用 gpt-4o 100.0 1
商用 gpt-4o-mini 100.0 2
商用 ERNIE-3.5-8K 100.0 3
商用 yi-lightning 100.0 4
开源 deepseek-chat-v3 100.0 5
开源 Llama-3.1-Nemotron-70B-Instruct-fp8 100.0 6
开源 Hermes-3-Llama-3.1-405B 100.0 7
商用 360gpt2-o1 100.0 8
商用 360gpt-turbo 100.0 9
商用 Baichuan4-Turbo 100.0 10
商用 gemini-2.0-flash-exp 100.0 11
商用 step-1-flash 100.0 12
开源 Llama-3.3-70B-Instruct-fp8 100.0 13
商用 360gpt-pro 100.0 14
商用 360gpt2-pro 100.0 15
商用 step-1-8k 100.0 16
商用 gemini-1.0-pro 99.3 17
商用 gemini-1.5-pro 99.3 18
商用 GLM-4-Plus 99.3 19
商用 qwen-max 99.3 20
商用 ministral-8b 99.3 21
商用 gemini-1.5-flash-8b 99.3 22
商用 Claude-3.5-Sonnet 99.3 23
开源 Llama-3.3-70B-Instruct 99.3 24
商用 ERNIE-4.0-Turbo-8K 98.7 25
开源 Meta-Llama-3.1-405B-Instruct 98.7 26
商用 GLM4 98.0 27
开源 qwen2.5-14b-instruct 98.0 28
开源 internlm2_5-20b-chat 97.3 29
商用 gemini-1.5-flash 97.3 30
商用 abab7-chat-preview 97.3 31
商用 hunyuan-turbo 97.3 32
商用 SenseChat-5 97.3 33
开源 phi-4 97.3 34
开源 WizardLM-2-8x22B 97.3 35
开源 Meta-Llama-3.1-70B-Instruct-fp8 97.3 36
商用 Baichuan4-Air 97.3 37
商用 mistral-large 97.3 38
商用 mistral-small 96.7 39
商用 hunyuan-large 96.7 40
商用 GLM-4-Long 96.7 41
开源 gemma-2-27b-it 96.7 42
商用 Baichuan4 95.3 43
商用 ERNIE-4.0 94.0 44
开源 Mistral-Nemo-Instruct-2407 93.3 45
开源 Meta-Llama-3.1-8B-Instruct-fp8 93.3 46
商用 xunfei-4.0Ultra 92.7 47
开源 qwen2.5-72b-instruct 92.7 48
开源 qwen2.5-7b-instruct 91.3 49
开源 qwen2.5-32b-instruct 91.3 50
开源 Llama-3.1-70B-Instruct 90.7 51
开源 Mixtral-8x7B-Instruct-v0.1 90.0 52
商用 ERNIE-Speed-8K 89.3 53
商用 moonshot-v1-8k 89.3 54
开源 Llama-3.2-3B-Instruct 88.7 55
商用 GLM-4-Air 88.0 56
商用 abab6.5s-chat 88.0 57
商用 GLM-4-AirX 88.0 58
开源 gemma-2-9b-it 87.3 59
商用 xunfei-spark-max 87.3 60
商用 SenseChat-v4 86.7 61
商用 qwen-long 86.7 62
商用 Doubao-pro-32k 86.7 63
商用 SenseChat-Turbo 86.0 64
商用 xunfei-spark-pro 86.0 65
商用 hunyuan-standard 85.3 66
商用 qwen-plus 84.0 67
开源 Llama-3.1-8B-Instruct 84.0 68
商用 ministral-3b 84.0 69
开源 Yi-1.5-34B-Chat 83.3 70
开源 Mistral-7B-Instruct-v0.3 83.3 71
开源 internlm2_5-7b-chat 83.3 72
开源 qwen2.5-3b-instruct 83.3 73
商用 GLM-4-Flash 82.0 74
开源 glm-4-9b-chat 82.0 75
开源 Yi-1.5-9B-Chat 80.0 76
商用 qwen-turbo 76.0 77
商用 Doubao-lite-32k 64.7 78
开源 qwen2.5-1.5b-instruct 63.3 79
开源 Llama-3.2-1B-Instruct 54.0 80
开源 qwen2.5-0.5b-instruct 46.0 81
开源 qwen2.5-math-72b-instruct / 82
开源 qwq-32b-preview / 83
商用 o1-mini / 84
商用 o1-preview / 85

lin