Skip to content

Latest commit

 

History

History
91 lines (88 loc) · 2.92 KB

gaokao-math.md

File metadata and controls

91 lines (88 loc) · 2.92 KB
类别 大模型 高考数学 排名
商用 hunyuan-turbo 98.0 1
商用 360gpt2-o1 88.0 2
商用 xunfei-4.0Ultra 87.8 3
开源 qwq-32b-preview 87.7 4
商用 xunfei-spark-max 87.6 5
商用 Doubao-pro-32k 86.6 6
开源 deepseek-chat-v3 86.0 7
商用 360gpt-pro 84.2 8
商用 gemini-2.0-flash-exp 84.1 9
商用 GLM-4-Plus 84.0 10
商用 360gpt2-pro 83.1 11
商用 hunyuan-large 82.1 12
商用 qwen-max 82.0 13
商用 gemini-1.5-pro 81.5 14
开源 qwen2.5-32b-instruct 79.5 15
商用 qwen-long 79.3 16
商用 qwen-plus 78.4 17
商用 gpt-4o 78.0 18
开源 qwen2.5-72b-instruct 78.0 19
商用 mistral-large 76.1 20
商用 ERNIE-4.0 76.0 21
商用 qwen-turbo 75.4 22
商用 360gpt-turbo 74.6 23
商用 gemini-1.5-flash 74.6 24
商用 abab7-chat-preview 74.1 25
商用 ERNIE-4.0-Turbo-8K 74.0 26
开源 qwen2.5-14b-instruct 73.5 27
商用 moonshot-v1-8k 73.5 28
开源 phi-4 72.8 29
商用 yi-lightning 72.2 30
商用 SenseChat-5 72.0 31
开源 qwen2.5-7b-instruct 71.1 32
商用 Claude-3.5-Sonnet 70.0 33
商用 ERNIE-3.5-8K 69.6 34
商用 Baichuan4-Turbo 69.2 35
商用 GLM-4-Long 64.9 36
商用 gpt-4o-mini 64.4 37
商用 GLM4 64.0 38
商用 hunyuan-standard 63.4 39
商用 GLM-4-AirX 63.1 40
商用 GLM-4-Air 62.5 41
商用 SenseChat-Turbo 62.3 42
商用 step-1-8k 61.9 43
开源 Llama-3.3-70B-Instruct 61.6 44
开源 Llama-3.3-70B-Instruct-fp8 61.4 45
商用 gemini-1.5-flash-8b 60.6 46
开源 glm-4-9b-chat 59.5 47
开源 qwen2.5-3b-instruct 59.5 48
开源 internlm2_5-7b-chat 58.0 49
商用 mistral-small 57.8 50
商用 GLM-4-Flash 56.9 51
开源 internlm2_5-20b-chat 55.2 52
开源 Hermes-3-Llama-3.1-405B 54.1 53
商用 Doubao-lite-32k 53.2 54
商用 ministral-8b 52.5 55
商用 xunfei-spark-pro 52.4 56
商用 abab6.5s-chat 50.2 57
商用 Baichuan4 50.0 58
商用 ministral-3b 48.0 59
开源 qwen2.5-1.5b-instruct 47.0 60
开源 WizardLM-2-8x22B 47.0 61
开源 Yi-1.5-34B-Chat 45.5 62
商用 Baichuan4-Air 44.2 63
开源 Meta-Llama-3.1-405B-Instruct 42.9 64
商用 step-1-flash 42.2 65
开源 gemma-2-27b-it 42.2 66
商用 ERNIE-Speed-8K 40.7 67
开源 Mistral-Nemo-Instruct-2407 40.5 68
开源 Yi-1.5-9B-Chat 40.1 69
开源 gemma-2-9b-it 39.4 70
开源 Meta-Llama-3.1-70B-Instruct-fp8 38.4 71
开源 Llama-3.1-70B-Instruct 37.9 72
开源 Llama-3.1-Nemotron-70B-Instruct-fp8 36.4 73
开源 Llama-3.1-8B-Instruct 30.0 74
开源 qwen2.5-0.5b-instruct 29.5 75
开源 Meta-Llama-3.1-8B-Instruct-fp8 29.3 76
开源 Llama-3.2-3B-Instruct 28.9 77
商用 gemini-1.0-pro 28.4 78
开源 Mixtral-8x7B-Instruct-v0.1 28.2 79
商用 SenseChat-v4 27.2 80
开源 Llama-3.2-1B-Instruct 22.8 81
开源 Mistral-7B-Instruct-v0.3 21.1 82
开源 qwen2.5-math-72b-instruct / 83
商用 o1-mini / 84
商用 o1-preview / 85

lin