Skip to content

Latest commit

 

History

History
98 lines (95 loc) · 3.26 KB

gaokao-physics.md

File metadata and controls

98 lines (95 loc) · 3.26 KB
类别 大模型 高考物理 排名
开源 DeepSeek-R1(new) 91.6 1
商用 hunyuan-large 87.1 2
商用 hunyuan-turbo 86.0 3
商用 GLM-4-Plus 84.0 4
商用 gemini-2.0-flash-exp 82.5 5
开源 DeepSeek-R1-Distill-Qwen-32B(new) 81.7 6
开源 DeepSeek-R1-Distill-Llama-70B(new) 81.4 7
商用 Doubao-pro-32k 80.9 8
开源 qwq-32b-preview 80.4 9
商用 GLM4 80.0 10
商用 360gpt2-o1 80.0 11
商用 Claude-3.5-Sonnet 80.0 12
商用 qwen-plus 79.9 13
商用 ERNIE-4.0 78.0 14
商用 qwen-long 77.3 15
商用 gemini-1.5-pro 77.3 16
商用 360gpt2-pro 77.2 17
商用 360gpt-pro 76.7 18
商用 qwen-max 76.0 19
商用 gpt-4o 76.0 20
商用 ERNIE-3.5-8K 75.3 21
开源 qwen2.5-72b-instruct 74.7 22
商用 abab7-chat-preview 74.2 23
开源 DeepSeek-R1-Distill-Qwen-14B(new) 74.2 24
开源 qwen2.5-32b-instruct 73.2 25
商用 qwen-turbo 72.7 26
开源 deepseek-chat-v3 72.2 27
商用 xunfei-spark-max 71.6 28
开源 DeepSeek-R1-Distill-Qwen-7B(new) 70.6 29
商用 SenseChat-5 70.0 30
商用 GLM-4-Air 69.6 31
商用 GLM-4-AirX 69.6 32
商用 GLM-4-Long 69.6 33
开源 qwen2.5-14b-instruct 69.6 34
商用 360gpt-turbo 69.1 35
商用 xunfei-spark-pro 69.1 36
开源 glm-4-9b-chat 69.1 37
商用 GLM-4-Flash 69.1 38
商用 ERNIE-4.0-Turbo-8K 68.0 39
商用 xunfei-4.0Ultra 68.0 40
商用 yi-lightning 67.5 41
商用 mistral-large 66.5 42
商用 gemini-1.5-flash 66.0 43
商用 Baichuan4 64.0 44
开源 qwen2.5-7b-instruct 63.9 45
商用 Baichuan4-Turbo 62.9 46
开源 Hermes-3-Llama-3.1-405B 61.3 47
商用 moonshot-v1-8k 60.8 48
开源 Llama-3.3-70B-Instruct-fp8 59.3 49
商用 SenseChat-Turbo 58.8 50
开源 internlm2_5-20b-chat 55.7 51
商用 step-1-8k 55.2 52
开源 phi-4 54.1 53
商用 gpt-4o-mini 54.1 54
开源 Yi-1.5-34B-Chat 53.6 55
开源 Llama-3.3-70B-Instruct 53.6 56
商用 Doubao-lite-32k 52.6 57
商用 abab6.5s-chat 52.1 58
开源 Llama-3.1-Nemotron-70B-Instruct-fp8 52.1 59
商用 gemini-1.5-flash-8b 52.1 60
商用 Baichuan4-Air 51.5 61
开源 Meta-Llama-3.1-405B-Instruct 47.4 62
商用 step-1-flash 46.9 63
开源 internlm2_5-7b-chat 46.4 64
商用 hunyuan-standard 45.9 65
开源 DeepSeek-R1-Distill-Llama-8B(new) 45.4 66
开源 Meta-Llama-3.1-70B-Instruct-fp8 43.3 67
商用 ERNIE-Speed-8K 42.8 68
开源 gemma-2-27b-it 41.8 69
开源 qwen2.5-3b-instruct 40.7 70
商用 mistral-small 40.7 71
开源 Yi-1.5-9B-Chat 39.7 72
开源 WizardLM-2-8x22B 39.7 73
开源 Llama-3.1-70B-Instruct 38.7 74
开源 DeepSeek-R1-Distill-Qwen-1.5B(new) 37.6 75
开源 Mistral-Nemo-Instruct-2407 35.6 76
商用 gemini-1.0-pro 35.1 77
开源 gemma-2-9b-it 33.0 78
开源 Meta-Llama-3.1-8B-Instruct-fp8 33.0 79
商用 ministral-8b 31.6 80
商用 SenseChat-v4 30.9 81
开源 qwen2.5-1.5b-instruct 30.9 82
开源 Llama-3.2-3B-Instruct 30.4 83
商用 ministral-3b 30.1 84
开源 Llama-3.1-8B-Instruct 29.9 85
开源 Mixtral-8x7B-Instruct-v0.1 28.4 86
开源 Llama-3.2-1B-Instruct 21.6 87
开源 qwen2.5-0.5b-instruct 21.1 88
开源 Mistral-7B-Instruct-v0.3 17.5 89
商用 o1-mini / 90
商用 o1-preview / 91
开源 qwen2.5-math-72b-instruct / 92

lin