🏆 30题LLM综合能力总榜

统一 rubric · 三裁判独立评分 · 全部实打实测

🏅 付费模型(Round 3) 🌿 免费模型(Groq) 🆕 含各维度单独榜单 📋 评测方法论
📊 总榜(3裁判平均,满分100)
排名 模型 来源 总分 相对百分比
⚖️ 各裁判评分详情
模型 kimi 裁判 minimax 裁判 qwen 裁判 平均
📐 各维度单独榜单