文生图榜单(Artificial Analysis Text to Image Leaderboard):ImagineArt 1.5 Preview超过Imagen 4 Preview位列第10名
前沿数学能力(EPOCH AI FrontierMath):DeepSeek-V3.2以22.1%得分超过Kimi K2 Thinking位列第14名
GAIA榜单:SU Zero-Shuqian Series Pro MAX新晋榜首
4. OpenRouter排行榜
测评类型第一名第二名第三名模型调用量Grok Code Fast 1Claude Sonnet 4.5Gemini 2.5 Flash公司市占率GooglexAIAnthropic编程模型调用量Grok Code Fast 1GPT-5.2Claude Sonnet 4.5各公司按不同能力领域排名汇总
测评类型领先公司大语言模型 Text ArenaGoogle、xAI、Anthropic、OpenAI、阿里巴巴、百度、月之暗面、智谱编程能力 LMArenaAnthropic、OpenAI、Google编程能力 LiveCodeBenchOpenAI、Anthropic、Google代码工程任务能力 SWE-benchLite基于Claude、Gemini、GPT、Qwen、DeepSeek开发的开源系统图像编辑和生成能力 Image Edit ArenaOpenAI、Google、字节、Reve文生图能力 Text-to-Image ArenaOpenAI、Google、Black Forest Labs、腾讯、字节图像编辑和生成能力 Image Editing LeaderboardOpenAI、Google、Black Forest Labs、字节、Pruna AI文生图能力 Text to Image LeaderboardOpenAI、Google、Black Forest Labs、字节GPQAOpenAI、Google、xAI、Anthropic、阿里巴巴FrontierMathOpenAI、Google、月之暗面、Anthropic、xAIHumanity's Last ExamGoogle、OpenAI、AnthropicGAIAMicrosoft AI Asia -Ads、Suzhou AI Lab&Shuqian Tech、LR AILab of Lenovo CTO Org、NVIDIA、ZTE-AICloud、JoinAI、ShawnAgent、AIP agent等关注我,第一时间掌握更多AI前沿资讯!