《大模型榜单周报（2026-01-04）》

宗和玉 · 昨天 01:10

1. 本周概览

DeepSeek在市占率方面表现突出，份额增加显著。同时，通义实验室开源了GUI智能体MAI-UI，涵盖从端侧小模型到云端大模型的多个尺寸版本。此外，DeepSeek提出了名为「mHC（流形约束超连接）」的新架构，能够在增加极少训练时间开销的情况下实现显著性能提升。
2. 重点关注事件

通义实验室于12月26日开源GUI智能体MAI-UI，提供从2B端侧小模型到235B云端大模型四个尺寸版本，覆盖全场景部署需求，论文地址：https://arxiv.org/abs/2512.22047
DeepSeek于12月31日提出名为「mHC（流形约束超连接）」的新架构，在27B参数模型上，仅增加约6.7%的训练时间开销，即可实现显著性能提升，论文地址：https://arxiv.org/abs/2512.24880

3. 榜单变化

OpenRouter模型调用量变化：Grok Code Fast 1、Claude Sonnet 4.5保持前两位；小米发布的MiMo-V2-Flash (free)从第4名上升至第3名；编程调用量方面，Grok Code Fast 1保持第1，Devstral 2 2512 (free)上升6名至第2位，MiMo-V2-Flash新上榜位列第8。
OpenRouter公司市占率变化：Google保持第1位，DeepSeek份额上升3.7%（从9.6%增至13.3%），位列榜单第2名；xAI市占率下降3%（从14.4%降至11.4%），OpenAI市占率下降2.5%（从10.5%降至8.0%）；小米、MistralAI、Qwen、z-AI保持第6-9名。
大语言模型Text Arena榜单：GLM-4.7新晋榜单第17名，模型评分基于预发布测试，可能会随公开发布后社区反馈和投票的演变而发生变化。
编程能力WebDev Arena榜单：minimax-m2.1-preview新晋榜单第6名，紧跟gemini-3-flash之后，超过glm-4.7，评分基于预发布测试。
图像编辑能力Artificial Analysis Image Editing Leaderboard：Wan 2.6新晋榜单第7名，排名在Nano Banana之后。

4. OpenRouter排行榜

测评类型第一名第二名第三名模型调用量Grok Code Fast 1Claude Sonnet 4.5MiMo-V2-Flash (free)公司市占率GoogleDeepSeekAnthropic编程模型调用量Grok Code Fast 1Devstral 2 2512 (free)Gemini 3 Flash Preview各公司按不同能力领域排名汇总

测评类型领先公司大语言模型 Text ArenaGoogle、xAI、Anthropic、OpenAI、百度、智谱、阿里巴巴、月之暗面编程能力 LMArenaAnthropic、OpenAI、Google编程能力 LiveCodeBenchOpenAI、Anthropic、Google代码工程任务能力 SWE-benchLiteOpenAI、Google、阿里巴巴、月之暗面等图像编辑和生成能力 Image Edit ArenaOpenAI、Google、字节、Reve文生图能力 Text-to-Image ArenaOpenAI、Google、Black Forest Labs、腾讯、字节图像编辑和生成能力 Image Editing LeaderboardOpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve文生图能力 Text to Image LeaderboardOpenAI、Google、Black Forest Labs、字节、ImagineArtGPQA 榜单OpenAI、Google、xAI、Anthropic、阿里巴巴FrontierMath 榜单OpenAI、Google、月之暗面、Anthropic、xAIHumanity's Last Exam 榜单Google、OpenAI、AnthropicGAIA 榜单Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等关注我，第一时间掌握更多AI前沿资讯！
[code][/code]
来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

账号		自动登录	找回密码
密码			立即注册

《大模型榜单周报（2026-01-04）》

相关帖子

浏览过的版块

签约作者

《大模型榜单周报（2026-01-04）》

相关帖子

相关推荐

浏览过的版块

签约作者