1. 本周概览
DeepSeek在市占率方面表现突出,份额增加显著。同时,通义实验室开源了GUI智能体MAI-UI,涵盖从端侧小模型到云端大模型的多个尺寸版本。此外,DeepSeek提出了名为「mHC(流形约束超连接)」的新架构,能够在增加极少训练时间开销的情况下实现显著性能提升。
2. 重点关注事件
- 通义实验室于12月26日开源GUI智能体MAI-UI,提供从2B端侧小模型到235B云端大模型四个尺寸版本,覆盖全场景部署需求,论文地址:https://arxiv.org/abs/2512.22047
- DeepSeek于12月31日提出名为「mHC(流形约束超连接)」的新架构,在27B参数模型上,仅增加约6.7%的训练时间开销,即可实现显著性能提升,论文地址:https://arxiv.org/abs/2512.24880
3. 榜单变化
- OpenRouter模型调用量变化:Grok Code Fast 1、Claude Sonnet 4.5保持前两位;小米发布的MiMo-V2-Flash (free)从第4名上升至第3名;编程调用量方面,Grok Code Fast 1保持第1,Devstral 2 2512 (free)上升6名至第2位,MiMo-V2-Flash新上榜位列第8。
- OpenRouter公司市占率变化:Google保持第1位,DeepSeek份额上升3.7%(从9.6%增至13.3%),位列榜单第2名;xAI市占率下降3%(从14.4%降至11.4%),OpenAI市占率下降2.5%(从10.5%降至8.0%);小米、MistralAI、Qwen、z-AI保持第6-9名。
- 大语言模型Text Arena榜单:GLM-4.7新晋榜单第17名,模型评分基于预发布测试,可能会随公开发布后社区反馈和投票的演变而发生变化。
- 编程能力WebDev Arena榜单:minimax-m2.1-preview新晋榜单第6名,紧跟gemini-3-flash之后,超过glm-4.7,评分基于预发布测试。
- 图像编辑能力Artificial Analysis Image Editing Leaderboard:Wan 2.6新晋榜单第7名,排名在Nano Banana之后。
4. OpenRouter排行榜
测评类型第一名第二名第三名模型调用量Grok Code Fast 1Claude Sonnet 4.5MiMo-V2-Flash (free)公司市占率GoogleDeepSeekAnthropic编程模型调用量Grok Code Fast 1Devstral 2 2512 (free)Gemini 3 Flash Preview各公司按不同能力领域排名汇总
测评类型领先公司大语言模型 Text ArenaGoogle、xAI、Anthropic、OpenAI、百度、智谱、阿里巴巴、月之暗面编程能力 LMArenaAnthropic、OpenAI、Google编程能力 LiveCodeBenchOpenAI、Anthropic、Google代码工程任务能力 SWE-benchLiteOpenAI、Google、阿里巴巴、月之暗面等图像编辑和生成能力 Image Edit ArenaOpenAI、Google、字节、Reve文生图能力 Text-to-Image ArenaOpenAI、Google、Black Forest Labs、腾讯、字节图像编辑和生成能力 Image Editing LeaderboardOpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve文生图能力 Text to Image LeaderboardOpenAI、Google、Black Forest Labs、字节、ImagineArtGPQA 榜单OpenAI、Google、xAI、Anthropic、阿里巴巴FrontierMath 榜单OpenAI、Google、月之暗面、Anthropic、xAIHumanity's Last Exam 榜单Google、OpenAI、AnthropicGAIA 榜单Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等关注我,第一时间掌握更多AI前沿资讯!
[code][/code]
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
|
|
|
|
|
相关推荐
|
|
|