找回密码
 立即注册
首页 业界区 安全 VideoLLaMA 3新一代前沿多模态基础模型赋能图像与视频深 ...

VideoLLaMA 3新一代前沿多模态基础模型赋能图像与视频深度理解| LLM | 计算机视觉

皇甫佳文 2025-11-18 18:30:02
1.png

01 论文概述

论文名称:VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding
—— 新一代前沿多模态基础模型,赋能图像与视频深度理解


来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册