多模态相关智能AI资讯及多模态相关AI工具 | 第 3 页 | Weibo AI工具导航-AI导航新方向

首页
标签
多模态
全部文章

多模态

24篇

内容持续更新中

“天才少年”计划

2023年报告

2023排行榜

2023科技圈都在关注

3D人体建模

3D姿态跟踪

多模态大模型最全综述来了！7位微软研究员大力合作，5大主题，成文119页

多模态大模型最全综述来了！7位微软研究员大力合作，5大主题，成文119页

从专业研究员到在校学生都适用丰色发自凹非寺量子位 | 公众号 QbitAI 多模态大模型最全综述来了！由微软7位华人研究员撰写，足足119页—— 它从目前已经完善的和还处于最前沿的两类多模态…

一句话精准视频片段定位！清华新方法拿下SOTA｜已开源

一句话精准视频片段定位！清华新方法拿下SOTA｜已开源

视觉+音频双模态相辅相成陈厚伦投稿量子位 | 公众号 QbitAI 只需一句话描述，就能在一大段视频中定位到对应片段！比如描述“一个人一边下楼梯一边喝水”，通过视频画面和脚步声的匹配，新方法一…

挑战GPT-4V，浙大校友推出开源版多模态大模型，获GitHub 6k+星标

挑战GPT-4V，浙大校友推出开源版多模态大模型，获GitHub 6k+星标

性能已达到GPT-4V的85% 克雷西发自凹非寺量子位 | 公众号 QbitAI GPT-4的视觉能力还没全量放开测试，开源对手就隆重登场了。浙大竺院的一位校友，与微软研究院等机构合作推出了新…

大模型都会标注图像了，简单对话即可！来自清华&NUS

大模型都会标注图像了，简单对话即可！来自清华&NUS

提出位置建模新方法张傲投稿量子位 | 公众号 QbitAI 多模态大模型集成了检测分割模块后，抠图变得更简单了！只需用自然语言描述需求，模型就能分分钟标注出要寻找的物体，并做出文字解释。在其…

贡献榜

贡献文章数

阿力

帅气的我简直无法用语言描述！

阿力

帅气的我简直无法用语言描述！

阿强

帅气的我简直无法用语言描述！