多模态相关智能AI资讯及多模态相关AI工具 | 第 2 页

首页
标签
多模态
全部文章

多模态

24篇

内容持续更新中

热门

“天才少年”计划

1024

200w快充

2023年报告

2023排行榜

2023科技圈都在关注

2023财年

240w

360

3A大作

3D人体建模

3D人脸

3D动画

3D姿态跟踪

后GPT时代，多模态是最大的机会

“未来的通用人工智能一定是多模态智能。” 作者：王咏刚，SeedV实验室创始人/CEO，创新工场AI工程院执行院长编者按：ChatGPT/GPT-4的横空出世，已经彻底改变了NLP领域的研究态势，并…

阿力

AI资讯

让大模型看图比打字管用！NeurIPS 2023新研究提出多模态查询方法，准确率提升7.8%

代码已开源转载自沁园夏量子位 | 公众号 QbitAI 大模型“识图”能力都这么强了，为啥还老找错东西？例如，把长得不太像的蝙蝠和拍子搞混，又或是认不出一些数据集中的稀有鱼类…… 这是因为，我们…

阿力

AI资讯

OCR终结了？旷视提出支持文档级OCR的多模态大模型，支持中英文

还能一键Markdown 国科大&旷视团队投稿量子位 | 公众号 QbitAI 想将一份文档图片转换成Markdown格式？以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清…

阿力

AI资讯

Meta开源多感官大模型，AI用6种模态体验虚拟世界，听引擎声就会画汽车｜CVPR2023

离元宇宙又近一步？梦晨发自凹非寺量子位 | 公众号 QbitAI Meta最新6模态大模型，让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子，听到闹铃声会想到闹钟，现…

阿力

AI资讯

多模态LLM幻觉问题降低30%！业内首个“啄木鸟”免重训方法诞生｜中科大

可即插即用丰色发自凹非寺量子位 | 公众号 QbitAI 还在用指令微调解决多模态大模型的“幻觉”问题吗？比如下图中模型将橙色柯基错认为“红狗”，还指出周围还有几条。现在，中科大的一项研究…

阿力

AI资讯

「大一统」大模型论文爆火，4种模态任意输入输出，华人本科生5篇顶会一作，网友：近期最不可思议的论文

走通大模型“必经之路” 萧箫发自凹非寺量子位 | 公众号 QbitAI 多模态大模型，终于迎来“大一统”时刻！从声音、文字、图像到视频，所有模态被彻底打通，如同人脑一般，实现了真正意义上的任意输…

阿力

AI资讯

北大&腾讯打造多模态15边形战士！语言作“纽带”，拳打脚踢各模态，超越Imagebind

还自建首个有深度和红外的大规模多模态数据集 AI4Happiness 投稿量子位 | 公众号 QbitAI 北大联合腾讯打造了一个多模态15边形战士！以语言为中心，“拳打脚踢”视频、音频、深度、红…

阿力

AI资讯

中科院自动化所全模态大模型亮相，图文音视频3D传感器信号全能

还有开放服务平台梦晨发自凹非寺量子位 | 公众号 QbitAI 大模型搞多模态，做文字、图像、音视频这几样就够了？中科院自动化所说不：我们还加入了3D点云和更多传感器信号。国产大模型新成员…

阿力

AI资讯

北大最新多模态大模型开源：混合数据集训练，图像视频任务直接用

3天训完130亿参数通用VLM 一个北大投稿发送至凹非寺量子位 | 公众号 QbitAI 训完130亿参数通用视觉语言大模型，只需3天！北大和中山大学团队又出招了——在最新研究中，研究团队提出…

阿力

AI资讯

首次引入视觉定位，实现细粒度多模态联合理解，已开源&demo可玩

还认识班卓琴？西风发自凹非寺量子位 | 公众号 QbitAI 字节大模型，BuboGPT来了。支持文本、图像、音频三种模态，做到细粒度的多模态联合理解。答哪指哪，什么讲了什么没讲，一目了然：…

阿力

AI资讯

贡献榜

贡献文章数

AI人工智能大集合：教你用文心一言、腾讯混元、Kimi、百川AI、天工AI、GPT3.5、GPT4.0

151 用户在看

马斯克的 Grok AI 聊天机器人因惊人的深度伪造特朗普和泰勒·斯威夫特而迅速走红

145 用户在看

AI能直接生成海报了，我愿称Ideogram为新晋

143 用户在看

Midjourney地位不稳？AI绘图又一黑马出现，附4款产品一手实测

141 用户在看

多模态

24篇

贡献榜

阿力

阿力

阿强

搜索

近期热门

AI人工智能大集合：教你用文心一言、腾讯混元、Kimi、百川AI、天工AI、GPT3.5、GPT4.0

151 用户在看

马斯克的 Grok AI 聊天机器人因惊人的深度伪造特朗普和泰勒·斯威夫特而迅速走红

145 用户在看

AI能直接生成海报了，我愿称Ideogram为新晋

143 用户在看

Midjourney地位不稳？AI绘图又一黑马出现，附4款产品一手实测

141 用户在看

多模态

24篇

贡献榜

阿力

阿力

阿强