内容持续更新中
“比ChatGPT更接近AGI” 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 为应对新一轮技术竞赛,谷歌还在不断出后手。 这两天,一个名叫PaLM-E的大模型在AI学术圈疯狂刷屏。 它能只需…
业内首次证据证明 白交 发自 凹非寺 量子位 | 公众号 QbitAI 语言模型击败扩散模型,在视频和图像生成上实现双SOTA! 这是来自谷歌CMU最新研究成果。 据介绍,这是语言模型第一次在标志性的…
甚至部分指标比13B的模型还要好 小炒汤圆 投稿量子位 | 公众号 QbitAI 混合专家(MoE)架构已支持多模态大模型,开发者终于不用卷参数量了! 北大联合中山大学、腾讯等机构推出的新模型MoE-…
“未来的通用人工智能一定是多模态智能。” 作者:王咏刚,SeedV实验室创始人/CEO,创新工场AI工程院执行院长 编者按:ChatGPT/GPT-4的横空出世,已经彻底改变了NLP领域的研究态势,并…
代码已开源 转载自 沁园夏量子位 | 公众号 QbitAI 大模型“识图”能力都这么强了,为啥还老找错东西? 例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有鱼类…… 这是因为,我们…
还能一键Markdown 国科大&旷视团队 投稿 量子位 | 公众号 QbitAI 想将一份文档图片转换成Markdown格式? 以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清…
离元宇宙又近一步? 梦晨 发自 凹非寺量子位 | 公众号 QbitAI Meta最新6模态大模型,让AI以更接近人类的方式理解这个世界。 比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现…
可即插即用 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 还在用指令微调解决多模态大模型的“幻觉”问题吗? 比如下图中模型将橙色柯基错认为“红狗”,还指出周围还有几条。 现在,中科大的一项研究…
走通大模型“必经之路” 萧箫 发自 凹非寺量子位 | 公众号 QbitAI 多模态大模型,终于迎来“大一统”时刻! 从声音、文字、图像到视频,所有模态被彻底打通,如同人脑一般,实现了真正意义上的任意输…
还自建首个有深度和红外的大规模多模态数据集 AI4Happiness 投稿 量子位 | 公众号 QbitAI 北大联合腾讯打造了一个多模态15边形战士! 以语言为中心,“拳打脚踢”视频、音频、深度、红…