内容持续更新中
基于Vicuna-1.5 7B 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 字节&复旦大学多模态理解大模型来了: 可以精确定位到视频中特定事件的发生时间。 比如在下面这个视频中: 狗…