AI时代的新型基础设施

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

中文领域的“大大大大大”模型,开源开放了!

一口气10+个大模型联手登场,能写诗、写作文、写代码,还能画画、做视频、看图说话。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

戳进主页,不仅代码可下载,Notebook、在线Demo也已就位。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

直接就是在线可玩,开箱即用

炼丹师福音还不止如此。

在这个名为魔搭ModelScope开源社区里,你甚至可以1行代码就实现模型推理

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

△一行pipeline完成模型推理

10行代码搞定调优训练(finetune)

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

不得不说,这波开源有点东西。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

如此大手笔,确实也并非哪家研究机构的SOLO,而是由国内AI工业界和学界联合推动:

阿里达摩院与CCF开源发展委员会共同发起,首批合作机构包括澜舟科技、智谱AI、深势科技、中国科学技术大学、浙江大学等,阵容蔚为壮观。

更多细节,咱们一起研究研究。

以模型为核心的中文AI开源社区

要说魔搭ModelScope有何不同之处,答案其实就在社区名字里:以模型为中心,搭建AI应用服务。

因此社区刚成立,就已经有300+模型上线,其中包括10多个大模型和150+ SOTA模型。并且其中1/3都支持中文

就说最近大火的AI画画,在模型库里一搜,就能找到对应的模型。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

点进可体验的通义-文本生成图像大模型,即使你完全是AI小白,也能直接体验。

比如让AI生成一张“小鸡戴墨镜唱歌跳舞”的图片。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

结果是这样的:

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

还有更潮酷的。

输入“一张柯基犬在时代广场骑自行车的照片。它戴着墨镜和沙滩帽”,就能得到:

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

你想要什么样的图片?自己来试试吧,下面是传送门:

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

红极一时的GPT-3中文复刻版也在魔搭社区上架了,写起古诗来可谓有模有样。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

在AI for Science方面,“中国版AlphaFold2”——深势科技的Uni-Fold同样亮相魔搭。

输入蛋白质单体的一级结构,就能在线预测蛋白质的三级结构啦。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

此外,会写爽文、以10亿参数轻量化模型登顶CLUE(中文语言理解榜单)的澜舟科技孟子系列模型智谱AI同时支持101种语言的预训练模型……都能在魔搭上找到并体验。

并且正如前文所说,魔搭提供的不仅仅是模型下载和使用,还把环境安装、推理验证、训练调优、模型部署的一站式服务都搭好了。

环境安装方面,魔搭支持本地环境快捷安装,提供了Python whl包安装和源码安装。

同时也支持云端Notebook免安装,一键就能开启在线Notebook实训平台。

模型推理方面,基于魔搭提供的封装Python SDK,开发者只写一行代码,就能快速验证和使用模型。

模型调优方面,魔搭同样提供了简单易用的调用接口,以及灵活的配置文件设计,实现了10行代码运行一个调优任务。

最后,在模型部署上,魔搭支持云端、本地、设备端等多种部署方式。

值得一提的是,魔搭还给开发者们提供了不少免费算力资源。

其中,8核32G的CPU资源不仅免费,还可无限续杯。

GPU算力方面,则有16小时的免费V100资源可用。并且多贡献多得。

魔搭社区,为什么是现在?

那么,问题来了,这么多家产业界和学术界研究机构,怎么就凑到一块儿搞起新的开源平台来了?

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

究其根本,其实还是一个AI落地应用,尤其是AI大模型产业化应用的问题。

一方面,我们能看到,AI技术正在各个领域迅猛发展。在顶尖的学界、产业界研究机构里,AI模型们的更新迭代可谓是日新月异。

但另一方面,AI技术本身的门槛仍然很高。尤其是在大模型上,以模型为核心算法算力数据三位一体的重要性更加突显。

更不用说,到了具体的应用层面,由于现在的技术仍无法实现“一个模型打天下”,后续还有大量模型调优、二次开发工作要做。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

开源无疑是推动AI技术更快走向大众的神兵利器。

问题是,在今天,尽管GitHub之类的代码托管平台已经非常成熟,但各种开源资源实际上还是非常分散,并且往往被框架、渠道等因素所限制。

也就是说,对于更广大的开发人员来说,现在仍缺少统一的中立社区,能把海量模型、算力、数据高效地汇聚到一处。

就是在这样的背景之下,达摩院等中国AI玩家们一拍即合,共同攒出了魔搭这么一个大招。

简单来说,魔搭社区核心提供的价值就是“模型即服务(Model as a Service,简称MaaS)”:

开源,并且提供开源之后模型的使用服务

让普通开发者能更低门槛地把模型跑起来。让AI,尤其是AI大模型不再是少数人的游戏。

从这个意义上来说,我们可以将模型分散开源视作AI开源的1.0模式,而魔搭社区则是在探索AI开源2.0时代的新范式。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

说到MaaS,其实并非全新概念。

之所以此前并未激起太大水花,与其本身面临的困难不无关系:

一方面,需要AI技术、优质模型本身的积累达到一定数量。

另一方面,围绕模型展开服务也就意味着大量资源的调度。

简而言之,单靠一家公司、一个机构是很难真正做到“模型即服务”的。

因而此中国科研机构们强强联手,积极贡献出一大波先进大模型、SOTA模型,属实不易。

对于本土AI开发者而言,不可谓不是一个好的开始。

阿里巴巴集团资深副总裁、达摩院副院长周靖人还透露,接下来,魔搭社区还会每月上新,达摩院将长期支持社区的维护和发展。

中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

AI时代的新型基础设施

如果将AI技术带来的变革视作第四次工业革命,那么AI技术的落地,终将从依赖专家调参的手工作坊时代,走向工业化大生产时代。

在这其中,预训练模型就是关键所在。

中国计算机学会副理事长、澜舟科技创始人兼CEO周明博士表示:

魔搭这样的AI模型社区堪称AI时代的基础设施,能将预训练模型以较低门槛提供给广大开发者,让AI惠及全社会。

中国科学院院士、CCF开源发展委员会主任王怀民也认为:

开源是AI发展的重要驱动力,魔搭作为新型的AI开源社区,不仅将有力推动AI迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。

需要正视的是,作为国内第一个MaaS社区,魔搭还只是一个开始。

只有当更多开发者参与其中,在得到模型服务的同时,让AI在各个领域应用落地,不断拓展AI模型新的发展空间和可能性,这样一个开源社区才能真正work。

我们离大规模、可复制的AI大工业时代,才可能更近一步。

那么,你会参与进来吗?

魔搭社区地址:modelscope.cn

— 完 —