“有信心在年底做出中国最好的大语言模型”

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

搜狗创始人王小川,正式官宣入场大模型创业:

有信心在年底做出中国最好的大语言模型。

新公司百川智能,前搜狗COO茹立云是已经对外公布的合伙人。

团队方面,以前搜狗团队为基础,加上来自百度华为微软字节腾讯等公司的人才,预计在4月底达到50人规模,接下来还会引进国际人才。

百川智能旨在打造中国版的OpenAI基础大模型及颠覆性上层应用,瞄准搜索、多模态、教育、医疗等领域。

新公司于今年2月启动筹办,迅速获得5000万美元(约人民币3.4亿元)启动资金,来自王小川自掏腰包和其业内好友个人支持。

量子位还获悉,百川智能的大模型已经在训练了,年中就会有第一版发布,目前版本500亿参数,希望年底追平GPT-3.5。

对于打造中国版OpenAI成本几何,王小川预估3亿美元到20亿美元。

王小川官宣大模型创业!5000万美元启动资金,年中发布首个产品,目前在训500亿参数版本

早在ChatGPT掀起第一波热潮之时,王小川就曾公开透露出山之意。

OpenAI的成功,首先是技术理想主义的胜利。中国需要自己的OpenAI,就需要技术理想主义。

王小川官宣大模型创业!5000万美元启动资金,年中发布首个产品,目前在训500亿参数版本

而在刚刚发布的公开信中,王小川表示:

ChatGPT的腾空出世仅仅131天,每天都有扑面而来的新进展、新突破。

131天恍如隔世!很多朋友认可我的技术理想主义和技术驱动的创业经验,鼓励和支持我做中国的OpenAI。

另外,王小川的二次创业还获得清华大学相关院系及多位院士和教授的支持。

包括中国工程院院士郑纬民、中国科学院院士张钹,清华计算机系主任尹霞,清华计算机系教授马少平、刘奕群等。

清华大学与百川智能将在基础科研和人才方面展开合作。

附:王小川公开信全文

今天我正式宣布,创建“百川智能”,一家研发并提供通用人工智能服务的中国公司。

生活在二十一世纪初是如此幸运,波澜壮阔的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。多年前我曾断言,机器掌握语言,通用人工智能时代就来了;我也有畅想,搜索的未来是问答。ChatGPT的腾空出世,地动山摇,这一切都开始成为现实。ChatGPT发布到今天,仅仅131天,每天都有扑面而来的新进展、新突破。131天恍如隔世!

大半个世纪以来,科学家们前赴后继,努力创造通用智能机器。这一天终于到来,我们找到了一条巧妙的路径,用AI成功将语言转化成了数学模型。语言是知识、思考、沟通和文化的载体。维特根斯坦说,语言的边界就是世界的边界。当AI掌握了语言后,就开始认知世界,成为有知识、能思考、善表达、会学习的智能体。我把这样的智能体称为“语言AI”。

人类个体总有消亡的一天,但能够将毕生的知识通过语言记录下来供新生命学习、继承,文明因此延续。人类协作也需要个体之间通过语言沟通。掌握了沟通和世界知识的语言AI不再只是人类的“工具”,而将成为我们的伙伴和超级助理,成为人类文明的一部分。

智能时代会改写互联网时代的范式。‘连接’会被‘陪伴’取代,‘信息服务’会被‘知识服务’取代,‘免费与广告’会被‘付费与高品质’取代。

智能时代也会改写自工业时代以来的范式。曾经是专业化社会分工带来规模效应与效率提升,而未来会是逆专业化分工:之前需要很多公司协作完成的工作,会因为AI的赋能‘端到端’的完成。

智能时代将再一次开启“文艺复兴”。每个人都会因为AI的助力而变得更加强大。用好AI,一个人就可能做一个公司,解决之前难以解决的难题,也更容易成为自己想成为的人。社会也会更加扁平,以前少数人才能享有的智力服务,也能更普惠。

告别搜狗后,我已开启新的远征:立志往后二十年,为生命科学和医学的发展尽一份力,为大众健康做出一点贡献,核心路径是构建生命健康数学模型,并已经付诸行动。ChatGPT的出现,也将成为新远征的重要助力。

不仅如此,ChatGPT是我过往经历的延续和升华。2019年我将搜狗的使命升级为“让表达和获取知识更简单”,愿景定义为“帮助每个人轻松地对话和书写。便捷地获得知识和服务,提升工作效率和生活品质”。

搜狗输入法和搜狗搜索的数据制备和产品形态,也与ChatGPT接近。它们都是把互联网上的全部语言数据收集、清洗,压缩成数据库并构建超级产品。随着深度学习的发展,这些产品都多次迭代升级,全面用上了Transformer/Bert等技术。输入法猜你想说什么,搜索猜你想要什么。而ChatGPT把这些能力推到了一个全新的高度,是输入法、搜索之外,第三个把全网数据转化成语言服务的超级产品。搜狗未尽的使命在机器掌握了语言后终于可以实现。

很多朋友认可我的技术理想主义和技术驱动的创业经验,鼓励和支持我做中国的OpenAI。也有很多搜狗和非搜狗的技术大拿,得知我有做大模型的想法,主动申请参与组队,甚至“带资入组”。

我最动心的是,能和一群有理想的人,用极致的技术驱动创造出颠覆性的智能产品。这一次,百川智能将借助语言AI的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。

筹建百川智能不到两个月,已有多位技术合伙人和领军人物的加入。到这个月底将会有近50人规模的精英团队。大模型的训练也已经启动,进展顺利。按照现在的进度,争取年内发布国内最好的大模型和颠覆性的产品。

我们是中国公司,但我们并不希望只是“中国的OpenAI”,而是能建立世界级的视野和技术品质,让中国享有世界级的产品,产生有世界影响力的技术的突破,进而服务海外。百川本意是众多的河流汇集奔赴海洋,象征着众多数据、行业知识汇聚成为一个强大的智能体系,生生不息。百川也象征着集百家智慧,更多人与我一道共赴山海。我们呼唤中国的领军人物、行业产品经理和远在美国的同仁的加入。

同志们,请通过如下邮箱联系我们:
80@baichuan-inc.com
90@baichuan-inc.com
95@baichuan-inc.com
00@baichuan-inc.com
oier@baichuan-inc.com

通用人工智能时代刚刚开启,我们作为第一批跨入新时代的人类,带着焦虑和好奇去拥抱它,思考和探索“我是谁?”我们还可以把自己的智慧注入它,做新时代的开创者,让后代们有一个更美好的未来,繁荣和延续人类文明。

百川智能CEO 王小川

2023年4月10日