首页
AI资讯
文章详情

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

2024-10-16
AI资讯
原创文章

30
0
0
0

0°

帅气的我简直无法用语言描述！

2792 文章
0 粉丝
0 关注

最近更新

1.「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

2.英伟达版ChatGPT来了，PC端部署，很GPU

3.ChatGPT要有记忆力了！

文章目录

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

C语言单文件500行代码

梦晨发自凹非寺
量子位 | 公众号 QbitAI

大神仅花一个周末训练微型LLaMA 2，并移植到C语言。

推理代码只有500行，在苹果M1笔记本上做到每秒输出98个token。

作者是OpenAI创始成员Andrej Karpathy，他把这个项目叫做Baby LLaMA 2（羊驼宝宝）。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

虽然它只有1500万参数，下载下来也只有58MB，但是已经能流畅讲故事。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

所有推理代码可以放在C语言单文件上，没有任何依赖，除了能在笔记本CPU上跑，还迅速被网友接力开发出了各种玩法。

llama.cpp的作者Georgi Gerganov搞出了直接在浏览器里运行的版本。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

提示工程师Alex Volkov甚至做到了在GPT-4代码解释器里跑Baby LLaMA 2。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

大模型套娃小模型，成了。

羊驼宝宝诞生记

据Karpathy分享，做这个项目的灵感正是来自llama.cpp。

训练代码来自之前他自己开发的nanoGPT，并修改成LLaMA 2架构。

推理代码直接开源在GitHub上了，不到24小时就狂揽1500+星。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

训练数据集TinyStories则来自微软前一阵的研究。

2023新视野数学奖得主Ronen Eldan、2023斯隆研究奖得主李远志联手，验证了1000万参数以下的小模型，在垂直数据上训练也可以学会正确的语法、生成流畅的故事、甚至获得推理能力。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

此外，开发过程中还有一个插曲。

Karpathy很久不写C语言已经生疏了，但是在GPT-4的帮助下，还是只用一个周末就完成了全部工作。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

对此，英伟达科学家Jim Fan评价为：现象级。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

最初，在CPU单线程运行、fp32推理精度下，Baby LLaMA 2每秒只能生成18个token。

在编译上使用一些优化技巧以后，直接提升到每秒98个token。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

优化之路还未停止。

有人提出，可以通过GCC编译器的-funsafe-math-optimizations模式再次提速6倍。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

除了编译方面外，也有人提议下一步增加LoRA、Flash Attention等模型层面流行的优化方法。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

Baby LLaMA 2一路火到Hacker News社区，也引发了更多的讨论。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

有人提出，现在虽然只是一个概念验证，但本地运行的语言模型真的很令人兴奋。

虽然无法达到在云端GPU集群上托管的大模型的相同功能，但可以实现的玩法太多了。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

在各种优化方法加持下，karpathy也透露已经开始尝试训练更大的模型，并表示：

70亿参数也许触手可及。

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」

GitHub：
https://github.com/karpathy/llama2.c

在浏览器运行Baby LLaMA 2：
https://ggerganov.com/llama2.c

参考链接：
[1]https://twitter.com/karpathy/status/1683143097604243456
[2]https://twitter.com/ggerganov/status/1683174252990660610
[3]https://twitter.com/altryne/status/1683222517719384065
[4]https://news.ycombinator.com/item?id=36838051

创新奇智荣获CVPR2023细粒度视觉挑战赛两项冠军

虚幻引擎5再现《失控玩家》！游戏NPC在线怀疑人生

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

关联网址

关联标签

相关文章

「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

英伟达版ChatGPT来了，PC端部署，很GPU

英伟达版ChatGPT来了，PC端部署，很GPU

ChatGPT要有记忆力了！

ChatGPT要有记忆力了！

下一代Windows系统曝光：基于GPT-4V，Agent跨应用调度，代号UFO

下一代Windows系统曝光：基于GPT-4V，Agent跨应用调度，代号UFO

这个AI办公应用火了：简短提示词出PPT，打包GPTs帮你打工干活

这个AI办公应用火了：简短提示词出PPT，打包GPTs帮你打工干活