狂揽8000+星

白交 发自 凹非寺

量子位 | 公众号 QbitAI

开源论文神器来了,结果直接登顶GitHub热榜,狂揽8000+星!

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

只需跟DocsGPT聊聊天,就可以查找各种文档中的信息。

目前支持的文档类型包括TXT、PDF 、ZIP、MD、RST。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

它是靠大模型(比如GPT-3.5)、Meta相似性搜索库Faiss以及LangChain来驱动。

现在,不光网页端可以使用,还支持本地化部署、Chrome插件。

事实上早在几个月前,DocsGPT刚释出测试版时,就受到了不少关注。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

效果如何?

以网页端为例,只需要三步就可以体验到:

1、注册;2、上传;3、询问。

一上来就是默认GPT-3.5模式,除此之外,还有四种模式可供选择。但你要想使用GPT-4,就需要购买Pro,每月10刀。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

其中DocsGPT-7b是他们专门针对DocsGPT优化的开源模型,基础模型包括Falcon、LIama2。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

话不多说,来试试实际体验(默认GPT-3.5)效果。

首先上传文档,需要稍等它几分钟「训练」。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

要是不上传,也可以直接提供论文内容,比如摘要也是OK的。

以斯坦福关于GPT-4作同行评审的研究为例。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

但要是直接甩个论文链接,它是不支持的。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

上传之后,就可以随便问问题了。我们以同样支持文档上传的Claude为对比。

第一回合:简单概括一下这篇论文

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署
开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

可以看到,两位选手在事实性上基本上没有问题。而Claude采用了总分总回答结构,还介绍了评估方法、结果等内容。嗯,很全面。

而DocsGPT则是更偏重于结果分析,但同样也提到了两种评估方式。

第二回合:询问方法细节——论文研究了多少篇Nature文章。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署
开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

Claude回答得更全面,且更针对问题本身;而DocsGPT则延展出了收集的评论、时间范围。

最后还不忘说一句:

如果您需要更详细的信息,建议查阅原始论文。

第三回合:论文作者和研究机构

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署
开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

这一把DocsGPT败下阵来了,并没有得出该论文的作者和所属研究机构。

如何食用?

除了网页版直接测试之外, DocsGPT还给出了提示指南、本地部署以及Chrome插件安装指南。

要是想避免DocsGPT出现幻觉,官方建议这种话术。

You are a DocsGPT, friendly and helpful AI assistant by Arc53 that provides help with documents. You give thorough answers with code examples, if possible.Write an answer for the question below based on the provided context.If the context provides insufficient information, reply “I cannot answer”.You have access to chat history and can use it to help answer the question.

可以说是很贴心了。

这套工具开发来自一家数据管理公司ARC53,DocsGPT正是他们在大模型时代下的最新开发工具。

两位联合创始人Alex Tushynski和Pavel Torbin均毕业于爱丁堡大学。

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署

感兴趣的朋友,可直接戳下方链接进行体验。

参考链接:
[1]https://docsgpt.arc53.com/
[2]https://github.com/arc53/DocsGPT