2023年,应该了解的5款免费的ChatGPT竞争者
(使用这些令人惊叹的深度学习模型来自动化任务,抢占先机。)
2022年是机器学习和AI研究的疯狂之年。大型科技公司发布了很多令人惊叹的库,将为开发人员带来很多好处。我们已经看到一些伟大的研究论文,既来自大型科技公司,也来自小型集团。在我最喜欢的研究之中,是自我组装AI的研究,它表明了探索替代AI模式的潜力。
2023年,这也是大型语言模型之年。 ChatGPT席卷互联网,人们想出了各种用例和想法,如何使用它。虽然很多内容都是影响者利用许多信息和误导性信息创建视频的产物,但这种热潮证明了这种技术背后的潜力。然而,ChatGPT目前隐藏在API和访问限制之后。虽然它可以完成一些非常酷的事情,但对于任何想要使用这些大型语言模型构建自己的应用程序的人来说,更多的开源/访问解决方案是至关重要的。在本文中,我将与您分享这些模型的一些知识,以便您有一个选择的想法。
OPT:
首先,我将分享Meta的GPT版本,称为开放预训练Transformer(Open Pretrained Transformer,OPT)。OPT具有几个令人兴奋的功能,使其成为可替代GPT的可行选择。例如,当涉及零射击NLP评估时,OPT的准确性与GPT模型相当。
此外,当涉及检测仇恨言论时,OPT实际上胜过DaVinci(GPT-3的升级版本)。因此,如果这对您的解决方案具有高优先级,则OPT成为一个更有吸引力的选择。
这个模型的另一个有趣方面是能源效率。训练OPT仅使用GPT-3的7分之一的碳足迹。这提高了其在较大系统中作为基础模型主动交互的可行性。
期待再次在这个列表上看到Meta。他们采用了完全开源的方法,分享他们的模型,训练数据,日志等等。 这是一个前所未有的举动,对机器学习领域具有很多影响。
OPT模型在作为GPT替代品方面具有很多潜力,因为它似乎是专门为此而设计的。但是,Meta并不是唯一一家参加比赛的科技巨头。
PaLM
要了解为什么PaLM模型如此出色,我们首先需要了解Pathways生态系统。 Pathways是Google架构,用于创建所有大型语言模型
Google的Pathways生态系统是以许多喧嚣声宣布的。它在今年以一种重大方式提供,其中包括Flamingo、Gato和惊人的PaLM(Pathways Language Model)等模型。这些模型震动了机器学习空间,为深度学习和Transformer的讨论做出了很大贡献。
Sphere
Meta的机器学习研究人员已发布一种名为Sphere的新大型语言模型(LLM)。凭借其在搜索相关任务上的惊人表现以及分析数十亿文档的能力,再加上Meta在自然语言处理方面的其他工作,Meta已经将自己定位得很好,可以破坏搜索市场。
Sphere能够遍历大量信息库以回答问题。它可以验证引文,甚至提供更好地匹配内容的替代性引文,这是我在其他任何地方都没有看到的。
Sphere的能力使它具有有趣的潜力。它可能不足以取代Google作为一种通用的搜索引擎。然而,当涉及到研究的搜索引擎时,这将是一个福音。Sphere的开源性也允许人们更改模型搜索的底层语料库。这给了它很大的灵活性。根据调查,Sphere是所有LLM模型中具有商业可行性的模型。
BLOOM
BLOOM是一种自回归大型语言模型(LLM),它通过使用工业级计算资源在大量文本数据上从提示处继续文本。因此,它能够以46种语言和13种编程语言输出几乎不可区分于人类编写的文本的连贯文本。 BLOOM也可以被指示执行它没有明确受过训练的文本任务,通过将它们作为文本生成任务来实现。
你不会是唯一一个无法分辨BLOOM和GPT之间差异的人。这不是偶然。BLOOM旨在打破大型技术公司对大型模型的控制。在过去的几年中,技术公司一直在使用正常的研究者/小组无法复制的疯狂计算能力进行研究。这使得独立的人无法验证和批评大型技术公司发布的研究。这也导致数据科学家经常将这些论文的结果脱离其原有语境,从而形成低效且昂贵的流水线。
BLOOM是为了反对这种情况而尝试的。把它想象成一个为人民服务的模型。一个不受大型技术公司控制的模型,从而促进自由研究。因此,如果您正在寻找ChatGPT的开源替代品,BLOOM可能就是您所需要的模型。
Galactica
最后,还有另一个由Meta提供的模型。记得Sphere可以成为研究人员的Google吗?Meta还有一个针对研究人员的ChatGPT等价物,transformer。想象一个ChatGPT,但是在大量研究文本上进行训练。这样的模型可以解释数学公式,帮助你写论文,为你创建Latex等等。这就是Galactica的作用。它可以做很多,而不仅仅是与研究有关的任务。