开源与闭源法学硕士:哪个更适合企业?
184 年人工智能 (AI) 市场规模将达到 2024 亿美元,预计 超过四倍 未来六年。虽然这些预期令人吃惊,但人工智能专家认为这些预期至少是保守的,实际市场价值会大得多。
大型语言模型 (LLM)(如 GPT 3)开启了人工智能时代。它们的应用范围十分广泛,从复杂的科学研究到为说唱比赛写歌词。换句话说,几乎每个人都在用这些 LLM 来做某事。
但对于企业来说呢? 麦肯锡 报告称,65% 的企业定期使用 LLM,这一数字在不到 XNUMX 个月的时间里翻了一番。事实上,企业级公司 更有可能采用人工智能技术 如法学硕士 (LLM)。
对于希望将 LLM 集成到其工作流程中的企业来说,第一个难题就是在开源和闭源 LLM 之间做出选择。今天这篇博客将解决这一争论。

了解法学硕士 (LLM) 及其类型
什么是法学硕士?
LLM,缩写 大型语言模型,数百万用户(确切地说是 123.5 亿)每天与 ChatGPT 交谈。用最简单的话来说,LLM 就是 大 使用机器学习 (ML) 技术设计的模型,用于执行语言任务,例如编写文本、推理和理解,就像人类一样。LLM 被广泛用于各种自然语言处理任务,输出形式为文本、图像、视频、音频或计算机代码。
确实,最近法学硕士 (LLM) 吸引了科技界的集体关注。然而,如今大型语言模型所具备的功能是经过多年创新和迭代才形成的。
基于规则的系统是现代 LLM 的前身。这些系统依靠手动建立的规则来处理自然语言输入。快进到今天,LLM 可以训练识别模式、生成具有细微差别和复杂性的自然语言输出以及处理情绪分析。

法学硕士 (LLM) 类型
大型语言模型 (LLM) 可以按多种不同的方式进行分类,例如按用例、训练数据或可用性进行分类。按可用性分类时,LLM 可以是开源的,也可以是专有/封闭的。在开源和封闭 LLM 之间做出选择很重要,因为它决定了公司 LLM 计划的方向、范围、预算和时间表。
开源法学硕士
开源 LLM 是免费提供的模型,任何人都可以使用、自定义和分发。通常,围绕这些 LLM 存在一个由研究人员和开发人员组成的社区,以进行开发和支持。例如,任何人都可以检查代码、发现问题、提出改进建议并针对特定目的调整模型,从而确保社区推动的进步。
一些流行的开源 LLM 示例包括 Llama 3、GPT 2 和 BERT。让我们来看看企业使用开源 LLM 的一些最大优势和挑战:
好的,
以下是开源LLM对企业的最大优势:
- 透明度: 开源 LLM 更容易获得企业的信任,因为它们的训练数据集和代码都是公开的。这种透明度还有助于识别和减轻任何潜在的偏见。
- 定制: 由于其代码和训练数据是公开的,因此这些模型可以轻松地针对特定用例进行定制。
- 成本效益: 开源模型可以免费使用,无需支付许可费用,因此其总体开发和部署成本低于闭源模型。
坏处,
尽管开源模式具有诸多优点,但企业也面临着一些潜在挑战,例如:
- 资源密集型: 开源模型通常建立在小型团队和志愿者的贡献之上。希望在开源 LLM 基础上进行构建的企业将需要在培训和定制方面投入大量资金。
- 安全与合规: 如果没有遵循适当的安全和合规标准,LLM 的开源开发也可能存在潜在的漏洞。
…判决结果
虽然使用开源 LLM 可能会耗费更多资源,但这种方法的总体成本效率可以抵消这一点。此外,不受限制地访问代码和数据以及自定义能力将使它对企业来说物有所值。
闭源法学硕士
闭源 LLM 是在私人环境中开发和维护的专有模型。对模型的训练数据和代码的访问受到限制,这意味着只有组织或在某些情况下愿意付费访问的人才能调整模型。
OpenAI 的 GPT-3 和 4 是封闭模型的流行示例。让我们来看看企业使用闭源模型的好处和坏处:
好的,
- 竞争优势: 闭源 LLM 通常为企业提供独特的专有技术,这些技术还可以根据特定行业需求进行微调。
- 专用支持: 与开源 LLM 不同,这种方法有供应商的专门支持,可确保稳定性、合规性和安全性。这对于企业级用例至关重要。
坏处,
- 有限的控制和定制:这也许是利用专有模型的最大障碍,即无法控制和定制。企业无法定制模型的代码或训练数据,只能使用供应商提供的内容。
- 更高的成本: 与开源模式相比,专有途径需要支付高额许可费用。此外,潜在的供应商锁定也会进一步增加总体成本。
…判决结果
虽然闭源 LLM 提供了更高的易用性和专门的支持,但缺乏控制和定制意味着这种方法只适合能够找到完全适合其用例的封闭 LLM 的企业。
企业需要考虑的关键因素
对于在开源和闭源大型语言模型之间选择 AI 计划的企业来说,考虑以下因素非常重要:
- 用例要求:企业应确保其选择的 LLM 符合其用例和特定的业务需求和目标。
- 预算限制:应评估总拥有成本 (TCO),其中应包括许可、实施和维护。
- 安全与合规:对于医疗保健和金融等受到严格监管的行业,选择符合行业标准和监管要求的模型至关重要。
- 可扩展性和支持:企业应该评估扩展能力和持续运营所需的支持水平。
- 定制和控制程度:企业还应确保其选择的 LLM 符合所需的定制和控制程度。
开源法学硕士成为企业新宠
OpenAI 的 GPT-4 等专有模型引领了早期的采用浪潮。然而,此后开源模型在质量方面不断缩小差距,并在企业市场中得到越来越多的采用。
以 Meta 公开的大型语言模型为例。2024 年,它们的下载量达到 400 亿次,比上一年高出 10 倍。事实上, 骆驼使用量翻倍 2024年XNUMX月至XNUMX月之间。
这在很大程度上是由于人们对人工智能的了解不断加深,以及企业寻求更大的控制力、定制化和成本效益。此外,企业希望避免供应商锁定,因为 OpenAI 的主导地位正受到来自多个方向的挑战,重大突破可能来自人工智能行业的任何地方。
简而言之,闭源模式仍然在整体上以及在个人开发者和初创公司中占据主导地位。然而,在企业领域,形势正在发生转变,因为 Salesforce 和 Slack 等主要参与者正在为希望利用开放模式的企业铺开红地毯。例如,Salesforce 最近推出了 特工力量,它允许公司连接 Salesforce 应用程序内的任何 LLM。
创新中心 Astera 正在利用开源法学硕士
Astera“ LLM 生成 使企业能够将其选择的 LLM 与其数据管道相结合,以创建由 AI 驱动的解决方案。
使用 LLM Generate,用户可以根据输入提示从 LLM 模型中检索输出。用户可以从多种 LLM 提供商中进行选择,包括 OpenAI、Llama 等,也可以使用自定义 LLM 模型。
立即取得联系 与我们讨论您的 AI 需求。


