虽然监督学习在某些情况下可能有效但训练数据集的生

adnanhridoy2965 · 发表于 2023-11-2 15:22:43

成成本非常昂贵即使现在，也没有那么多经过适当标记和分类的数据可用于培训法学硕士。谷歌法学硕士BERT于 2018 年推出，情况发生了变化。它使用了 Transformer 模型（首次在2017 年的一篇研究论文中提出），从根本上简化了 AI 算法的设计方式。它允许并行计算（同时完成），这意味着显着减少训练时间，并且使模型更容易在非结构化数据上进行训练。它不仅使人工智能模型变得更好，而且还使人工智能模型变得更好。它还使它们的生产速度更快、成本更低。从那时起，GPT 的第一个版本记录在 2018 年发表的一篇论文中，并于次年发布了GPT-2 。在事情变得奇怪之前，它能够一次生成几个句子。虽然两者都代表了人工智能研究领域的重大进步，但都不适合在现实世界中大规模使用。随着2020 年 GPT-3 的推出，这种情况发生了变化。虽然花了一段时间——以及 ChatGPT 的推出——才真正起飞，但它是第一个真正有用、广泛使用的法学硕士。

这就是为什么 GPT 目前在法学硕士领域大名鼎鼎。它远不是唯一可用的大型语言模型。oogle 有 PaLM，Facebook 最近发布了 Llama，针对特定任务还有很多其他选项，例如Anthropic 的 Claude。但 GPT 是第一个广泛使用的有效 AI API，开发人员可以使用它来驱动自己的应用程序。显示 OpenAI、Google、Anthropic 和 Meta 的法学硕士和聊天机器人名称的信息图 Jasper等一些大型人工智能应 加拿大手机数据库 用程序最初仅依赖 GPT，但现在与其他人工智能模型集成。但对于许多小型开发人员来说，仅使用 GPT 仍然是最简单的选择。随着未来几年竞争变得更加激烈，这种情况可能会改变。但就目前而言，GPT 是最受欢迎的选择。 GPT 是如何工作的？ “生成式预训练 Transformer 模型”实际上只是对 GPT 系列模型的用途、设计方式以及工作方式的描述。我将使用 GPT-3 作为示例，因为它是我们拥有最多信息的模型。

幸的是，多年来 OpenAI 对其流程变得更加保密。） GPT-3 经过大量未标记数据的预训练。它基本上是由整个开放互联网提供的，然后自行处理并建立自己的联系。这种技术称为深度学习，它是机器学习的基本组成部分，也是大多数现代人工智能工具的开发方式。重要的是要记住，GPT 并不像人类那样理解文本。人工智能模型将文本分解为标记，而不是单词。许多单词映射到单个标记，但较长或更复杂的单词通常会分解为多个标记。GPT-3 接受了大约 5000 亿个代币的训练。所有这些训练都用于创建一个模仿人脑的复杂、多层、加权算法，称为深度学习神经网络。它使 GPT-3 能够理解文本数据中的模式和关系，并利用创建类人响应的能力。GPT-3 的神经网络有 1750 亿个参数（或变量），允许它接受输入（您的提示），然后根据它赋予不同参数（以及少量随机性）的值和权重，输出任何内容它认为最符合您的要求。

		自动登录	找回密码
密码			立即注册

[意见建议] 虽然监督学习在某些情况下可能有效但训练数据集的生