Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 85|回复: 0

[意见建议] 虽然监督学习在某些情况下可能有效但训练数据集的生

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-11-2 15:22:43 | 显示全部楼层 |阅读模式
成成本非常昂贵即使现在,也没有那么多经过适当标记和分类的数据可用于培训法学硕士。 谷歌法学硕士BERT于 2018 年推出,情况发生了变化。它使用了 Transformer 模型(首次在2017 年的一篇研究论文中提出),从根本上简化了 AI 算法的设计方式。它允许并行计算(同时完成),这意味着显着减少训练时间,并且使模型更容易在非结构化数据上进行训练。它不仅使人工智能模型变得更好,而且还使人工智能模型变得更好。它还使它们的生产速度更快、成本更低。 从那时起,GPT 的第一个版本记录在 2018 年发表的一篇论文中,并于次年发布了GPT-2 。在事情变得奇怪之前,它能够一次生成几个句子。虽然两者都代表了人工智能研究领域的重大进步,但都不适合在现实世界中大规模使用。随着2020 年 GPT-3 的推出,这种情况发生了变化。虽然花了一段时间——以及 ChatGPT 的推出——才真正起飞,但它是第一个真正有用、广泛使用的法学硕士。

这就是为什么 GPT 目前在法学硕士领域大名鼎鼎。它远不是唯一可用的大型语言模型。oogle 有 PaLM,Facebook 最近发布了 Llama,针对特定任务还有很多其他选项,例如Anthropic 的 Claude。但 GPT 是第一个广泛使用的有效 AI API,开发人员可以使用它来驱动自己的应用程序。 显示 OpenAI、Google、Anthropic 和 Meta 的法学硕士和聊天机器人名称的信息图 Jasper等一些大型人工智能应 加拿大手机数据库 用程序最初仅依赖 GPT,但现在与其他人工智能模型集成。但对于许多小型开发人员来说,仅使用 GPT 仍然是最简单的选择。随着未来几年竞争变得更加激烈,这种情况可能会改变。但就目前而言,GPT 是最受欢迎的选择。 GPT 是如何工作的? “生成式预训练 Transformer 模型”实际上只是对 GPT 系列模型的用途、设计方式以及工作方式的描述。 我将使用 GPT-3 作为示例,因为它是我们拥有最多信息的模型。



幸的是,多年来 OpenAI 对其流程变得更加保密。) GPT-3 经过大量未标记数据的预训练。它基本上是由整个开放互联网提供的,然后自行处理并建立自己的联系。这种技术称为深度学习,它是机器学习的基本组成部分,也是大多数现代人工智能工具的开发方式。 重要的是要记住,GPT 并不像人类那样理解文本。人工智能模型将文本分解为标记,而不是单词。许多单词映射到单个标记,但较长或更复杂的单词通常会分解为多个标记。GPT-3 接受了大约 5000 亿个代币的训练。 所有这些训练都用于创建一个模仿人脑的复杂、多层、加权算法,称为深度学习神经网络。它使 GPT-3 能够理解文本数据中的模式和关系,并利用创建类人响应的能力。GPT-3 的神经网络有 1750 亿个参数(或变量),允许它接受输入(您的提示),然后根据它赋予不同参数(以及少量随机性)的值和权重,输出任何内容它认为最符合您的要求。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2025-6-10 11:43 , Processed in 0.088633 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表