文化

什么是大型语言模型

由人类撰写还是由人工智能撰写?大型语言模型因其自然的表现而脱颖而出。
Rodrigo Demetrio
10 min
Table of Contents

由人类编写还是由人工智能编写?界限越来越模糊!除了执行任务的速度外,机器学习模型还因其处理信息的复杂性而脱颖而出,产生的结果越来越忠实于人类自然语言。

大型语言模型(LLM)可以定义为能够在语言领域内执行各种任务的机器学习模型。 它们的构建重点是理解和生成文本。

LLM 中的“大”一词不辜负一个事实,即它是一个用大量数据训练的模型,这导致了将语言的多个方面和模式联系起来的能力。

LLM 的用途和显著特点是什么?

好吧,人工智能的文本生成并不是最新的创新,那么是什么让 LLM 与众不同呢?LLM 之所以令人惊讶,正是因为它能够生成高度连贯、语法正确且认知上令人信服的文本。

大型语言模型可以执行的任务包括语言翻译、从零开始创建完整文章、总结文档、提供虚拟助手帮助,甚至编写代码。 区别在于它能够解释同一模型中的多个函数。

聊天机器人的成功

聊天机器人例如 ChatGPTBard,是利用 LLM 的人工智能技术的例子。 近年来,这些界面通过为用户提供增强的虚拟帮助而广受欢迎。

他们可以处理的任务范围从行政活动,如创建列表、组织电子表格、执行计算、安排会议和格式化文本,到更具创意的任务,如提供旅行提示,甚至创作诗歌!

ChatGPT 是 OpenAI 于 2022 年推出的界面。 它在免费版本中使用 GPT-3.5 语言模型,在付费版本中使用 GPT-4.0。

Bard 是由 Google 开发并于 2023 年推出的界面。 它的创建基于对话应用程序的语言模型(LaMDA),后来合并了路径语言模型(PaLM 2),能够提供更精确的响应。 由于仍处于测试阶段,因此该界面仅在浏览器中运行,尚无 App 版本。

人工智能的道德挑战

AI 应用程序可以为企业带来许多机会,但在使用 AI 时,尤其是作为大型语言模型(LLM)时,存在一些道德问题需要您注意。 主要关注点是:

政治和社会敏感性: LLM的训练不考虑社会敏感性,这意味着它可以生成带有某种程度偏见、政治不正确甚至不道德内容的文本。 机器学习缺乏现实世界的洞察力,无论训练有多好,参数数量有多大,它们都没有像人类一样的社会敏感过滤器。

假新闻: 保证信息安全是使用 LLM 的一个关注点。 数据训练不包括事实核查。 数据没有对真实性的承诺,这可能导致过时的内容、肤浅的解释,甚至更糟糕的是,生成假新闻或恶意和诽谤性的文本。 

Data Security: 另一个相关的关注点是数据安全。 训练无法区分哪些是机密信息,因此需要对与模型共享的数据进行审查,因为LLM应该只动态获取公共数据和可信来源的信息。为了解决这些困境,我们一直在努力修改模型输入和输出的指南。 数据科学家和 AI 专家已经在研究微调和提高这些系统的理解和精度的技术。

LLM 是如何构建的?

大型语言模型使用大量参数进行训练,达到数十亿。 它是一个结合了机器学习(算法从输入的数据中自行学习规则)和深度学习技术(模仿人类大脑神经的高级算法)的大型算法。 下图有助于理解:

来自免费媒体存储库 Wikimedia Commons
[https://commons.wikimedia.org/wiki/File:The_relationship_and_main_types_of_artificial_intelligence,_machine_learning_and_deep_learning.webp]

训练的第一步是识别数据集,这在 LLM 中是大量的。 训练后,这个大型神经网络的各层被配置(几个非线性处理层,模拟神经元的思维方式)。 然后使用监督学习从提供的数据中生成相关信息,最后但同样重要的是,对模型进行性能测试。

通过处理来自互联网的各种来源(文章、书籍、网站、视频)的大量数据,模型可以预测生成连贯文本的词序列。 它分析文本并预测下一个单词,就像人们在对话中或阅读文本时“直觉”短语一样。 然而,LLM 不具备认知智能。 他们仅根据之前提供给他们的内容提供结果。

训练语言模型需要特定的技术知识、专业软件和大量投资。 根据 OpenAI 的 GPT-3 语言模型的技术概述,AI 的成本呈指数级增长。

如何为 LLM 编写相关的文本输入?

由于LLM本身不具备“智能”,提高结果准确性的最有效方法是在与该网络交互时使用正确的提示。

对于每个新的命令输入,该模型都会扩展其数据库,始终旨在提供更精确的响应。 输入命令的上下文越相关,获得的响应就越好。 下面是一个示例:

吟游诗人 1: 如果使用通用提示进行测试,响应将包含多种可能性,并且可能无法完全满足您的请求。
吟游诗人 2: 如果使用特定提示进行测试,则会获得一个列表作为答案,在这种情况下,这可能更有用。

大型语言模型的技术指向了语言相关服务的革命。 每年要区分是由人类还是人工智能生成的内容会变得更加具有挑战性吗?

Bureau Work翻译服务中,我们相信技术是盟友,而不是竞争对手。 关键是理解和研究工具,以便为尽可能多的人谋福利。

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Rodrigo Demetrio
Passionate about bringing ideas to life and how languages connect people. One dream? Less marketing, more conversations, less algorithm content, and more originality. Let’s make something awesome together!
Translate twice as fast impeccably
Get Started
Our online Events!
Join our community

Try Bureau Works Free for 14 days

The future is just a few clicks away
Get started now
The first 14 days are on us
World-class Support