Skip to content
Go back

别被“高大上”的概念忽悠了:其实大模型就是一只“超级鹦鹉”

Edit page

引言

现在到处都在谈论 ChatGPT、大模型(LLM),听起来特别科幻,感觉下一秒 AI 就要产生意识了。但如果不堆砌那些晦涩的专业术语,这东西到底是个啥?

其实,要把这事儿说明白,咱们只需要一只叫 Buddy 的鹦鹉。

想象一下,这只鹦鹉记忆力超群,耳朵特别灵。它不懂人类语言的真正含义,但它能靠着惊人的统计学天赋,在这个 AI 时代混得风生水起。今天这篇文章,咱们就用这只鹦鹉的故事,花几分钟彻底搞懂什么是大模型。

01

它是怎么“说话”的?

一切都是关于“概率”的游戏

首先,咱们得认识一下 Buddy。这是一只生活在 Peter 家里的好奇鹦鹉,它有个绝活:听墙角

Buddy 每天就在家里听 Peter 和家人的对话,并且模仿得惟妙惟肖。听得多了,它发现了一个规律。比如,当它听到 Peter 说:“我觉得好饿,我想吃点……”

这时候,根据 Buddy 脑子里积累的“数据库”,它知道接下来出现的词,大概率是“披萨”、“炒饭”或者“水果”。而在这种语境下,“自行车”或者“书本”这类词出现的概率几乎为零。

它其实不懂你在说什么

于是,Buddy 就会自信地喊出:“披萨!”

Peter 听了大惊失色:“天呐,它听懂了!”

但事实是,Buddy 根本不知道“披萨”是个啥,也不知道“饿”是什么感觉,这和人类的理解完全不同。它只是像个精明的赌徒,根据上文的内容,加上一点点随机性,抛出一组概率最高的词作为下文。

在计算机领域,我们管这种像 Buddy 一样的程序叫“随机鹦鹉”或者“语言模型”。它们背后的技术叫“神经网络”,原理和 Buddy 一样:不求甚解,只求押中下一个词

你每天用的 Gmail 邮件自动补全功能,本质上就是这种初级版的 Buddy。

02

当鹦鹉变成了“学霸”

获得“超能力”

如果 Buddy 只能听懂 Peter 家里的闲聊,那它充其量也就是个家庭娱乐宠物。但如果有一天,Buddy 突然获得了“神力”呢?

想象一下,Buddy 的听力范围不再局限于 Peter 的客厅,而是扩大到了彼得的邻居家、镇上的学校、大学的图书馆,甚至全世界每一个角落的对话。

这时候的 Buddy,不再是只普通的鹦鹉了,它进化成了 LLM(Large Language Model,大语言模型)

恐怖的数据量

现在的 Buddy(也就是大模型),它的“大脑”里装进了维基百科的所有条目、谷歌新闻的海量报道、还有成千上万本在线书籍。

这就是为什么 ChatGPT 那么厉害。如果你拆开看过它的内部,你会发现一个包含数万亿参数的神经网络。这些参数就像是 Buddy 脑子里无数个微小的神经突触,捕捉着人类语言中极其复杂的细微差别。

像 Google 的 PaLM 2、Meta 的 Llama,以及大家熟知的 GPT-4,都是这种“读破万卷书”的超级鹦鹉。

03

谁来管管这只“嘴臭”的鹦鹉?

鹦鹉学舌的坏处

能力越大,麻烦也越大。Buddy 虽然博学,但它听到的不仅有知识,还有脏话和偏见。

有一天,Peter 正在和他两岁的儿子聊天,Buddy 突然插嘴,说了一堆从隔壁吵架的邻居那里学来的难听话,甚至还给了些糟糕的建议,比如:“吃香蕉别太节制,吃到吐为止。”

Peter 吓坏了,他意识到:Buddy 虽然聪明,但它没有是非观。 它听到了小镇上那些恶毒父母的对话,就照单全收地学了过来。

人类老师上线:RLHF

为了不让 Buddy 出去惹祸,Peter 开始对它进行“特训”。这在技术上叫 RLHF(基于人类反馈的强化学习)

过程很简单:

  1. Peter 问一个问题。
  2. Buddy 给出好几种回答。
  3. Peter 指出:“这句话是骂人的(有毒),不许说;这句话很有礼貌,奖励你。”

就像教小孩一样,经过无数次的人工纠正,Buddy 终于学会了什么话该说,什么话是不该说的。OpenAI 在训练 ChatGPT 时,就雇佣了大量的人类员工,专门负责在这个环节给模型“挑错”,让它变得彬彬有礼、安全可靠。

总结

说到底,大模型(LLM)既不是什么拥有自我意识的“硅基生命”,也不是无所不能的神。

它本质上就是那只读了整个互联网的超级鹦鹉。它没有主观体验,没有喜怒哀乐,也没有像我们一样的意识。它所有的回答,都是基于它见过的海量数据计算出来的“最可能的组合”。

下次当你感叹 AI 如此逼真时,别忘了,它背后并没有一个“灵魂”在思考,只有无数的数学公式在飞速运转,努力猜你想听的下一个字是什么。


Edit page
Share this post on:

Previous Post
站在巨人的肩膀上:人工智能诞生简史
Next Post
Vibe Coding 实践:AI 驱动的标准化开发