元公司的首席人工智能科学家杨立昆认为,所有智能生物都有四个共同点。
今年早些时候在巴黎举行的 AI 行动峰会上,政治领导人和人工智能专家齐聚一堂,探讨人工智能的发展。勒昆与 IBM 人工智能负责人安东尼·安努齐亚塔分享了他对智能的基本定义。
他说:“每一种动物,或者说相对聪明的动物,当然还有人类,都具备四种智能行为的基本特征。那就是理解物质世界,拥有持久的记忆,能够推理,以及能够规划,尤其是能够分层规划复杂行动。”
勒昆表示,人工智能,尤其是大型语言模型,尚未达到这一门槛,要将这些能力融入其中,需要改变它们的训练方式。这就是为什么许多最大的科技公司在争夺人工智能主导地位的竞赛中,都在现有模型上拼凑各种能力。
他说:“要理解物理世界,嗯,你得训练一个单独的视觉系统,然后把它连接到大型语言模型上。至于记忆,你知道,你可以使用 RAG(检索增强生成),或者在模型上附加一些关联记忆,或者干脆把模型做得更大。”RAG 是一种利用外部知识源来增强大型语言模型输出的方法,由 meta 开发。
不过,勒昆说,所有这些都只是“权宜之计”。
勒昆曾在多个场合谈到一种他称之为“基于世界的模型”的替代方案。这些模型是基于真实生活场景训练出来的,其认知水平高于基于模式的人工智能。在与安努齐亚塔的交谈中,勒昆给出了另一种定义。
他说:“在时刻 T 你对世界的状况有所了解,你设想它可能会采取的一个行动,世界模型会预测你所采取的行动之后世界将会处于何种状态。”
但是,他说,世界的发展遵循着无穷无尽且难以预测的可能性,而应对它们的唯一方法就是通过抽象思维来进行训练。
meta 已经通过 V-JEPA 进行了这方面的尝试,这是其在 2 月向公众发布的一个模型。meta 称其为一种非生成式模型,通过预测视频中缺失或被遮挡的部分来进行学习。
他说:“基本思路是,你不是在像素层面进行预测。你训练一个系统来运行视频的抽象表示,这样你就可以在这个抽象表示中进行预测,希望这种表示能消除所有无法预测的细节。”
这个概念类似于化学家为物质的基本构成单元建立的基本层级。
他说:“我们创造了抽象概念。在粒子之上是原子,在原子之上是分子,在分子之上是材料。每次我们上升一个层次,就会消除很多关于下面层次的信息,这些信息对于我们要做的那种任务来说是无关紧要的。”
从本质上讲,这就是说我们学会了通过构建层级结构来理解物质世界。
本信息来自互联网,不代表氢读网立场,如若转载,请注明出处:http://www.cqshuma.com/news/45931/