若LLM有拟人属性则帝国时代2也有：深度解析AI拟人化争议

本文深入探讨了Adrian de Wynter发表的最新研究，该研究挑战了将大语言模型（LLM）拟人化的普遍倾向。通过在经典游戏《帝国时代2》中训练神经网络，作者证明了所谓的“理解”或“道德”等人类属性并非LLM独有，而是可能存在于任何足够强大的基质中。研究指出，若缺乏明确的测量标准，对AI行为的解释将陷入主观臆断，并为此提出了“LLM非唯一性”的零假设，旨在为AI实验设计提供更严谨的科学框架。

核心要点

挑战拟人化假设：质疑当前研究中将道德、自然语言理解等人类特质直接归因于大语言模型（LLM）的科学性。
属性的非唯一性：通过在《帝国时代2》中训练神经网络，证明拟人化表现可能出现在任何足够强大的基质（如乐高或特定地理区域）中。
测量标准的缺失：指出如果不对属性进行显式测量，对AI行为的解释将完全取决于观察者的主观表征，而非客观事实。
提出“零假设”：建议在AI实验中假设“LLM非唯一性”，以避免在研究中出现循环论证或无意义的结论。

详细分析

拟人化归因的逻辑陷阱

在当前的大语言模型研究领域，许多学者倾向于观察到模型的某些输出后，便将其归因为模型具备了“道德感”或“对语言的深度理解”。Adrian de Wynter在论文中指出，这种归因往往是基于假设而非实证。研究强调，虽然LLM在响应提示词（prompts）时表现出的某些属性可能保持恒定，但我们对其行为的解释却会随着承载这些行为的“基质”（substrate）而改变。如果一个简单的神经网络在《帝国时代2》这样的游戏环境中也能表现出类似的属性，那么我们就必须重新审视这些属性是否真的代表了某种“类人”的智能，还是仅仅是复杂系统在特定环境下的必然产物。

基质独立性与《帝国时代2》实验

为了证明LLM属性的非唯一性，作者构建并训练了一个基于《帝国时代2》视频游戏的简单神经网络。该实验的核心逻辑在于：如果在一个受限的游戏环境中都能观察到类似的“涌现”属性，那么这些属性就不是LLM所独有的。论文进一步推论，任何具有足够计算或组织能力的基质——无论是乐高积木，还是像大波士顿地区这样复杂的社会地理系统——理论上都可以呈现出类似的拟人化特征。因此，将这些特征视为LLM的专属成就，在经验科学上是站不住脚的。这种“基质独立性”要求我们在讨论AI属性时，必须脱离表象，寻找更深层的物理或逻辑依据。

建立显式测量准则的必要性

研究指出，当前的许多讨论由于缺乏明确的测量标准，导致结论往往是循环论证。例如，因为模型表现得像有道德，所以认为它有道德；又因为认为它有道德，所以将其行为解读为道德。作者认为，任何基于经验的讨论都必须包含显式的测量标准，否则解释权就留给了“表征”本身。为了打破这种僵局，论文提出了一种“零假设”（Null Assumption）：在设计实验时，研究者应首先假设LLM并不具备唯一性，也不预设其具有人类属性。通过这种方式，实验结果将更具说服力，能够更真实地反映模型的本质，而非研究者的主观投射。

行业影响

这项研究对AI行业及学术界具有重要的警示意义。首先，它挑战了目前流行的“涌现”论调，促使研究人员在评估模型能力时更加审慎，避免过度解读。其次，它推动了AI评估体系向更加客观、去拟人化的方向发展，强调了建立跨模型、跨基质的通用测量标准的重要性。对于AI伦理和治理而言，这一视角有助于决策者更理性地看待AI的“道德”与“理解”，从而制定基于事实而非基于幻觉的监管政策。

常见问题

问题 1：为什么作者选择《帝国时代2》作为对比对象？

作者使用《帝国时代2》是为了证明，在一个相对简单的、非语言模型的系统（基质）中，通过训练神经网络也能产生被误认为是“拟人化”的属性。这旨在说明LLM表现出的特质并非其架构所独有，而是复杂系统在特定基质下的普遍可能。

问题 2：什么是论文中提到的“基质”（Substrate）？

“基质”是指承载系统运行的基础媒介或环境。在本文中，LLM的基质是其神经网络架构和训练数据，而《帝国时代2》、乐高积木甚至大波士顿地区都被视为不同的基质。作者认为，属性的解释往往会随基质的变化而改变。

问题 3：这项研究是否否定了LLM的强大功能？

研究并未否定LLM的功能或其在响应提示词时的稳定性，而是质疑了对这些功能背后“人类属性”（如道德、理解）的解释方式。它呼吁的是一种更严谨的科学态度，即通过明确的测量而非主观的拟人化想象来定义AI的能力。

深度解析：若大语言模型具备拟人属性，那么《帝国时代2》亦然