Thinking Machines揭秘：前OpenAI CTO穆拉蒂打造全新AI交互模型

前OpenAI首席技术官米拉·穆拉蒂（Mira Murati）创立的AI初创公司Thinking Machines近日公开了其研发方向。该公司正致力于开发一种名为“交互模型”（interaction models）的新技术，旨在让人类与AI的协作能够像人与人之间那样自然。该模型将具备持续处理音频、视频等多种感官输入的能力，标志着人机交互范式的重大演进。

核心要点

创始人背景：由前OpenAI首席技术官（CTO）米拉·穆拉蒂（Mira Murati）创立。
核心概念：公司正在研发“交互模型”（interaction models），重点在于提升人机协作的自然度。
技术特性：该模型能够持续接收并处理音频、视频等实时数据流。
研发目标：使AI能够像人类伙伴一样，通过自然的互动方式与人类进行协作。

详细分析

重新定义人机协作：从指令到自然互动

Thinking Machines提出的“交互模型”概念，试图打破目前主流AI模型基于“提示-响应”的离散交互模式。根据该公司的愿景，未来的AI不应仅仅是等待指令的工具，而是一个能够与人类进行自然协作的伙伴。这种协作模式的核心在于“自然性”，即模拟人类在共同完成任务时的互动状态。这意味着AI需要具备更强的上下文感知能力和实时反应能力，从而在工作流程中实现无缝嵌入。

多模态持续输入的关键作用

为了实现上述自然协作，Thinking Machines强调了模型对音频和视频数据的“持续接收”能力。与传统模型处理静态文本或单次上传的文件不同，交互模型被设计为能够实时感知环境。通过持续处理音视频流，AI可以捕捉到人类交流中的细微差别、环境变化以及实时的视觉信息。这种多模态的融合是实现“像人一样协作”的技术基础，使得AI能够更准确地理解人类的意图并做出即时反馈。

穆拉蒂的技术路线选择

作为前OpenAI的技术领袖，米拉·穆拉蒂在Thinking Machines的布局显示出她对AI未来形态的独特判断。她并未选择在纯语言模型的规模上进行简单竞争，而是转向了交互范式的创新。这一路线反映了行业内的一种共识：AI的下一个突破口可能不在于模型参数的进一步扩大，而在于如何让现有的智能能力以更高效、更符合人类直觉的方式介入现实世界。Thinking Machines的“交互模型”正是这一思维的产物。

行业影响

Thinking Machines的动向对AI行业具有重要的启示意义。首先，它标志着AI研发的重心正在从“生成能力”向“交互能力”转移。如果交互模型能够成功实现音视频的持续处理与自然反馈，将极大拓宽AI在专业协作、实时辅助和复杂决策支持等领域的应用边界。其次，作为由顶尖技术专家创立的公司，其技术路径可能会引领新一波初创企业的跟进，推动多模态实时交互技术的快速成熟。这不仅是技术的进步，更是对人机关系的一次重新定义。

常见问题

问题 1：Thinking Machines的“交互模型”具体是什么？

交互模型是Thinking Machines开发的一种新型AI模型，其核心目标是让人类与AI的协作变得像人与人之间的互动一样自然。它通过持续接收音频、视频等输入，实现实时的、多模态的协作体验。

问题 2：米拉·穆拉蒂在创立这家公司之前在做什么？

米拉·穆拉蒂此前担任OpenAI的首席技术官（CTO），在OpenAI期间她领导了多项核心技术的研发与发布。现在她作为创始人领导Thinking Machines。

问题 3：这种交互模型与现在的聊天机器人有什么区别？

现在的聊天机器人通常基于单次的文本或语音输入进行响应，而Thinking Machines的交互模型强调“持续性”和“自然协作”，能够像人类一样通过持续的感官输入（如音视频）来参与到工作过程中，而不是被动地等待指令。

前OpenAI CTO米拉·穆拉蒂新公司Thinking Machines揭秘：致力于开发“交互模型”