返回列表
前OpenAI CTO米拉·穆拉蒂新公司Thinking Machines揭秘:致力于开发“交互模型”
行业新闻人工智能创业公司交互技术

前OpenAI CTO米拉·穆拉蒂新公司Thinking Machines揭秘:致力于开发“交互模型”

前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)创立的AI初创公司Thinking Machines近日公开了其研发方向。该公司正致力于开发一种名为“交互模型”(interaction models)的新技术,旨在让人类与AI的协作能够像人与人之间那样自然。该模型将具备持续处理音频、视频等多种感官输入的能力,标志着人机交互范式的重大演进。

The Verge

核心要点

  • 创始人背景:由前OpenAI首席技术官(CTO)米拉·穆拉蒂(Mira Murati)创立。
  • 核心概念:公司正在研发“交互模型”(interaction models),重点在于提升人机协作的自然度。
  • 技术特性:该模型能够持续接收并处理音频、视频等实时数据流。
  • 研发目标:使AI能够像人类伙伴一样,通过自然的互动方式与人类进行协作。

详细分析

重新定义人机协作:从指令到自然互动

Thinking Machines提出的“交互模型”概念,试图打破目前主流AI模型基于“提示-响应”的离散交互模式。根据该公司的愿景,未来的AI不应仅仅是等待指令的工具,而是一个能够与人类进行自然协作的伙伴。这种协作模式的核心在于“自然性”,即模拟人类在共同完成任务时的互动状态。这意味着AI需要具备更强的上下文感知能力和实时反应能力,从而在工作流程中实现无缝嵌入。

多模态持续输入的关键作用

为了实现上述自然协作,Thinking Machines强调了模型对音频和视频数据的“持续接收”能力。与传统模型处理静态文本或单次上传的文件不同,交互模型被设计为能够实时感知环境。通过持续处理音视频流,AI可以捕捉到人类交流中的细微差别、环境变化以及实时的视觉信息。这种多模态的融合是实现“像人一样协作”的技术基础,使得AI能够更准确地理解人类的意图并做出即时反馈。

穆拉蒂的技术路线选择

作为前OpenAI的技术领袖,米拉·穆拉蒂在Thinking Machines的布局显示出她对AI未来形态的独特判断。她并未选择在纯语言模型的规模上进行简单竞争,而是转向了交互范式的创新。这一路线反映了行业内的一种共识:AI的下一个突破口可能不在于模型参数的进一步扩大,而在于如何让现有的智能能力以更高效、更符合人类直觉的方式介入现实世界。Thinking Machines的“交互模型”正是这一思维的产物。

行业影响

Thinking Machines的动向对AI行业具有重要的启示意义。首先,它标志着AI研发的重心正在从“生成能力”向“交互能力”转移。如果交互模型能够成功实现音视频的持续处理与自然反馈,将极大拓宽AI在专业协作、实时辅助和复杂决策支持等领域的应用边界。其次,作为由顶尖技术专家创立的公司,其技术路径可能会引领新一波初创企业的跟进,推动多模态实时交互技术的快速成熟。这不仅是技术的进步,更是对人机关系的一次重新定义。

常见问题

问题 1:Thinking Machines的“交互模型”具体是什么?

交互模型是Thinking Machines开发的一种新型AI模型,其核心目标是让人类与AI的协作变得像人与人之间的互动一样自然。它通过持续接收音频、视频等输入,实现实时的、多模态的协作体验。

问题 2:米拉·穆拉蒂在创立这家公司之前在做什么?

米拉·穆拉蒂此前担任OpenAI的首席技术官(CTO),在OpenAI期间她领导了多项核心技术的研发与发布。现在她作为创始人领导Thinking Machines。

问题 3:这种交互模型与现在的聊天机器人有什么区别?

现在的聊天机器人通常基于单次的文本或语音输入进行响应,而Thinking Machines的交互模型强调“持续性”和“自然协作”,能够像人类一样通过持续的感官输入(如音视频)来参与到工作过程中,而不是被动地等待指令。

相关新闻