返回列表
行业新闻AI创新科技

马斯克xAI发布Grok 4.1:幻觉率显著降低,暂无API访问

埃隆·马斯克的AI初创公司xAI近日推出了其最新大型语言模型Grok 4.1。该模型已在Grok.com、社交网络X以及iOS和Android移动应用上线,面向消费者开放。Grok 4.1在架构和可用性方面进行了重大增强,包括更快的推理速度、更高的情商和显著降低的幻觉率。根据公开基准测试,Grok 4.1表现优于Anthropic、OpenAI和谷歌(Gemini 2.5 Pro之前版本)的竞争模型。然而,值得注意的是,Grok 4.1目前尚未通过xAI的公共API提供给企业开发者,限制了其在需要后端集成的企业工作流中的应用。

VentureBeat

埃隆·马斯克的AI初创公司xAI近日发布了其最新大型语言模型Grok 4.1。此举似乎旨在谷歌推出其新的旗舰AI模型Gemini 3(目前已被多个独立评估机构认定为全球最强大的LLM)之前,吸引部分关注。Grok 4.1现已在Grok.com、社交网络X(前身为Twitter)以及xAI的iOS和Android移动应用上线,供消费者使用。该模型带来了重大的架构和可用性增强,其中包括更快的推理速度、改进的情商以及显著降低的幻觉率。xAI还发布了一份关于其评估的白皮书,其中包含少量关于训练过程的信息。在公开基准测试中,Grok 4.1已跃居榜首,超越了Anthropic、OpenAI和谷歌(至少是谷歌的Gemini 3之前版本,即Gemini 2.5 Pro)的竞争模型。它建立在xAI的Grok-4 Fast成功之上,VentureBeat曾在2025年9月Grok-4 Fast发布后不久对其进行了积极报道。然而,对于希望将新改进的Grok 4.1模型集成到生产环境中的企业开发者来说,存在一个主要限制:它尚未通过xAI的公共API提供。尽管其基准测试表现出色,Grok 4.1目前仍仅限于xAI面向消费者的界面,尚未公布API开放的时间表。目前,只有较旧的模型——包括Grok 4 Fast(推理和非推理变体)、Grok 4 0709以及Grok 3、Grok 3 Mini和Grok 2 Vision等旧版模型——可通过xAI开发者API进行编程使用。这些模型支持高达200万个上下文令牌,令牌定价根据配置从每百万0.20美元到3.00美元不等。目前,这限制了Grok 4.1在依赖后端集成、精细化代理管道或可扩展内部工具的企业工作流中的实用性。尽管面向消费者的推出定位了其市场。

相关新闻

行业新闻

谷歌Vids视频编辑平台AI功能全面免费开放:含AI配音、智能剪辑与图像编辑

谷歌宣布其视频编辑平台Vids的多项AI功能现已向所有拥有Gmail账号的用户免费开放。此前,这些功能仅限付费用户使用。新开放的功能包括AI语音配音、自动去除冗余口语(转录修剪)以及AI图像编辑。转录修剪功能可自动识别并删除视频中的“嗯”、“啊”等冗余口语和长时间静默,显著提升视频质量。AI语音配音允许用户通过文本脚本生成专业配音,并提供七种声音选择。AI图像编辑工具则能帮助用户轻松修改视频图片,如去除背景、按描述编辑或将静态照片转为动态视频。谷歌希望通过此举,让更多用户轻松制作高质量视频内容。

行业新闻

Google AI开发者宣布:立即开始使用Gemini 3进行开发

Google AI开发者账号于2025年11月19日发布消息,鼓励开发者“立即开始使用Gemini 3进行开发”。此消息表明Gemini 3已可供开发者使用,预示着新的开发工具和可能性。该推文获得了少量转发和点赞,并有超过4000次浏览。

行业新闻

Google 发布 Gemini 3:AI推理、多模态融合与智能体行为实现质的飞跃

Google 正式发布 Gemini 3,官方定义其在更高层次的推理、多模态融合与智能体行为上实现了质的飞跃。Gemini 3 具备理解复杂场景、跨模态分析与自主执行任务的综合能力。其核心改进包括推理深度与问题分解能力,在博士级考试中表现出色;多模态理解能力显著提升,能处理图像、视频、音频与代码的融合任务;并引入了真正的“自主执行与验证”机制,通过 Google Antigravity 平台实现AI自动规划、编写代码和验证结果。此外,Gemini 3 还具备超长上下文理解能力和系统性思维,可用于学习、构建和规划等三大应用场景。