返回列表
行业新闻AI模型技术

Kimi K2 Thinking模型在Vending-Bench基准测试中表现卓越,成为最佳开源模型

Kimi.ai宣布,其Kimi K2 Thinking模型在Vending-Bench基准测试中表现出色,现已成为该测试中表现最佳的开源模型。Andon Labs重新运行测试后发现,使用Moonshot官方API显著提升了Kimi K2在工具调用方面的性能,使其在平均净值方面超越其他开源模型。Kimi.ai鼓励用户查看Kimi K2 Thinking的基准测试最佳实践并获取API密钥。

twitter-Kimi.ai

Kimi.ai近日发布消息,强调其Kimi K2 Thinking模型在Vending-Bench基准测试中的卓越表现。根据Andon Labs的重新测试结果,Kimi K2 Thinking模型在使用Moonshot官方API后,其在工具调用方面的性能得到了显著提升。这一改进使得Kimi K2 Thinking在Vending-Bench基准测试中,基于所实现的平均净值,成功超越其他开源模型,成为该测试中表现最佳的开源模型。Kimi.ai表示,这一结果印证了他们一直以来的宣传。同时,Kimi.ai鼓励用户查阅Kimi K2 Thinking的基准测试最佳实践指南,并获取相应的API密钥,以便更好地利用该模型的强大功能。

相关新闻

行业新闻

谷歌Vids视频编辑平台AI功能全面免费开放:含AI配音、智能剪辑与图像编辑

谷歌宣布其视频编辑平台Vids的多项AI功能现已向所有拥有Gmail账号的用户免费开放。此前,这些功能仅限付费用户使用。新开放的功能包括AI语音配音、自动去除冗余口语(转录修剪)以及AI图像编辑。转录修剪功能可自动识别并删除视频中的“嗯”、“啊”等冗余口语和长时间静默,显著提升视频质量。AI语音配音允许用户通过文本脚本生成专业配音,并提供七种声音选择。AI图像编辑工具则能帮助用户轻松修改视频图片,如去除背景、按描述编辑或将静态照片转为动态视频。谷歌希望通过此举,让更多用户轻松制作高质量视频内容。

行业新闻

Google AI开发者宣布:立即开始使用Gemini 3进行开发

Google AI开发者账号于2025年11月19日发布消息,鼓励开发者“立即开始使用Gemini 3进行开发”。此消息表明Gemini 3已可供开发者使用,预示着新的开发工具和可能性。该推文获得了少量转发和点赞,并有超过4000次浏览。

行业新闻

Google 发布 Gemini 3:AI推理、多模态融合与智能体行为实现质的飞跃

Google 正式发布 Gemini 3,官方定义其在更高层次的推理、多模态融合与智能体行为上实现了质的飞跃。Gemini 3 具备理解复杂场景、跨模态分析与自主执行任务的综合能力。其核心改进包括推理深度与问题分解能力,在博士级考试中表现出色;多模态理解能力显著提升,能处理图像、视频、音频与代码的融合任务;并引入了真正的“自主执行与验证”机制,通过 Google Antigravity 平台实现AI自动规划、编写代码和验证结果。此外,Gemini 3 还具备超长上下文理解能力和系统性思维,可用于学习、构建和规划等三大应用场景。