2026年4月3日的AI新闻

← 前一天查看所有日期后一天 →

Claude Code 视觉化指南发布：从基础到高级智能体的实战模板手册

开源项目

Claude Code 视觉化指南发布：从基础到高级智能体的实战模板手册

GitHub 开发者 luongnv89 发布了名为 claude-howto 的开源项目，这是一份以视觉图解和实例驱动的 Claude Code 全方位指南。该资源涵盖了从基础概念到高级智能体构建的核心内容，并提供了大量可直接复制使用的实战模板，旨在帮助用户快速掌握 Claude 的高级应用并产生实际价值。

GitHub Trending•2026年4月3日

阅读全文原文

Google Research 发布 TimesFM：基于预训练的时间序列基础模型

研究突破

Google Research 发布 TimesFM：基于预训练的时间序列基础模型

Google Research 正式推出 TimesFM（Time Series Foundation Model），这是一款专门为时间序列预测设计的预训练基础模型。作为 Google 在时间序列分析领域的最新研究成果，TimesFM 旨在利用大规模预训练技术提升预测的准确性与通用性，为处理复杂的时间序列数据提供了新的技术路径。

GitHub Trending•2026年4月3日

阅读全文原文

prompts.chat：开源社区驱动的ChatGPT提示词精选库与自托管方案

开源项目

prompts.chat：开源社区驱动的ChatGPT提示词精选库与自托管方案

prompts.chat（原名Awesome ChatGPT Prompts）是一个专注于分享、发现和收集社区优质提示词的开源项目。该项目不仅为用户提供丰富的提示词资源，还支持完全隐私的自托管方案，旨在帮助个人和组织更高效地利用AI能力，同时保障数据隐私安全。

GitHub Trending•2026年4月3日

阅读全文原文

OpenAI 推出 Codex CLI：可在终端运行的轻量级 AI 编程助手

开源项目

OpenAI 推出 Codex CLI：可在终端运行的轻量级 AI 编程助手

OpenAI 发布了名为 Codex 的轻量级编程助手，该工具直接运行于终端环境。用户可以通过 npm 或 Homebrew 轻松安装。作为一款命令行界面（CLI）工具，Codex 旨在为开发者提供更高效的编程支持，将 AI 能力直接集成到日常的开发工作流中。

GitHub Trending•2026年4月3日

阅读全文原文

微软开源前沿语音人工智能项目 VibeVoice：探索语音AI技术新边界

开源项目

微软开源前沿语音人工智能项目 VibeVoice：探索语音AI技术新边界

微软（Microsoft）在GitHub上正式发布了名为VibeVoice的开源前沿语音人工智能项目。作为语音AI领域的最新进展，该项目旨在提供前沿的语音处理能力。目前该项目已在GitHub Trending榜单获得关注，并提供了专门的项目页面供开发者深入探索其技术细节与应用潜力。

GitHub Trending•2026年4月3日

阅读全文原文

Anthropic 推出 Claude Code：运行在终端的智能编程助手，重塑开发者工作流

产品发布

Anthropic 推出 Claude Code：运行在终端的智能编程助手，重塑开发者工作流

Anthropic 发布了名为 Claude Code 的命令行界面（CLI）工具。该工具直接在终端运行，通过深度理解开发者本地代码库，支持使用自然语言执行编程任务、解释复杂逻辑及管理 Git 工作流。作为一款紧密集成开发环境的 AI 工具，它旨在通过简化常规开发流程来显著提升程序员的生产力。

GitHub Trending•2026年4月3日

阅读全文原文

行业新闻

AI笔记应用Granola隐私预警：链接默认公开且数据用于模型训练

AI笔记应用Granola近期引发隐私关注。尽管官方宣称笔记“默认私有”，但实际上任何拥有链接的人均可查看内容。此外，除非用户主动选择退出，否则其笔记将被用于内部AI模型训练。作为一款面向专业人士的AI记事本，Granola的这些默认设置提醒用户需重新检查其隐私选项。

The Verge•2026年4月2日

阅读全文原文

阿里巴巴发布三款闭源Qwen新模型，云端需求增长推动AI商业策略转型

行业新闻

阿里巴巴发布三款闭源Qwen新模型，云端需求增长推动AI商业策略转型

阿里巴巴本周推出了三款全新的Qwen专有模型，这些模型仅通过其云平台或官方聊天机器人网站提供。其中包括专门针对编程优化的Qwen3.6-Plus模型。这一举措反映了中国AI企业在云端需求上升的背景下，开始倾向于保留核心模型的所有权，通过闭源模式提供服务。

Tech in Asia•2026年4月2日

阅读全文原文

OpenClaw 宣布集成腾讯 QQ 插件：支持多账号设置并合并至主代码库

开源项目

OpenClaw 宣布集成腾讯 QQ 插件：支持多账号设置并合并至主代码库

开源项目 OpenClaw 近日宣布正式集成腾讯旗下的社交平台 QQ。通过将 QQBot 作为插件捆绑并合并至主代码库，OpenClaw 实现了多账号设置等功能，旨在为 AI Agent（人工智能代理）提供更广泛的社交平台接入能力。此次更新标志着 OpenClaw 在社交集成领域迈出了重要一步。

Tech in Asia•2026年4月2日

阅读全文原文

印度AI初创公司Sarvam AI融资估值接近16亿美元，英伟达与亚马逊拟参投

投融资

印度AI初创公司Sarvam AI融资估值接近16亿美元，英伟达与亚马逊拟参投

据知情人士透露，印度人工智能初创公司Sarvam AI正处于新一轮融资洽谈中，其估值已接近16亿美元。本轮融资预计将由Bessemer Venture Partners领投，科技巨头英伟达、亚马逊以及Prosperity7 Ventures也将参与其中。这一动向凸显了全球资本对印度本土AI大模型开发能力的关注。

Tech in Asia•2026年4月2日

阅读全文原文

OpenAI 宣布收购技术脱口秀节目 TBPN，具体财务条款尚未披露

行业新闻

OpenAI 宣布收购技术脱口秀节目 TBPN，具体财务条款尚未披露

人工智能巨头 OpenAI 已正式收购技术脱口秀节目 TBPN。目前，OpenAI 尚未公开此次交易的具体财务条款，也未明确 TBPN 在 YouTube、X（原 Twitter）及播客等现有平台上的分发渠道将如何调整。此举标志着 OpenAI 在内容与媒体领域的进一步布局。

Tech in Asia•2026年4月2日

阅读全文原文

Cursor 3 正式发布：从 IDE 进化为 AI Agent 统一协作工作区

产品发布

Cursor 3 正式发布：从 IDE 进化为 AI Agent 统一协作工作区

Cursor 官方宣布推出 Cursor 3，标志着软件开发进入第三纪元。新版本彻底重构了用户界面，从传统的代码编辑器转型为以 AI Agent 为核心的统一工作区。Cursor 3 支持多仓库协作、本地与云端 Agent 无缝切换，并集成了来自 Slack、GitHub 等多渠道的 Agent 任务，旨在解决工程师在管理多个自主 Agent 时的碎片化问题，提升开发抽象层级。

Hacker News•2026年4月2日

阅读全文原文

Moonlake：构建多模态、交互式且高效的因果世界模型——对话 Chris Manning 与 Fan-yun Sun

研究突破

Moonlake：构建多模态、交互式且高效的因果世界模型——对话 Chris Manning 与 Fan-yun Sun

本文探讨了 Moonlake 在世界模型领域的创新研究。通过与 Chris Manning 和 Fan-yun Sun 的深度对话，揭示了构建长效运行、多玩家参与且具备交互性的因果世界模型的新路径。该方法利用从游戏引擎引导的智能体，致力于实现更高效、多模态的 AI 环境模拟。

Latent Space•2026年4月2日

阅读全文原文

开源模型跨越新门槛：GLM-5与MiniMax M2.7在核心智能体任务中比肩顶尖闭源模型

行业新闻

开源模型跨越新门槛：GLM-5与MiniMax M2.7在核心智能体任务中比肩顶尖闭源模型

LangChain的最新评估显示，开源模型已迎来重大突破。GLM-5和MiniMax M2.7等开源模型在文件操作、工具使用及指令遵循等核心智能体任务上，已能匹配顶尖闭源模型的表现。更重要的是，这些开源模型在成本和延迟方面具有显著优势，为开发者提供了更高效、更具性价比的选择。

LangChain•2026年4月2日

阅读全文原文

微软MAI团队发布三款全新基础模型，涵盖语音转录、音频及图像生成领域

产品发布

微软MAI团队发布三款全新基础模型，涵盖语音转录、音频及图像生成领域

微软旗下MAI团队在成立六个月后，正式发布了三款全新的基础AI模型。这些模型具备将语音实时转录为文本的能力，并支持高质量的音频与图像生成。此次发布标志着微软在AI基础模型领域的进一步扩张，旨在通过多模态技术能力与行业对手展开直接竞争。

TechCrunch AI•2026年4月2日

阅读全文原文

从RTX到Spark：英伟达加速谷歌Gemma 4模型，推动本地代理式AI发展

行业新闻

从RTX到Spark：英伟达加速谷歌Gemma 4模型，推动本地代理式AI发展

英伟达宣布针对谷歌最新的Gemma 4系列模型进行加速优化，旨在推动从RTX PC到Spark等平台的本地代理式AI应用。Gemma 4作为一类小型、快速且具备全能处理能力的模型，专门为高效本地执行而设计。此次合作通过利用本地实时上下文信息，将AI洞察转化为实际行动，标志着AI创新正从云端向日常设备端加速迁移。

NVIDIA Newsroom•2026年4月2日

阅读全文原文

开源项目

谷歌发布Gemma 4开源模型：显著提升移动端与物联网设备计算效率

谷歌正式发布了Gemma 4系列开源模型，重点推出E2B与E4B两种规格。该系列模型旨在实现极高的计算与内存效率，为移动设备和物联网（IoT）设备带来了全新的智能水平。作为轻量级开放模型，Gemma 4在保持高性能的同时，优化了在资源受限环境下的运行表现。

Hacker News•2026年4月2日

阅读全文原文

Google DeepMind 发布 Gemma 4：专为高级推理与智能体工作流打造的最强开源模型

产品发布

Google DeepMind 发布 Gemma 4：专为高级推理与智能体工作流打造的最强开源模型

Google DeepMind 正式发布了其迄今为止最智能的开源模型系列 Gemma 4。该模型在保持轻量化的同时，实现了极高的性能效率。Gemma 4 专门针对高级推理任务和智能体（Agentic）工作流进行了深度优化，旨在为开发者提供更强大的开源工具，推动复杂自动化任务的实现。

DeepMind Blog•2026年4月2日

阅读全文原文

前核心工程师揭秘：微软Azure决策失误如何导致万亿价值流失与信任危机

行业新闻

前核心工程师揭秘：微软Azure决策失误如何导致万亿价值流失与信任危机

本文由前微软Azure Core资深工程师Axel Rietschin撰写，深入剖析了微软在Azure云计算平台决策中的失误。作者拥有超过十年的Azure开发与使用经验，曾参与Azure Boost加速卡及容器平台等核心技术的研发。文章揭示了微软因内部自满和决策偏差，导致其失去了最大客户OpenAI的深度信任，并影响了与美国政府的合作关系，造成了巨大的经济与信誉损失。

Hacker News•2026年4月2日

阅读全文原文

“即时”世界建模技术：提升人类规划与推理能力的模拟研究新进展

研究突破

“即时”世界建模技术：提升人类规划与推理能力的模拟研究新进展

本文介绍了一项前沿研究，重点探讨了“即时”（Just-in-Time）世界建模框架及其在模拟推理中的应用。该研究揭示了如何通过模拟机制优化预测模型，从而在复杂场景下为人类的规划与推理过程提供更高效的支持，标志着AI在辅助决策领域的重要突破。

KDnuggets•2026年4月2日

阅读全文原文

Google Gemini API 推出全新推理模式：平衡成本与可靠性的 Flex 与 Priority 方案

产品发布

Google Gemini API 推出全新推理模式：平衡成本与可靠性的 Flex 与 Priority 方案

Google AI 博客宣布在 Gemini API 中引入全新的推理选项，旨在帮助开发者在成本控制与系统可靠性之间取得平衡。此次更新重点推出了 Flex 和 Priority 两种推理模式，为不同需求的开发者提供了更具灵活性的 API 调用选择，优化了大规模 AI 应用的资源分配效率。

Google AI Blog•2026年4月2日

阅读全文原文

Google Vids 迎来重大更新：集成 Lyria 3 与 Veo 3.1 实现免费视频创作

产品发布

Google Vids 迎来重大更新：集成 Lyria 3 与 Veo 3.1 实现免费视频创作

Google 宣布为其视频创作工具 Google Vids 引入全新的 AI 功能。通过集成 Lyria 3 和 Veo 3.1 模型，用户现在可以免费生成、编辑和分享高质量视频。此次更新旨在降低专业视频制作的门槛，利用 Google 最先进的 AI 技术为 Workspace 用户提供更高效的创作体验。

Google AI Blog•2026年4月2日

阅读全文原文

产品发布

谷歌Vids应用升级：现在支持通过提示词直接指挥AI数字人角色

谷歌（Google）近日为其视频制作应用Vids推出了重要更新。用户现在可以通过输入提示词（Prompts）来定制并指挥视频中的AI数字人（Avatars）。这一功能旨在简化视频创作流程，让用户能够更灵活地控制数字角色的表现与指令，进一步提升了AI在办公视频协作中的应用效率。

TechCrunch AI•2026年4月2日

阅读全文原文