2026年4月12日 的AI新闻

Archon:首个面向AI编程的开源测试基准构建器正式发布
开源项目

Archon:首个面向AI编程的开源测试基准构建器正式发布

Archon是由开发者coleam00推出的首个专门面向AI编程领域的开源测试基准构建器。该工具旨在解决AI编程过程中结果不确定、难以复现的痛点,通过提供标准化的构建流程,让AI编程变得更加确定且可重复,为开发者评估和优化AI编程模型提供了关键的基础设施。

GitHub Trending
Rowboat:具备记忆能力的开源AI协作伙伴正式亮相GitHub
开源项目

Rowboat:具备记忆能力的开源AI协作伙伴正式亮相GitHub

Rowboat是由rowboatlabs开发的一款开源AI协作工具,其核心特性在于赋予了AI协作伙伴“记忆”能力。该项目近期在GitHub Trending榜单引起关注,旨在通过持久化记忆提升AI在协作场景中的表现。作为一款开源项目,它为开发者提供了构建更具上下文感知能力的AI应用的新途径。

GitHub Trending
微软开源 MarkItDown:一键将办公文档与多种文件转换为 Markdown 的 Python 利器
开源项目

微软开源 MarkItDown:一键将办公文档与多种文件转换为 Markdown 的 Python 利器

微软在 GitHub 上正式开源了 MarkItDown 工具,这是一款专门用于将各类文件和办公文档高效转换为 Markdown 格式的 Python 库。该工具旨在简化文档格式转换流程,支持多种常见文件类型,为开发者和内容创作者提供了便捷的自动化文档处理方案,目前已在 GitHub Trending 榜单引起广泛关注。

GitHub Trending
NousResearch 发布 Hermes Agent:一款旨在与用户共同成长的智能体项目
开源项目

NousResearch 发布 Hermes Agent:一款旨在与用户共同成长的智能体项目

NousResearch 在 GitHub 上发布了名为 Hermes Agent 的开源项目。该项目以“与你一同成长的智能体”为核心理念,展示了其在 AI 代理领域的最新探索。作为知名研究机构 Nous Research 的新作,Hermes Agent 延续了其在开源模型领域的积累,致力于构建具备进化能力的智能交互体验。

GitHub Trending
香港大学HKUDS发布DeepTutor:智能体原生的个性化学习助手
开源项目

香港大学HKUDS发布DeepTutor:智能体原生的个性化学习助手

香港大学HKUDS团队在GitHub上发布了名为DeepTutor的开源项目。该项目被定义为“智能体原生(Agent-native)”的个性化学习助手,旨在利用先进的AI智能体技术,为用户提供定制化的学习支持。作为GitHub Trending的热门项目,DeepTutor展示了AI在教育领域深度应用的新方向。

GitHub Trending
荷兰正式批准特斯拉受监督FSD,成为首个获准使用的欧洲国家
行业新闻

荷兰正式批准特斯拉受监督FSD,成为首个获准使用的欧洲国家

荷兰车辆管理局(RDW)在经过一年半的严格测试后,正式批准特斯拉的受监督全自动驾驶(FSD Supervised)系统在该国道路上使用。作为首个授权该技术的欧洲国家,荷兰的这一决定被视为特斯拉在欧洲市场推广自动驾驶技术的关键里程碑,可能为FSD在整个欧盟范围内的普及铺平道路。

The Verge
研究突破

突破存储极限:氟化石墨烯实现每平方厘米447TB原子级非易失性存储

一项发表于2026年的研究提出了一种基于单层氟化石墨烯(CF)的新型存储架构。该技术利用氟原子相对于碳骨架的双稳态共价取向作为二进制位,实现了每平方厘米447 TB的超高存储密度。这种原子级存储不仅具有零保持能耗和极高的稳定性,还通过卷轴式架构理论上可达每立方厘米ZB级的容量,有望彻底解决AI时代的“存储墙”与NAND闪存供应危机。

Hacker News
行业新闻

伯克利研究揭秘AI智能体榜单乱象:如何通过漏洞在顶级基准测试中获得满分

加州大学伯克利分校的研究团队发布报告,揭示了当前主流AI智能体基准测试(如SWE-bench、WebArena等)存在的严重安全漏洞。研究人员开发了一个自动化扫描代理,通过利用评分机制而非解决实际任务,在多个顶级榜单中获得了接近满分的成绩。这一发现挑战了当前AI行业过度依赖榜单评分的现状,揭示了“榜单幻觉”背后的技术缺陷。

Hacker News
小模型也能发现零日漏洞:Anthropic Mythos 后的 AI 网络安全新前沿
行业新闻

小模型也能发现零日漏洞:Anthropic Mythos 后的 AI 网络安全新前沿

本文探讨了 AI 在网络安全领域的最新进展。尽管 Anthropic 发布了强大的 Mythos 模型并展示了其发现数千个零日漏洞的能力,但研究发现,小型开源模型同样能识别出相同的漏洞。这表明 AI 的安全能力并非随模型规模线性增长,真正的竞争壁垒在于集成安全专业知识的系统,而非模型本身。

Hacker News