NotebookLM实现里程碑更新:正式支持图像作为数据源,赋能学生与学习者
NotebookLM近日迎来一项里程碑式更新,正式支持用户将图像作为数据源进行检索。这意味着课堂板书、教科书内容、表格以及街头随拍照片等各类图像,均可导入NotebookLM并进行检索。此项功能预计将对学生群体和需要听课记录的人士带来极大的便利和实用价值。
NotebookLM近日迎来一项里程碑式更新,正式支持用户将图像作为数据源进行检索。这意味着课堂板书、教科书内容、表格以及街头随拍照片等各类图像,均可导入NotebookLM并进行检索。此项功能预计将对学生群体和需要听课记录的人士带来极大的便利和实用价值。
谷歌云和加州大学洛杉矶分校(UCLA)的研究人员提出了一种名为“监督强化学习”(SRL)的新型强化学习框架。该框架通过将问题解决重构为一系列逻辑“动作”,在训练过程中提供丰富的学习信号,显著提升了语言模型学习复杂多步推理任务的能力。实验表明,SRL不仅在数学推理基准测试中表现出色,还能有效泛化到代理软件工程任务。与现有依赖最终答案正确性的强化学习方法(RLVR)相比,SRL能让更小、成本更低的模型达到更高的推理水平,解决了传统方法在处理极具挑战性问题时因稀疏奖励和计算成本导致的学习瓶颈。
NVIDIA宣布,其生成式AI超分辨率技术正显著加速天气预测。结合NVIDIA Earth-2平台和CorrDiff模型,该技术实现了50倍的速度提升,为低计算需求、可扩展的AI模型提供了解决方案。这意味着更快的模型训练和实时预测已成为现实。
一项新研究表明,一个新型基础AI模型能够适应并识别罕见癌症的早期迹象。医学影像产生大量难以完全分析和利用的3D数据,尤其在罕见癌症检测方面。荷兰埃因霍温理工大学(TU/e)团队利用计算能力是前身百倍的超级计算机SPIKE-1,通过超过25万份CT扫描创建了一个多功能AI模型。该模型旨在实现更快、更准确的癌症检测,并通过开源工具支持全球合作,显著推动罕见癌症研究和全球医疗创新。
Meta Tech播客最新一集深入探讨了开源硬件及其对环境的积极影响。节目中,Pascal Hartig与Dharmesh和Lisa讨论了开源硬件的方方面面,并介绍了Meta在2025年开放计算项目(OCP)峰会上的重要发布,其中包括利用AI理解Scope 3排放的新开放方法。听众将了解OCP的历史及其发展,以及AI和开源硬件如何帮助Meta在2030年实现净零排放目标,包括AI在数据中心建设中开发新型混凝土混合物方面的应用。
OpenAI对一项法院命令表示强烈不满,该命令允许《纽约时报》查阅2000万条完整的用户聊天记录。此举引发了对用户隐私和数据安全的担忧,OpenAI方面认为这一裁决存在严重问题。目前,关于此案件的更多细节以及OpenAI将如何应对尚不明确。
Databricks本周详细介绍了其“ai_parse_document”技术,该技术已集成到Databricks的Agent Bricks平台中。此工具旨在解决企业AI应用中的关键瓶颈,即大约80%的企业知识仍被困在PDF、报告和图表中,现有AI系统难以准确处理和理解。Databricks首席研究科学家Erich Elsen指出,尽管人们普遍认为PDF解析已解决,但实际上,由于企业PDF的复杂性,如混合内容、不规则布局等,现有工具难以准确捕获信息,导致下游AI应用不可靠。新工具旨在取代多服务管道,以单一功能解决这一挑战。