返回列表
PrismML 发布 1-Bit Bonsai:全球首款商用 1 比特大语言模型,内存占用降低 14 倍
研究突破人工智能大语言模型硬件优化

PrismML 发布 1-Bit Bonsai:全球首款商用 1 比特大语言模型,内存占用降低 14 倍

PrismML 正式推出 1-Bit Bonsai 系列模型,这是全球首批具备商业可行性的 1 比特权重 LLM。该系列包含 8B、4B 及 1.7B 三种规格,旨在解决大型模型无法适配智能手机及数据中心能耗过高的问题。其中 8B 版本仅需 1.15GB 内存,性能却能媲美主流全精度 8B 模型,标志着端侧 AI 与机器人领域迎来重大突破。

Hacker News

核心要点

  • 极致压缩率:1-Bit Bonsai 8B 模型的内存占用仅为 1.15GB,较全精度模型缩小了 14 倍。
  • 卓越性能表现:运行速度提升 8 倍,能效提高 5 倍,且在基准测试中与领先的 8B 模型持平。
  • 端侧设备适配:1.7B 版本在 iPhone 17 Pro Max 上可达 130 tokens/s,4B 版本在 M4 Pro 上可达 132 tokens/s。
  • 高智能密度:通过 1 比特权重技术,实现了超过全精度 8B 模型 10 倍以上的智能密度。
  • 应用场景广泛:专为机器人、实时智能体(Agents)及边缘计算等对功耗和速度敏感的场景设计。

详细分析

突破性的 1 比特量化技术

PrismML 推出的 1-Bit Bonsai 系列解决了当前大模型部署的核心痛点:内存占用过高。通过将权重压缩至 1 比特,8B 参数规模的模型仅需 1.15GB 内存即可运行。这种“超高密度智能”技术不仅让模型能够轻松装入智能手机,还显著降低了数据中心的运行成本。1-Bit Bonsai 8B 在大幅减小体积的同时,依然在 IFEval、GSM8K、MMLU-Redux 等多项基准测试中保持了与全精度模型相当的准确度。

针对边缘计算与移动端的深度优化

该系列模型针对不同硬件平台进行了极致优化。1-Bit Bonsai 4B 版本在 M4 Pro 芯片上展现了惊人的 132 tokens/s 处理速度,而最轻量化的 1.7B 版本(仅 0.24GB 内存占用)在 iPhone 17 Pro Max 上也能达到 130 tokens/s。这种低延迟、低功耗的特性,使其成为实时机器人控制和移动端 AI 应用的理想选择,真正实现了“将大模型放进口袋”。

行业影响

PrismML 的这一发布标志着 AI 模型从“参数竞赛”转向“效率竞赛”。1-Bit Bonsai 的商用化证明了极低比特量化模型在保持高性能的同时,可以极大地降低硬件门槛。这将加速 AI 在机器人、可穿戴设备及各类边缘侧硬件中的普及,改变目前大模型过度依赖云端算力的现状,推动端侧 AI 时代的全面到来。

常见问题

什么是“智能密度”?

根据 PrismML 的定义,智能密度是指模型误差率的负对数除以模型大小。1-Bit Bonsai 8B 的智能密度是传统全精度 8B 模型的 10 倍以上,意味着它在单位存储空间内提供了更高的智能水平。

1-Bit Bonsai 8B 相比传统模型有哪些优势?

相比全精度 8B 模型,它拥有 14 倍更小的体积、8 倍的运行速度以及 5 倍的能效提升,且在主流基准测试中表现出色,适合对实时性要求极高的任务。

该模型支持哪些硬件平台?

目前官方数据显示,该系列模型在苹果 M4 Pro 芯片、iPhone 17 Pro Max 以及各类机器人和边缘计算平台上均有优异的性能表现。

相关新闻

微软研究院发布 Data Formulator 0.7:AI 驱动的企业级数据分析新进展
研究突破

微软研究院发布 Data Formulator 0.7:AI 驱动的企业级数据分析新进展

微软研究院(Microsoft Research)正式发布了 Data Formulator 0.7 版本。该工具专注于利用人工智能技术优化企业级数据分析流程。由 Chenglong Wang 等研究员开发,该版本标志着 AI 在辅助复杂数据处理与转换方面的进一步探索,旨在提升企业处理大规模、高复杂度数据时的效率与准确性。

OpenAI模型推翻离散几何核心猜想,解决困扰数学界80年的厄多斯难题
研究突破

OpenAI模型推翻离散几何核心猜想,解决困扰数学界80年的厄多斯难题

2026年5月20日,OpenAI宣布其内部通用推理模型成功推翻了离散几何领域的一个核心猜想——平面单位距离问题。该问题由保罗·厄多斯于1946年提出,近80年来数学界一直认为“方格阵”构造是该问题的最优解。OpenAI的模型通过提供一系列无限示例,实现了多项式级别的改进,证明了原有猜想的错误。此项成果已获外部数学家团队验证,标志着通用AI在基础科学前沿研究中取得重大突破。

谷歌发布ERA:从Nature论文到推动计算科学发现的实证研究助手
研究突破

谷歌发布ERA:从Nature论文到推动计算科学发现的实证研究助手

谷歌研究(Google Research)正式介绍了实证研究助手(Empirical Research Assistance,简称ERA)。该项目源于其在《自然》(Nature)杂志上发表的研究成果,旨在通过提供专业的实证研究支持,催化并加速计算科学领域的发现进程,实现从学术理论向科研实用工具的重要转化。