Gemini 3.1 Flash Live
Gemini 3.1 Flash Live:更自然、可靠且低延遲的全新語音 AI 模型
Gemini 3.1 Flash Live 是 Google 推出的最高品質音訊與語音模型,專為提升 AI 即時對話的流暢度與精確度而設計。該模型具備極低延遲與卓越的推理能力,能理解語調細微差別並在吵雜環境中精準執行任務。目前已應用於 Google Search Live、Gemini Live 以及企業級解決方案,支持多國語言,並內建 SynthID 水印技術,為開發者和全球用戶提供直覺、自然的互動體驗。
2026-03-29
8510.7K
Gemini 3.1 Flash Live 产品信息
Gemini 3.1 Flash Live:引領新一代自然可靠的語音 AI 互動體驗
隨著人工智慧技術的飛速發展,語音互動已成為人機協作的核心。Google 正式發布了其最新、最高品質的音訊與語音模型 —— Gemini 3.1 Flash Live。這款模型旨在顯著提升語音交互的精確度並降低延遲,讓 AI 對話變得更加流暢、自然且值得信賴。
什麼是 Gemini 3.1 Flash Live?
Gemini 3.1 Flash Live 是 Gemini 系列模型中的最新成員,專為即時對話場景優化。它不僅具備極高的反應速度,還能精確模擬人類對話的自然節奏。無論是對於尋求高效工具的開發者、追求卓越客戶體驗的企業,還是希望獲得直覺服務的普通用戶,Gemini 3.1 Flash Live 都提供了前所未有的語音優先(Voice-first)體驗。
目前,Gemini 3.1 Flash Live 已經全面整合至 Google 的多個產品生態中,包括:
- Google AI Studio:透過 Gemini Live API 提供給開發者進行預覽測試。
- Gemini Enterprise for Customer Experience:助力企業打造優質的客戶服務。
- Search Live 與 Gemini Live:讓全球使用者在日常搜尋與對話中使用。
Gemini 3.1 Flash Live 的核心特性
1. 卓越的推理與任務執行能力
Gemini 3.1 Flash Live 在複雜任務處理上表現優異。在 ComplexFuncBench Audio 基準測試中,該模型在處理多步驟函數調用及各種約束條件時,取得了 90.8% 的領先分數。這意味著它能更可靠地協助開發者構建可大規模執行複雜任務的語音代理。
2. 深度的長程推理與抗干擾能力
在 Scale AI 的 Audio MultiChallenge 測試中,當開啟「思考(Thinking)」模式時,Gemini 3.1 Flash Live 以 36.1% 的得分位居前列。該測試專門針對現實環境中的中斷、猶豫等情況,驗證模型在複雜指令遵循與長程推理方面的穩定性。
3. 細膩的語調理解與情緒感知
相較於先前的 2.5 Flash Native Audio,Gemini 3.1 Flash Live 對於音訊細節(如音高和語速)的辨識能力更強。它能動態捕捉用戶在對話中表現出的挫敗或困惑,並據此調整回應方式,使對話更具同理心。
4. 低延遲與長時記憶
在 Gemini Live 應用中,該模型不僅提供了更快的響應速度,還能維持兩倍長的對話上下文記憶,確保在長時間的集思廣益過程中,用戶的思緒不會被打斷。
5. 原生多語言支持與全球擴展
Gemini 3.1 Flash Live 天生具備多語言能力。這使得 Search Live 能夠在本週擴展至全球 200 多個國家和地區,用戶可以用自己熟悉的語言進行即時、多模態的對話。
應用場景:Gemini 3.1 Flash Live 能做什麼?
Gemini 3.1 Flash Live 的強大功能可應用於多個領域:
- 開發者工具:開發者可以利用 Gemini 3.1 Flash Live 的語音功能進行「語音編程(Vibe code)」,通過口述指令快速迭代代碼。
- 企業客服:如 Verizon、LiveKit 和 The Home Depot 等公司已將其納入工作流,利用其自然對話能力提升客戶滿意度。
- 吵雜環境下的語音代理:即使在環境噪音較大的情況下,也能精準執行複雜任務。
- 日常即時搜尋:透過 Search Live 獲取實時的疑難排解建議,享受流暢的多模態互動。
- 安全與防偽:模型生成的所有音訊均嵌入了 SynthID 不可見水印,方便檢測 AI 生成內容,防止虛假資訊傳播。
如何使用 Gemini 3.1 Flash Live
根據您的身份,可以透過以下方式開始體驗 Gemini 3.1 Flash Live:
- 開發者:登入 Google AI Studio,透過 Gemini Live API 接入模型進行開發與測試。
- 企業用戶:在 Gemini Enterprise 平台中啟用該模型,以優化企業內部的客戶服務系統。
- 個人用戶:
- 打開 Google 應用程式使用 Gemini Live 進行語音對話。
- 使用 Search Live 進行多模態即時搜尋互動,支援全球 200 多種語言環境。
常見問題 (FAQ)
Q: Gemini 3.1 Flash Live 比起前代模型有哪些進步? A: 它在任務執行(ComplexFuncBench Audio)上達到 90.8% 的高分,延遲更低,且能維持比以往長兩倍的對話上下文記憶,同時對音高和語速的理解更精確。
Q: 這款模型安全嗎? A: 是的,所有由 Gemini 3.1 Flash Live 生成的音訊都使用 SynthID 技術添加了水印,這是一種編織在音訊頻譜中的不可見標記,有助於辨識 AI 生成內容。
Q: 哪些地區可以使用 Search Live 的多語言功能? A: 隨著 Gemini 3.1 Flash Live 的發布,Search Live 已擴展至全球超過 200 個國家和地區,支持多國語言的即時對話。
立即開始體驗 Gemini 3.1 Flash Live 帶來的自然與可靠,探索語音 AI 的無限可能。








