歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 1 期(2026-06-10)
大廠・2026-06-10

Google 發表 Gemini 3.5 Live Translate,語音對語音即時口譯

Google 發表 Gemini 3.5 Live Translate,語音對語音即時口譯

Google DeepMind 推出 Gemini 3.5 Live Translate,主打自然流暢的即時語音對語音翻譯,會保留說話者的語氣、停頓與音調,跨語言對話接近零延遲。功能先在 Google AI Studio、Google 翻譯與 Google Meet 上線,後續會從手機與耳機產品線往外鋪。

語音翻譯最難的部分從來都是「像人」:逐字翻得準的系統早就存在,難的是讓翻出來的聲音保留原本說話者的節奏與情緒,聽起來像同一個人換了語言在說話,Live Translate 主攻的正是後面這一段。Ars Technica 補了一個重要細節:所有翻譯產出的語音都會嵌入 SynthID 浮水印,方便辨識合成內容——聲音能被即時複製換語言之後,防偽機制得跟著上線。

應用端的衝擊很好想像:旅遊、跨國客服、多語會議這幾塊的翻譯需求,會被作業系統與通訊軟體內建的功能直接吃掉。人力口譯不會消失,高階的同步口譯與法律、醫療這類高風險場合仍然需要真人把關,但中低階市場要重新洗牌,靠語言能力吃飯的工作者得往更專業、更吃信任的方向移動。

歸剛點評|科幻小說裡的巴別魚正式上架。旅遊、客服、跨國會議這幾塊的翻譯需求,會被系統層內建功能直接吃掉,靠人力口譯吃飯的市場要重新洗牌。

同期其他文章