歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 16 期(2026-06-25)
基建・2026-06-25

Gemini 3.5 Flash 學會「用電腦」:DeepMind 把代理操作下放到便宜快模型

Gemini 3.5 Flash 學會「用電腦」:DeepMind 把代理操作下放到便宜快模型

DeepMind 宣布把 computer use 能力帶進 Gemini 3.5 Flash。所謂 computer use,指的是讓模型像人一樣直接操作圖形介面:看畫面、移動游標、點按鈕、填欄位、在多個步驟之間自己決定下一步。過去這類能力多半綁在最大、最貴的旗艦模型上,這次放進 Flash 這條主打速度與低價的產品線,意義在於門檻被往下拉。

把代理能力放進便宜模型,動的是經濟帳。一個會自己操作網頁、跑完整套流程的代理,每一步都要呼叫一次模型,步驟一多,旗艦模型的帳單很快就嚇人。Flash 這種輕量模型反應快、單次便宜,特別適合那種「步驟很多、但每一步都不難」的瑣碎自動化,例如查資料、填表、跨系統搬資料。成本降一階,能被自動化的工作清單就長一截。

把這條發展接回本站近期的脈絡來看。前幾期談 Anthropic 把 Claude 塞進 Slack、OpenAI 自研推論晶片,方向都指向同一件事:當模型能力逐漸拉平,巨頭比的是誰能把「跑得起、用得起」的代理鋪到最多場景。把昂貴能力下放到便宜模型,正是擴大鋪設面的關鍵一步,也預告今年代理產品的競爭會從「能不能做」轉向「划不划算」。

歸剛點評:對中小團隊這是好消息,便宜模型也能跑代理,等於自動化的入場券降價。但便宜呼叫一多,帳單照樣會偷偷膨脹——本站同一期就有一條講公司在阻止員工燒爆 AI 預算,兩件事擺一起看特別有味道。

歸剛點評|把代理操作能力下放到便宜快模型,會大幅降低自動化的單位成本,是今年代理產品從『能不能做』轉向『划不划算』的關鍵訊號。

同期其他文章