第 9 期2026-06-18(台北時間)
第九期,AI 的政治風險這天集中爆發。Anthropic 因為一道連業界都看不懂的出口管制,被迫把 Fable 5 與 Mythos 5 對全球下線,連美國境內的外籍員工都用不了——這也讓 G7 上馬克宏、莫迪擔心的『美國隨時能關掉 AI』從假想變成現場直播。另一頭,科學 AI 同日端出三道菜:Google 的醫療 AI AMIE 登上《自然》、複雜慢病管理追平基層醫師,OpenAI 則拿出近自主的 AI 化學家與生命科學評測基準 LifeSciBench。資本的想像力也在轉彎,世界模型新星 Odyssey 在 Amazon 加持下估值衝上 14.5 億美元。但皮尤民調潑了盆冷水:只有 16% 的美國人覺得 AI 是好事、63% 嫌它太快,卻有近半的人天天在用。歸剛欸,當管制、科學突破、資本狂熱和民間焦慮擠在同一天,AI 這局比的早就不只是模型強不強,而是它撐不撐得住政治、贏不贏得回人心。
頭條
Anthropic 這一週幾乎都在做同一件事:想辦法把自己最新的模型重新開回來。The Verge 報導,川普政府突然下令要求 Anthropic 切斷所有外國國民對新模型的存取,範圍大到連人在美國境內的外籍使用者、甚至 Anthropic 自家的外籍員工都被一併擋下。為了符合這道命令,公司只能把 Fable 5 與 Mythos 5 兩款新模型對所有人全面下線,寧可全關也不敢漏接。
麻煩的地方在於,這道出口管制連業界都坦言看不太懂。出口管制原本的設計,是擋住敏感技術流向特定對象,但這次被管的是一家美國公司提供給一般使用者的對話模型,界線該畫在哪、誰算「外國國民」、人在美國境內用算不算出口,全都模糊。The Verge 的另一篇專欄甚至形容這是一場「瑣碎卻會重塑整個前沿 AI 發展」的角力——白宮與 Anthropic 為了 Fable 與 Mythos 的爭執,正在示範政策一旦含糊,平台會被迫做出多誇張的過度防守。
把鏡頭拉遠,這件事真正嚇到人的是它證明了一個假設:美國政府確實有能力、也願意對一家民間 AI 公司的服務「按下開關」。模型不是一次性賣出去的硬體,而是要持續連線、隨時可被切斷的雲端服務,這個結構讓政府的管制權力遠比過去任何科技出口都來得即時。一夕之間全球斷線,不是新聞標題的誇飾,是真的發生了。
對台灣的團隊,這是一記很實際的提醒。把核心流程綁死在單一海外 AI 供應商上,承擔的已經不只是商業風險,還有完全在你掌控之外的地緣政治風險——某天因為一道你看不懂、也參與不了的行政命令,服務就沒了。務實的做法是預留替代模型、保留可切換的架構,並且假設「會被關掉」是有機率發生的事,而不是杞人憂天。
歸剛點評|這是模型即服務時代第一個被公開驗證的『關機鍵』案例。對開發者最該記的一課:你用的海外 AI 隨時可能因為一道你無從置喙的命令而斷線,架構上一定要留後路、別單點押注。
政策
法國總統馬克宏與印度總理莫迪在 G7 峰會公開示警,擔心美國可能一夜之間切斷各國對美國 AI 的存取。Anthropic 這週的全球斷線,等於當場把這個假想敵變成了真實案例。
在 G7 峰會上,法國總統馬克宏與印度總理莫迪先後出聲示警:各國一方面渴望用上美國領先的 AI,另一方面卻越來越怕美國有一天會一聲令下、把存取權整個切斷。TechCrunch 的標題把這種矛盾講得很白——世界各國要美國 AI,但不想要美國握有隨時關掉它的能力。
這個焦慮在過去可能還被當成外交場合的假設性發言,但 Anthropic 本週的全球斷線剛好把它坐實了。當一家頭部美國公司,因為一道國內的出口管制命令,就得把新模型對全世界下線,馬克宏和莫迪擔心的劇本就不再是想像,而是剛剛上演過一次的現實。對任何把國家級服務、產業升級押在美國模型上的政府來說,這種依賴突然有了清楚的代價。
背後牽動的是 AI 主權這個越來越熱的命題。各國開始認真盤算:關鍵基礎設施若高度依賴某一國的雲端 AI,等於把一部分國家自主權交到別人手上。歐洲、印度、中東這幾年砸錢扶植本土模型與在地資料中心,動機正是要降低這種被單一供應國掐住脖子的風險,而這週的事件只會讓這股去風險化的動力更強。
對台灣同樣值得對照思考。我們的產業在硬體供應鏈上是關鍵角色,但在最上層的前沿模型上仍高度仰賴美國公司。當「AI 會不會被斷供」從理論變成新聞,政府與企業在規劃 AI 戰略時,多一層備援與多元來源的考量,會比事後補救划算得多。
歸剛點評|Anthropic 斷線替 G7 的口水戰提供了血淋淋的證據,AI 主權從學術名詞變成各國元首當面講的事。台灣硬體強、模型仰賴美國,這道題我們遲早要面對。
產業
企業支出數據商 Ramp 的資料顯示,Anthropic 在商業客戶間的受歡迎程度持續成長,最新這場與政府的衝突,可能反而替它加了分。
正當 Anthropic 為了出口管制焦頭爛額,企業支出平台 Ramp 的刷卡數據卻給出一個有點反直覺的訊號:Anthropic 在商業客戶之間的採用度還在往上走,這次跟川普政府的正面衝突,看起來不但沒嚇跑企業,反而可能替它加了分。TechCrunch 引述這份銷售數據,點出一個值得玩味的現象。
為什麼槓上政府反而有助於賣 AI?一個合理的解讀是品牌定位。Anthropic 長期把自己塑造成最在意安全、最願意對權力說不的那家前沿實驗室,當它公開承受來自白宮的壓力,等於替這個人設做了最有說服力的背書。對於重視合規、重視供應商立場的企業採購來說,「敢頂住政府」反而成了信任的加分項,而不是風險。
Ramp 這類數據之所以值得參考,是因為它看的是真金白銀的企業刷卡,而不是問卷或公關稿。企業願不願意持續付費續訂,是比下載量更硬的指標。當這個指標在風波中還能往上,說明 Anthropic 的商業基本盤相當穩固,短期的政治雜訊還沒有傷到它的核心營收引擎。
不過樂觀也得有保留。企業採用的慣性很強,這個月的數據反映的是衝突爆發前後的短期反應,真正的考驗在於斷線事件如果反覆發生、或服務穩定性開始受影響,企業的耐心還能撐多久。對台灣的採購方來說,一家供應商的價值觀加分是一回事,服務會不會因政治因素中斷又是另一回事,兩者都要放進評估表裡。
歸剛點評|用刷卡數據看 AI 採用,比下載量誠實多了。Anthropic 的『安全人設』在這次風波裡反而變現成信任,但企業看的終究是服務穩不穩,這層觀察台灣採購方可以直接拿來用。
產業
Anthropic 宣布在首爾開設辦公室,並公布與韓國 AI 生態系多方夥伴的新合作,正式把版圖往東亞延伸。
Anthropic 在 6 月 17 日宣布於首爾設立辦公室,同時公布一系列橫跨韓國 AI 生態系的新夥伴關係。這是它把商業版圖往東亞推進的一步明確訊號,選在韓國落腳,背後有很實在的盤算。
韓國這幾年在 AI 上的投入相當積極,從大型企業集團到政府都在加碼,三星、SK 等財團握有從半導體到雲端的完整資源,本土也有自己的大型語言模型計畫。對 Anthropic 來說,進駐首爾不只是插旗,而是要貼近一個願意付費、技術成熟、又對前沿模型有強烈需求的市場,並透過在地夥伴把 Claude 系列接進韓國企業的工作流程裡。
把時間點放在這週的脈絡裡看更有意思。一邊是 Anthropic 在美國本土被出口管制搞得焦頭爛額,另一邊卻同時宣布海外擴張,這種反差說明前沿實驗室的成長動能還是緊緊綁在國際市場上。海外營收越重要,先前那種「美國政府一聲令下就得對外斷線」的結構性矛盾,對這些公司的殺傷力也就越大。
對台灣而言,鄰近的韓國成為頭部 AI 公司積極經營的據點,是一個該留意的區域訊號。當在地化的企業導入、技術支援、甚至資料中心布局都往韓國集中,台灣企業在採用同一批模型時,能拿到的在地資源與議價條件可能就不如鄰居。這提醒我們,AI 的競爭不只在技術,也在誰先把生態系經營起來。
歸剛點評|Anthropic 一邊在美國被管制綁手綁腳、一邊海外開疆拓土,這個反差正好說明前沿公司多依賴國際市場。韓國被頭部公司重點經營,對隔壁的台灣是個該對照的區域訊號。
研究
Google Research 在《Nature》發表研究,顯示其對話式醫療 AI 系統 AMIE 在複雜疾病管理上的表現,可以與基層家醫科醫師相當。
Google Research 在頂級期刊《Nature》發表新研究,主角是它的對話式醫療 AI 系統 AMIE。這次研究的重點放在「疾病管理」這個比單次診斷更難的場景——也就是面對需要長期追蹤、調整用藥、處理多重共病的複雜病況時,AI 的表現如何。結論相當亮眼:在這類複雜慢病管理任務上,AMIE 的表現可以與基層的家醫科醫師相當。
為什麼疾病管理比診斷更難?單次診斷比較像是一道有標準答案的題目,而慢病管理是一連串隨病情變化不斷調整的決策:這次回診要不要加藥、檢驗數字代表什麼、生活型態該怎麼建議,每一步都得綜合病史與當下狀況判斷。AMIE 能在這種需要連續推理、情境理解的任務上追平醫師,代表對話式 AI 的能力已經從「答對」往「能持續照護」推進。
登上《Nature》而非公司部落格,這個發表管道本身就是訊號。經過同儕審查的醫學期刊對方法與數據的要求遠高於企業自評,能通過這關,說明 Google 是要把 AMIE 放到嚴肅的學術與臨床標準下檢驗,而不只是行銷展示。當然,研究情境與真實診間之間仍有距離,能在受控研究裡追平,不等於明天就能取代醫師。
對台灣的醫療現場,這類進展的想像空間在於分流與輔助。基層醫療長期人力吃緊、慢性病人口又持續增加,若這種 AI 能在前期問診、衛教、追蹤提醒上分擔負荷,讓醫師把時間留給真正需要判斷的環節,價值會很實際。前提是落地時的法規、責任歸屬與資料隱私都要先理清,醫療這一塊,謹慎永遠比速度重要。
歸剛點評|醫療 AI 從『會診斷』走到『能管理慢病』是一大步,而且是過了《Nature》同儕審查的硬成果。對人力吃緊的台灣基層醫療,輔助分流的想像很實際,但法規與責任歸屬要先補課。
研究
OpenAI 與 Molecule.one 展示一個由 GPT-5.4 驅動、接近自主運作的 AI 化學家,成功改良了一個藥物製造中關鍵且棘手的化學反應。
OpenAI 與新藥研發公司 Molecule.one 合作,展示了一個由 GPT-5.4 驅動、接近自主運作的 AI 化學家。它的成績不是紙上談兵:這套系統實際改良了一個在藥物製造中既關鍵又棘手的化學反應,把醫藥化學的研究往前推了一步。所謂「近自主」,意思是 AI 能在相當程度上自己提出假設、設計實驗方向、根據結果迭代,而不需要研究人員每一步都手把手帶。
藥物合成裡的反應優化是出了名的耗時。一個反應的產率、選擇性、雜質控制往往要靠化學家反覆試誤,動輒數週數月。把 GPT-5.4 這類具備推理能力的模型接進這個迴圈,理論上能用更系統化的方式探索龐大的條件空間,更快收斂到可行的配方。這次能在一個「具挑戰性」的反應上做出改良,說明 AI 在這種高度專業的實驗科學裡已經能拿出真實貢獻,而不只是文獻整理。
這也呼應了一個更大的趨勢:前沿實驗室正把 AI 的戰場從寫程式、寫文件,往真正的科學發現延伸。化學、生物這些領域的價值極高,一個被加速的反應背後可能是省下的數百萬美元與好幾個月。誰能讓 AI 在實驗室裡可靠地產出結果,誰就握有比聊天機器人大得多的市場。
對台灣的生技與製藥研發者,務實的啟示是工具的門檻正在下移。過去這種 AI 輔助合成要有頂尖團隊與自建系統才玩得起,當頭部公司把能力產品化,中小型研發單位也有機會用上。值得追蹤的是後續會不會開放、定價如何,以及在地法規對 AI 參與藥物開發的認定,這些才決定它能不能真的進到台灣的實驗室。
歸剛點評|AI 從寫程式跨進真實的實驗科學,改良一個藥物反應背後是真金白銀的時間與成本。對台灣生技業,重點是這類能力正在被產品化、門檻下移,但開放程度與法規認定才是能不能落地的關鍵。
研究
OpenAI 發表 LifeSciBench,一個由專家撰寫、專家審核的評測基準,用來檢驗 AI 系統處理真實生命科學研究任務與決策的能力。
OpenAI 推出名為 LifeSciBench 的新評測基準,專門用來衡量 AI 系統在真實生命科學研究任務上的表現。它的特色寫在介紹裡:題目由領域專家撰寫、再經由專家審核,目標是貼近研究人員實際會遇到的任務與決策,而不是那種容易刷分、卻跟真實工作脫節的標準化考題。
推出一個專業領域的評測基準,意義往往被低估。當大家都在喊模型有多強,能不能在一個嚴謹、可重現的尺規上比較,才是讓進展可被檢驗的關鍵。生命科學的決策牽涉到實驗設計、數據判讀、文獻整合等多層能力,過去缺乏一把能涵蓋這些真實情境的尺,LifeSciBench 想補的正是這個洞。有了共同基準,不同模型在這個領域到底誰強誰弱,才有得比。
把它跟同一天 OpenAI 的 AI 化學家放在一起看,意圖就很清楚:先用評測基準定義「生命科學的 AI 能力」該怎麼量,再用實際成果證明自家模型能打。建立評測標準的人,某種程度上也在定義整個賽道的規則,這對 OpenAI 鞏固在科學 AI 上的話語權是一步棋。
對台灣的研究機構與生技團隊,這類基準是很好的選型參考。要不要把某個模型放進自家的研究流程,與其聽廠商宣傳,不如看它在 LifeSciBench 這種專家把關的測試上實際得幾分。同時也提醒一件事:評測基準是誰出的、題目偏向誰的強項,本身就值得多看一眼,採用前最好搭配自己領域的實測來交叉驗證。
歸剛點評|評測基準看似不性感,卻是讓 AI 進展可被檢驗的尺。OpenAI 同日推基準+秀成果,等於在搶定義科學 AI 賽道規則。對台灣研究單位,這是比廠商話術更靠譜的選型依據——但也要留意尺是誰做的。
資金
世界模型被視為 LLM 之後 AI 的下一個大方向,新創 Odyssey 在這輪融資後估值達 14.5 億美元,獲 Amazon 等知名投資方支持,奠定它在這個賽道的領跑地位。
做世界模型的新創 Odyssey,在最新一輪融資後估值衝上 14.5 億美元,背後站著 Amazon 等一票重量級投資方。TechCrunch 直接把世界模型定位成「LLM 之後 AI 的下一個大方向」,而這輪融資等於替 Odyssey 在這個還很早期的賽道裡先卡了個領跑位置。
世界模型跟我們熟悉的大型語言模型差在哪?語言模型擅長處理文字與符號,而世界模型試圖讓 AI 建立對物理世界運作方式的內在理解——物體會怎麼移動、互動、隨時間變化。這種能力被認為是讓 AI 從「會聊天」走向「能在真實或模擬環境中行動」的關鍵基礎,尤其對機器人、自駕、模擬訓練這些需要預測物理後果的應用至關重要。
Amazon 願意領頭很值得玩味。Amazon 在雲端、物流機器人、智慧裝置上都有龐大的實體世界應用場景,這些正是世界模型最有用武之地的地方。當這類巨頭開始把錢投向 LLM 以外的技術路線,傳遞的訊號是:純語言模型的故事市場已經聽得差不多了,下一波想像力要往「理解物理世界」找。資本的流向往往比技術成熟早一步。
對台灣的產業,世界模型的潛在連結點其實很硬:機器人與自動化。台灣在製造、精密機械、感測元件上有底子,而世界模型若能讓機器人更會預測與應對真實環境,正好接上這些強項。現在談落地還太早,但這是一個值得提早建立認知、別等到成熟才追的方向。
歸剛點評|世界模型是『LLM 之後』最被看好的方向,Amazon 帶頭投錢說明資本想像力正從純語言往理解物理世界轉。對機器人與製造有底子的台灣,這條線值得提早建立認知。
社會
皮尤研究中心最新報告顯示,雖然華爾街熱愛 AI,一般美國人卻明顯沒那麼樂觀:僅 16% 認為 AI 對社會有正面影響,63% 覺得技術發展太快,但同時有 49% 的人至少偶爾在用聊天機器人。
皮尤研究中心(Pew Research)最新出爐的民調,給火熱的 AI 產業潑了一盆現實的冷水。數字很刺眼:只有 16% 的美國人認為 AI 會對社會帶來正面影響,63% 覺得這項技術進展得太快,而與此同時,卻有高達 49% 的人說自己至少偶爾會用聊天機器人。一邊是華爾街把 AI 捧上天,一邊是普通人滿腹疑慮,兩者的落差被這份報告攤得清清楚楚。
最值得細看的是「一邊怕、一邊用」這個矛盾。49% 的使用率不算低,而且成長飛快——根據報告,AI 聊天機器人的使用比例從 2024 年的 33% 一路往上,ChatGPT 的使用量更是從 2023 年起翻倍,已有 44% 的人用過。換句話說,大眾的行為(越用越多)和態度(越來越擔心)正在朝相反方向走。這種口嫌體正直的狀態,通常代表技術已經滲進生活,但社會還沒準備好接受它帶來的衝擊。
為什麼產業熱、民眾冷?合理的解釋是兩邊看到的東西不一樣。投資人看到的是效率、營收與成長曲線;一般人感受到的卻是工作會不會被取代、資訊真假難辨、隱私被怎麼用這些切身焦慮。當好處集中在少數公司與股東、風險卻分散到每個普通人身上,悲觀就不難理解了。這也是為什麼監管與信任問題會一直糾纏 AI 產業。
對台灣的觀察者,這份美國數據是一面鏡子。台灣社會對 AI 的接受度、焦慮點未必一樣,但「越用越多、卻越來越不安」的心理結構很可能相通。對想推 AI 產品或服務的團隊,這提醒一件事:光秀技術強沒用,怎麼處理使用者對工作、隱私、真假資訊的擔憂,會直接決定產品能不能被社會真正接住。
歸剛點評|華爾街與街頭對 AI 的溫差大到誇張:16% 覺得有益、63% 嫌太快,卻有近半的人天天在用。這種『邊怕邊用』是做 AI 產品的人最該讀懂的人心,技術強不等於社會接得住。
產品
Google 推出睽違六年的新智慧音箱,售價 99.99 美元,重點不在音質而在 Gemini——用更自然的對話互動取代過去 Google Assistant 時代死板的指令。
Google 推出了睽違六年的新智慧音箱,定價 99.99 美元,而它真正的賣點不在喇叭,而在裡頭那顆 Gemini。TechCrunch 點出核心改變:新的 Google Home Speaker 要用生成式 AI 為智慧音箱這個有點過氣的品類重新注入生命,把過去 Google Assistant 時代那種「你得記住特定咒語才喚得動」的死板指令,換成更接近自然聊天的對話互動。
智慧音箱這幾年其實有點尷尬。第一波熱潮過後,多數人用它的場景退化成定鬧鐘、放音樂、查天氣這幾招,那種「家裡的智慧中樞」願景遲遲沒兌現,原因之一就是舊式語音助理太笨、聽不懂自然講法、稍微繞一下就卡住。把大型語言模型塞進音箱,理論上能讓它聽懂更口語、更有上下文的指令,這正是 Google 想用 Gemini 解決的老問題。
從 Ars Technica 的角度看,這台機器「重點是 Gemini 而非音質」,等於 Google 自己也承認硬體只是載體,真正要賣的是 AI 體驗。這也透露出大廠的算盤:智慧音箱是把 AI 助理塞進家庭日常、養成使用習慣的低成本入口。99.99 美元的定價不高,目的就是讓 Gemini 用最低的門檻進到更多客廳裡。
對台灣的消費者與通路,務實的提醒有兩點。第一,這類裝置的價值高度取決於語言與在地服務的支援程度,繁中對話、本地內容串接做得好不好,會直接決定它在台灣好不好用。第二,把一顆隨時在聽的 AI 放進家裡,隱私與資料怎麼處理值得多問一句。買之前先確認它在台灣的實際支援與隱私設定,別只被「能聊天」的賣點吸引。
歸剛點評|智慧音箱沉寂多年,Google 賭 Gemini 能讓它聽懂人話、重新有用。99.99 美元是把 AI 助理塞進客廳的低門檻入口。台灣買家要看的是繁中支援與隱私設定,這兩點才決定它好不好用。
模型
GLM 系列推出 5.2 版,主打「長週期任務」(long-horizon tasks),瞄準需要連續多步驟、跨較長時間維持目標的 AI 代理場景。
GLM 系列在 Hugging Face 上推出新一代的 GLM-5.2,標語直接點題:為長週期任務(long-horizon tasks)打造。這個定位很值得注意,因為它瞄準的正是當前 AI 代理最難啃的那塊骨頭——如何在一連串需要連續多步驟、跨較長時間還能維持目標不跑偏的任務裡穩定發揮。
長週期任務難在哪?短任務像是回答一個問題、改一段程式,模型一次就能搞定。但真實工作往往是一長串:規劃、執行、檢查結果、根據回饋調整、再繼續,中間任何一步出錯或忘了原本目標,整條任務就崩了。模型要在這種場景下表現好,需要更強的規劃能力、更穩的記憶與狀態維持,以及不在中途迷失方向的定力。GLM-5.2 把這個當主打方向,說明開源陣營也在認真追趕代理化的浪潮。
開源模型專門針對長週期任務發力,對整個生態有實際意義。閉源大廠的代理能力多半藏在 API 後面,開發者只能用、改不動;而一個能力對齊到代理場景的開源模型,讓研究者與小團隊可以自己部署、微調、研究它怎麼維持長任務的穩定性。這對降低代理開發的門檻、推動整個領域的透明度都有幫助。
對台灣的開發者,GLM-5.2 是個值得實測的選項。如果你正在做需要 AI 連續操作、跨多步驟完成的自動化流程,與其只盯著閉源 API,不如把這類主打長任務的開源模型也納入評估,特別是在意成本、資料自主、或想深度客製的場景。實際好不好用還是要自己跑過任務才算數,但多一個能掌控的選擇總是好事。
歸剛點評|長週期任務是 AI 代理最難的一關,開源陣營專門針對它出招,意味代理化不再是閉源大廠專利。對想做自動化流程又在意成本與資料自主的台灣開發者,這是值得實測的選項。
資安
Ars Technica 撰文指出,擁有進階入侵能力的 AI 模型即將變得普遍——無論業界與監管方願不願意,這類「危險」能力都會成為常態。
Ars Technica 拋出一個讓人不太舒服、卻不得不面對的判斷:具備進階駭客能力的 AI 模型「無論如何都會來」。文章的核心論點是,擁有高階入侵、漏洞發掘能力的 AI 即將從稀有變成普遍,這不是某一家公司要不要做的選擇題,而是技術擴散的必然結果。
為什麼擋不住?關鍵在於能力的雙面性與擴散速度。同一套讓 AI 能找出程式漏洞、做滲透測試的能力,防守方拿來是補洞,攻擊方拿來就是武器,而模型本身分不清使用者的善惡意圖。加上開源模型越來越強、微調門檻越來越低,就算頭部公司把自家模型管得再嚴,能力相近的替代品也會從別處冒出來。把希望全寄託在「不要做出這種模型」上,現實上行不通。
如果危險模型注定普及,那重點就得從「能不能阻止」轉到「怎麼應對」。這意味防守方也必須跟上:用 AI 來自動發現並修補自家漏洞、加快修補速度、假設攻擊者已經有 AI 助力來設計防線。這是一場攻防雙方都被 AI 加速的軍備競賽,停在原地的一方會被拉開差距。先前 Copilot 被挖出能竊取兩步驟驗證碼的漏洞,就是這種新型威脅的預演。
對台灣的企業與資安團隊,這篇文章是一記務實的警鐘。與其爭論該不該存在這種模型,不如假設它已經在攻擊者手上,回頭盤點自家的資安基本功:修補有沒有及時、二階段驗證夠不夠強、有沒有開始用 AI 工具強化防守。把資源投在「假設對手有 AI」的防禦升級上,比期待威脅不會發生實際得多。
歸剛點評|危險 AI 擋不住,因為同一套能力攻守通吃、又擴散得飛快。重點該從『能不能阻止』轉到『怎麼防』。台灣資安團隊最該做的,是假設攻擊者已經有 AI,回頭把修補與二階段驗證的基本功補實。
技術
Nvidia 的機器人自我改進計畫,動用整批 AI 編程代理來自動引導機器人訓練,讓機器人學會安裝 GPU、剪斷束線帶這類實際動手的工作。
Ars Technica 報導,Nvidia 的一項機器人自我改進計畫,玩法相當前衛:它動用整批 AI 編程代理來自動引導機器人的訓練過程,讓機器人學會一些非常具體、需要動手的活,例如安裝顯示卡、剪斷束線帶這類組裝產線上的細活。
這套做法的巧妙在於把「教機器人」這件事本身也交給了 AI。傳統上,要讓機器人學會一個新動作,得靠工程師寫控制程式、設計訓練流程、反覆調參,人力成本很高。Nvidia 的計畫改成讓一群 AI 編程代理來負責產生、測試、修正這些訓練程式,等於用 AI 去訓練機器人,把人從繁瑣的迭代裡解放出來。代理寫代碼、代碼訓機器人,形成一個能自我改進的迴圈。
把它跟同一天 Odyssey 的世界模型放在一起看,方向感就很清楚:AI 正在從螢幕裡的純軟體,往能影響物理世界的具身智慧延伸。能讓機器人更快學會新技能,意味自動化的導入速度與彈性都會提升——過去換一條產線、教機器人一個新工序要耗上數週,若能壓縮到幾天,製造業的反應速度會完全不同。
對以製造見長的台灣,這個趨勢的份量不言而喻。我們的競爭力很大一部分建立在精密製造與產線效率上,而「AI 自動訓練機器人」若成熟,正好打中如何讓自動化更快、更便宜地適應新產品這個痛點。值得持續追蹤的是這類技術何時從實驗室走進真實工廠、需要多少前期投入,這會直接關係到台灣製造業的下一輪升級節奏。
歸剛點評|讓 AI 去訓練機器人,等於把『教機器人』這個最貴的人力環節也自動化了。對靠精密製造吃飯的台灣,這直擊『自動化能不能更快適應新產品』的痛點,是製造業下一輪升級該盯緊的方向。
產業
翻譯公司 DeepL 收購主打現場活動音訊串流的 Mixhalo,藉此把能力延伸到即時口譯場景,並在舊金山開設辦公室拓展美國業務。
以翻譯起家的 DeepL 出手收購了 Mixhalo——一家專做現場活動即時音訊串流的公司。透過這筆併購,DeepL 把觸角從文字翻譯延伸到了現場、即時的聲音場景,同時宣布在舊金山開設辦公室,擺明要加碼美國市場。
這筆交易的邏輯藏在兩家公司的互補性裡。DeepL 的強項是高品質的機器翻譯,但過去主要活在文字與文件的世界;Mixhalo 的本事則是把聲音低延遲地串流到現場每個人的裝置上。把兩者接起來,自然指向一個很有畫面的應用:在演唱會、研討會、國際會議這類現場,讓不同語言的聽眾即時聽到自己語言的口譯,而且延遲低到跟得上台上的節奏。即時口譯一直是翻譯領域最難、商業價值也最高的環節之一。
選擇用併購而非自建來補上音訊串流這一塊,反映了 AI 公司的一種務實打法:核心模型自己練,但把專業且難自造的工程能力直接買進來,能省下大把追趕時間。在舊金山設點則是衝著美國這個全球最大的科技與活動市場,想就近搶下企業客戶與大型活動的生意。
對台灣,這個方向的想像很實在。台灣國際會議、展覽、跨國商務活動不少,現場即時多語口譯的需求一直存在,過去多半得仰賴昂貴的真人同步口譯。若這類 AI 即時口譯成熟、價格下得來,對中小型活動會是很有感的選項。要留意的是繁中與台灣口音、專業術語的支援程度,這往往是國際工具在地落地時最容易卡住的地方。
歸剛點評|DeepL 從文字翻譯買進即時音訊能力,瞄準最難也最值錢的現場口譯。對國際會展不少的台灣,AI 即時口譯若便宜下來會很有感,但繁中與在地術語支援才是能不能用的關鍵。
產品
Snap 期待已久的智慧眼鏡終於亮相,但動輒兩千美元的高昂定價並沒有討好市場,公司股價反而走跌。
Snap 期待已久的智慧眼鏡終於正式亮相,結果市場反應卻給了一記耳光:在揭曉這款被形容為「貴到離譜」、定價來到約兩千美元的 AR 眼鏡之後,Snap 的股價不漲反跌。一場本該是高光時刻的產品發表,變成了投資人用腳投票的失望現場。
問題的核心多半出在價格與市場期待的落差。AR 眼鏡這個品類本來就還在說服大眾「我為什麼需要它」的階段,當定價衝到兩千美元,等於把它推進了極小眾的早期玩家市場,離一般消費者能接受的範圍很遠。投資人看到的不是一條清楚的放量成長路徑,而是一個叫好不叫座、短期內難以靠它賺錢的高價實驗品,股價下跌也就不意外。The Verge 甚至調侃,戴上這副兩千美元的眼鏡,沒人看起來會比較酷。
Snap 的處境也放大了這個尷尬。它的主力廣告業務這幾年壓力不小,市場其實期待眼鏡能成為下一個成長故事,但這次的定價與賣相顯然沒能說服人。硬體、尤其是這種需要重投入研發的穿戴裝置,要從技術展示走到能賺錢的產品,中間那段路往往比發表會上看起來長得多。
對台灣的硬體與供應鏈業者,這是一個有參考價值的案例。AR/智慧眼鏡的零組件、光學、製造很多環節跟台灣供應鏈相關,Snap 的挫敗提醒大家:技術做得出來,不代表市場買單,定價與真實使用情境的匹配才是成敗關鍵。對想押注這條賽道的廠商,與其賭單一品牌的旗艦機,不如關注整個品類何時能把價格與體驗拉到大眾市場接受的甜蜜點。
歸剛點評|技術做得出來不代表賣得動,Snap 兩千美元眼鏡換來股價下跌就是教材。對沾到 AR 眼鏡供應鏈的台灣廠商,重點是別賭單一旗艦機,盯整個品類何時把價格與體驗拉進大眾甜蜜點。
資金
Pramaana Labs 獲 Khosla Ventures 領投的 2700 萬美元種子輪,主攻法律、新藥研發、報稅等高敏感領域,用形式驗證為 AI 輸出的可靠性把關。
新創 Pramaana Labs 拿下由 Khosla Ventures 領投的 2700 萬美元種子輪,要做的事很硬核:把「形式驗證」帶進 AI。它鎖定的是法律、新藥研發、報稅這類高度敏感的垂直領域——在這些地方,一個錯誤的代價可能極高,可靠性是不能妥協的底線。
形式驗證是什麼?它源自電腦科學,指的是用數學方法嚴格證明一個系統的輸出符合特定規則,而不是靠抽樣測試碰運氣。把這套思路套到 AI 上,目標就是讓模型給出的答案能被某種機制檢驗對錯,而不是讓使用者自己去賭它有沒有在唬爛。對法律、藥物、稅務這些容不得幻覺的場景,「能被驗證為正確」比「聽起來很流暢」重要太多。
這筆投資點到了當前生成式 AI 最痛的一個軟肋:可靠性。大型語言模型最為人詬病的就是會一本正經地胡說,在閒聊裡無傷大雅,但放到攸關權益與安全的專業場景就是災難。Pramaana 想賣的,正是讓 AI 在這些高風險領域「可被信任地使用」的那層保障,而 Khosla 願意領投,說明資本也認同「可驗證性」會是 AI 商業化下一個關鍵戰場。
對台灣的法律科技、生技、財稅服務業者,這個方向很值得追蹤。台灣這些專業領域同樣面臨「想用 AI 提效,又不敢讓它出錯」的兩難,而能對輸出做嚴格把關的技術,正是讓 AI 真正進得了專業工作流的鑰匙。短期內這類工具多半還在早期,但對任何想把 AI 導入高風險業務的團隊,「怎麼驗證它沒亂講」會是繞不開的問題。
歸剛點評|AI 最痛的軟肋是會一本正經胡說,在法律、新藥、報稅這種地方就是災難。Pramaana 賣的就是『可被驗證為正確』這層保障。對想把 AI 導入高風險業務的台灣專業服務業,這是繞不開的命題。
產品
Pinterest 推出實驗性的 AI 購物 App「Ask Pinterest」,讓使用者透過對話介面尋求商品推薦與靈感,把它擅長的視覺發現結合生成式 AI。
Pinterest 推出了一款實驗性的 AI 購物 App,名字直白叫做「Ask Pinterest」。它讓使用者用對話的方式來尋求商品推薦與佈置靈感,把 Pinterest 一向擅長的視覺發現體驗,接上了生成式 AI 的對話介面。
這步棋對 Pinterest 來說相當順理成章。它本來就是一個大家拿來找靈感、收集喜歡的圖、規劃要買什麼的平台,使用者的心態天生就帶著「我想找點什麼」的探索性。把這種探索從「自己滑、自己搜」升級成「直接用講的問」,理論上能讓找靈感到下單之間的路徑更短、更自然——你描述想要的風格或場景,AI 幫你把對應的商品與靈感端上來。
從商業角度看,這是 Pinterest 想在 AI 浪潮裡守住自己獨特位置的嘗試。當搜尋與購物都在被各家 AI 助理重新定義,Pinterest 的護城河在於它累積多年的視覺與品味資料,以及使用者那種「逛、發現、被啟發」的獨特意圖。Ask Pinterest 想做的,是把這個別人不容易複製的視覺發現體驗,用 AI 對話包裝成更主動的購物入口,順勢強化它的電商變現。
對台灣的電商與品牌行銷,這類「對話式發現購物」是值得留意的趨勢。消費者越來越習慣用自然語言描述需求、讓 AI 幫忙篩選,這會改變商品該怎麼被找到、被推薦。對賣家來說,未來如何讓自家商品在這種 AI 對話推薦裡被看見,會是一個跟傳統關鍵字、廣告投放都不太一樣的新課題,提早理解遊戲規則的人會佔便宜。
歸剛點評|Pinterest 把『逛、被啟發』的視覺發現接上 AI 對話,想守住自己在購物入口的獨特位置。對台灣電商與品牌,重點是『對話式發現購物』會改寫商品怎麼被找到,這是跟傳統關鍵字投放完全不同的新戰場。
技術
法國新創 Genesis AI 推出名為 Eno 的機器人,可能沒有頭、沒有腿,坐在輪式底座上還能像折疊椅一樣收起來,主張「人形機器人不需要長得像人」。
The Verge 報導,下一代的「人形」機器人,可能長得一點都不像人。法國新創 Genesis AI 推出的新機器人 Eno,可能沒有頭、沒有腿,坐在一個輪式底座上,甚至能像折疊椅一樣收起來。Genesis AI 的主張很直接:人形機器人不需要長得像人。
這個設計哲學背後其實有很務實的工程考量。一直以來,業界對人形機器人的執念是讓它有頭有腿、雙足行走,理由是這樣才能無縫適應為人類打造的環境。但雙足行走在工程上極難、又耗能、還容易跌倒;長得像人也可能帶來不必要的成本與恐怖谷效應。Genesis 反過來問:如果目標是把事情做好,為什麼一定要遷就人的外型?換成輪式底座更穩更省電,能折疊則方便收納與運輸,外型服從功能。
這場「該不該像人」的辯論,反映機器人產業正在從追求擬人外觀,轉向追求實用價值。市場上不少明星公司仍主打高度擬人的雙足機器人,主打的是想像力與資本故事;而像 Genesis 這樣選擇務實路線的玩家,賭的是企業客戶最終會為「能可靠把活幹完」買單,而不是為「看起來像科幻電影」買單。兩條路線誰能跑出來,市場接下來幾年會給答案。
對台灣的機械與自動化產業,這個務實轉向反而是好消息。我們在輪式平台、機構設計、感測與電控上有扎實的製造能力,而當機器人的競爭重點從炫技的雙足回到「功能導向的可靠設計」,正好對上台灣供應鏈的強項。與其追逐最吸睛的人形外觀,深耕能被大量採用的實用型機器人零組件與整合,可能是更穩的切入點。
歸剛點評|機器人產業正從『長得像人』轉向『把事做好就好』,輪式、可折疊的務實設計挑戰雙足擬人的主流敘事。對在機構、感測、電控有底子的台灣供應鏈,這個務實轉向反而對上我們的強項。
社會
Threads、Instagram、TikTok 等平台陸續推出工具,讓使用者能直接影響背後推薦的演算法,社群動態消息正變得越來越可客製。
TechCrunch 觀察到社群媒體一個正在發生的轉向:動態消息(feed)變得越來越能客製。Threads、Instagram、TikTok 這些平台陸續推出工具,讓使用者可以直接影響背後那套決定你會看到什麼的推薦演算法。長久以來只能被動接受演算法投餵的局面,正開始鬆動。
為什麼平台願意把方向盤交出來一點?背後有幾股力量。一是使用者對「演算法操控我注意力」的反感越來越強,給一點掌控感能緩解不信任;二是監管與輿論長期施壓,要求平台對推薦機制更透明、更可問責;三是競爭——當大家都在搶人的時間,讓使用者覺得「這個 feed 是我能調的」本身就是留住人的賣點。把部分控制權還給使用者,對平台未必是讓利,可能是更聰明的留存策略。
這個趨勢跟 AI 推薦的進化也分不開。推薦演算法本來就是 AI 應用最深、最影響大眾日常的場景之一,而當生成式 AI 讓個人化能做得更細,「使用者能不能參與調整自己被推薦什麼」就成了一個關鍵的設計與倫理問題。可調的演算法理論上能讓人擺脫資訊繭房、找回對資訊環境的主動權,但實際效果取決於平台給的控制是真有用、還是只是安撫人心的擺設。
對台灣的內容創作者與行銷人,這個變化值得提早消化。如果使用者能更主動地塑造自己的 feed,內容怎麼被分發的邏輯就會跟著變——純粹靠演算法紅利衝量的玩法可能變難,而能讓使用者「主動想看、願意調高權重」的優質內容會更吃香。理解使用者開始握有部分控制權這件事,會影響你接下來怎麼經營受眾。
歸剛點評|平台開始把演算法方向盤分一點給使用者,與其說是讓利,不如說是面對不信任與監管的聰明留存術。對台灣創作者,這意味純衝演算法紅利會變難,能讓人『主動想看』的內容更吃香。
產業
Anthropic 成為第一家加入 Frontier 碳移除聯盟的 AI 新創,該聯盟近期再獲 9.15 億美元承諾資金,用於支持碳移除專案。
Anthropic 宣布加入 Frontier 碳移除聯盟,成為第一家加入這個聯盟的 AI 新創公司。Frontier 近期又拿到 9.15 億美元的承諾資金,用來資助各種碳移除(carbon removal)專案。在這週被出口管制搞得灰頭土臉之餘,Anthropic 同時釋出這條氣候議題的訊息,時間點本身就帶著公關意味。
AI 公司主動跳進碳移除,背後有一個越來越難迴避的現實:訓練與運行前沿模型極度耗電,而電力背後往往連著可觀的碳排。當資料中心的能源需求隨著 AI 軍備競賽一路飆升,這些公司的碳足跡成了外界檢視的焦點。加入 Frontier、出錢支持碳移除,是 AI 巨頭回應「你們很耗能」這個質疑的一種方式——用購買碳移除來抵銷自己造成的排放。
不過這類動作向來伴隨爭議。支持者認為,提早用大筆資金為還很昂貴的碳移除技術創造市場需求,能加速這些技術成本下降、規模化;批評者則質疑這會不會淪為「買贖罪券」,讓公司繼續放心耗能,而沒有真正去減少排放的源頭。碳移除究竟是真解方還是漂綠,要看資金最後流向哪些專案、以及這些專案的實際成效,現在下定論還太早。
對台灣,這個訊號的延伸意義在於 AI 與能源、碳排的綁定只會越來越緊。台灣若要發展自己的 AI 與資料中心產業,能源結構與碳排管理會是繞不開的配套課題。同時,碳移除若真的成為一個被巨頭資金催熟的市場,對台灣相關的綠能與環境技術業者,也可能是一個值得提早關注的機會窗口。
歸剛點評|AI 越強越耗電,碳排就越被盯。Anthropic 砸錢買碳移除,是回應『你們很耗能』的標準動作,但到底是真減碳還是買贖罪券有得吵。對想發展 AI 與資料中心的台灣,能源與碳排是繞不開的配套。
開源
字節跳動的開源專案 UI-TARS-desktop 登上 GitHub 熱門榜,定位是連接前沿 AI 模型與代理基礎設施的開源多模態 AI 代理堆疊。
字節跳動的開源專案 UI-TARS-desktop 近日登上 GitHub 熱門趨勢榜。它的自我定位是一套「開源的多模態 AI 代理堆疊」,要做的事是把前沿 AI 模型與代理運作所需的基礎設施串接起來,讓開發者能更完整地打造能看畫面、能操作介面的 AI 代理。
這個專案踩在當前最熱的「電腦操作代理」這條線上。所謂多模態加桌面(desktop),指的是讓 AI 不只讀文字,還能看懂螢幕畫面、理解介面元素,進而像人一樣操作軟體——點按鈕、填表單、跨應用完成任務。要把這件事做穩,需要的不只是一個強模型,還要有把模型、畫面理解、動作執行、狀態管理整套接起來的工程框架,UI-TARS-desktop 想提供的正是這層常被忽略卻關鍵的基建。
它會在開源社群竄紅,反映出一個明確的需求:大家手上不缺強模型,缺的是把模型變成能真正幹活的代理的那套黏合層。閉源大廠的電腦操作能力多半綁在自家產品裡,而一個開源、可自架、可客製的代理堆疊,讓開發者能掌控整條流程、接自己想用的模型、針對特定場景深度調整。對推動代理技術的透明化與普及,這類專案的價值不小。
對台灣的開發者與軟體團隊,UI-TARS-desktop 是個值得實際 clone 下來跑跑看的對象。如果你在評估要不要做能自動操作軟體、跑流程自動化的 AI 代理,與其完全依賴閉源服務,這類開源堆疊提供了一條成本與自主性都更可控的路。當然開源專案的成熟度、文件、社群活躍度都要自己評估,但在代理化這波浪潮裡,先動手玩過的人會比只看新聞的人更早抓到手感。
歸剛點評|大家不缺強模型,缺的是把模型變成『能操作軟體幹活』的代理黏合層。字節這套開源堆疊填的正是這個洞。對想做流程自動化的台灣團隊,這是條成本與自主都更可控、值得 clone 下來實測的路。