第 15 期2026-06-24(台北時間)
第十五期,今天 AI 的主旋律是『能力往專業縱深走、代價往人身上落』。Anthropic 推 Claude Tag,把會吸收公司脈絡的 AI 同事常駐進 Slack;GPT-5 Pro 幫免疫學家解開卡三年的 T 細胞謎團,模型開始能在資深專家的領域裡提出有用假設。另一頭,Oracle 一手裁兩萬一千人、一手舉債砸機房,TechCrunch 的『因 AI 裁員』清單越列越長,Cory Doctorow 則要大家別只盯泡沫、要從根部追問誰承擔代價。研究端,兩篇論文分別替代理的『過早承諾』與思維鏈的能力邊界畫線,提醒自動化代理仍是需要被嚴格檢視的工程。
- 能力縱深:Anthropic Claude Tag 把吸收組織知識的 AI 同事嵌進 Slack;GPT-5 Pro 幫免疫學家解開三年 T 細胞謎團——模型正從工程客服,延伸到協助資深專家做研究。
- 代價落在人身上:Oracle 裁 2.1 萬人並舉債狂砸 AI 機房,TechCrunch『因 AI 裁員』滾動清單越列越長,Cory Doctorow 新書呼籲從根部追問誰受益、誰承擔代價。
- 防守商品化:OpenAI 牽頭推先進 AI 共同標準(Appia 基金會),並用 AI 幫開源社群找漏洞補洞,延續『把 AI 防守做成商品』的方向。
- 代理要被嚴格檢視:兩篇論文替代理的『過早承諾』失敗模式與思維鏈的能力邊界畫線;NousResearch 開源 hermes-agent,替閉源化的個人化代理保留一條自主路線。
- 消費端冷熱不均:Fitbit Air 靠克制贏得好評、Sony AI 相機助手被自家爛樣張拖累、Midjourney 跨界做水缸超音波卻拿不出證據——AI 不是加上去就贏。
頭條
Anthropic 在週一推出 Claude Tag,做法是把 Claude 直接接進 Slack,團隊成員在頻道裡標記它就能立刻得到回應。它讀得到對話脈絡,能順著討論串回答問題、整理待辦、草擬回覆,定位是一個全天候在線、不用切換視窗就能召喚的 AI 隊友。對天天泡在 Slack 的團隊來說,工具從一個要另外開的分頁,變成貼著日常溝通就位的存在。
比起多一個聊天機器人,更值得盯著看的是底層誘因。TechCrunch 點破,Claude Tag 真正在收的是組織知識:誰負責什麼、決策怎麼拍板、專案前因後果這些只活在訊息往來裡的隱性脈絡,過去散在無數對話串中難以被任何系統接住,現在等於有一條管道持續餵給模型。每被點名一次,Claude 就更懂這家公司怎麼運轉。
這條路線延續了企業 AI 從「通用助手」往「懂你公司的助手」靠攏的方向。模型本身的落差正在收斂,真正拉開差距的,是誰握有你內部那套無法外求的脈絡。Claude Tag 把採集脈絡的動作直接嵌進溝通現場,等於替 Anthropic 在企業端壘出一道資料護城河。
對採用方來說,效率與綁定是同一枚硬幣的兩面:用得越深、組織知識沉澱得越多,遷出的成本就越高。本站前幾期談過企業對單一閉源供應商的依賴風險,Claude Tag 把這個課題從模型層推進到了知識層——要不要把公司的集體記憶交給一家外部廠商保管,會是接下來每個導入團隊得先想清楚的事。
歸剛點評|模型能力正在拉平,企業 AI 的勝負手轉向『誰掌握你公司的內部脈絡』。Claude Tag 把採集組織知識的動作嵌進 Slack 日常,既是生產力升級,也是一道資料與遷移成本的護城河,值得每個導入團隊先想清楚綁定風險。
研究
免疫學家 Derya Unutmaz 用 GPT-5 Pro 推進一個懸了三年的 T 細胞行為難題,模型給出的線索協助釐清機制,可能對癌症與自體免疫研究產生實際幫助。
OpenAI 揭露一個科研應用案例:免疫學家 Derya Unutmaz 把一個困擾實驗室三年的 T 細胞行為謎團丟給 GPT-5 Pro,模型協助梳理出新的解釋方向,幫忙把卡死的研究重新推動起來。T 細胞是免疫系統辨識與攻擊病原、癌細胞的核心兵種,搞懂它在特定情境下為何這樣反應,是癌症免疫療法與自體免疫疾病治療的關鍵地基。
值得留意的是模型在這裡扮演的角色。它的工作是在龐大文獻與既有數據之間,提出人沒立刻想到的假設與連結,讓專家有新的切入點去設計驗證,而非替研究者下結論。真正拍板的還是實驗與同儕複核,模型壓縮的是「卡在原地、想不到下一步」這段最磨人的時間。
把這個案例放回產業脈絡看,它呼應了最前沿模型正從寫程式、做客服往「協助專家做研究」延伸的趨勢。當模型強到能在資深研究者的專業領域裡提出有用假設,科研的瓶頸就從「算力與閱讀量」往「誰有好問題、誰能設計對的實驗」位移。
當然要保持冷靜:單一案例不等於通則,模型也會給出聽起來合理卻錯誤的方向,把人帶進死胡同。但對長期被資料淹沒、靈感卡關的實驗室來說,多一個隨時能對話、能翻遍文獻的假設產生器,已經是實打實的生產力。能不能複製到更多領域,得看後續更多研究者的實測。
歸剛點評|最前沿模型正從工程與客服,延伸到『協助資深專家做研究』。當模型能在免疫學這種高門檻領域提出有用假設,科研瓶頸就從算力與閱讀量,往『誰有好問題、誰設計對實驗』位移——這對所有知識密集型工作都是預告。
政策
OpenAI 宣布支持透過 Appia 基金會建立先進 AI 的共同標準,涵蓋評測框架、安全實務與跨國協作,想替快速變強的模型補上一套可共用的量尺與規則。
OpenAI 表態支持建立先進 AI 的共同標準,路徑是透過 Appia 基金會,重點放在三塊:可共用的評測框架、安全實務,以及跨國的協作機制。背後的痛點很實際——模型一代比一代強,但「強到什麼程度算安全」「怎麼測才算數」至今沒有業界都認的統一量尺,各家自說自話,外界難以比較,監管者也難以下手。
評測框架是這件事的核心。沒有公認的測試方法,廠商的安全宣稱就只能各憑各的標準,第三方無從查核。把評測與安全實務收斂成一套大家都能跑、能對照的標準,等於替整個產業裝上共用的儀表板,也讓後續的監管與採購有客觀依據可循。
由最領先的廠商出面推標準,外界的反應通常兩極。樂觀面看,產業自律總比真空好,早點把評測與安全的共同語言立起來,對使用者與下游開發者都是保障;謹慎面看,誰主導標準、誰就握有把規則寫成對自己有利的影響力,這也是過去每一波技術標準戰的老劇本。
對台灣這類仰賴外部模型的市場,標準化的長期意義是:未來挑供應商、評估風險時,能多一套客觀的對照基準,而不是只能聽廠商自己講。但標準的公信力,終究要看治理是否夠中立、有沒有夠多獨立第三方參與,這部分才剛起步,值得持續盯。
歸剛點評|模型越來越強,但『多強算安全、怎麼測才算數』至今沒有業界公認的量尺。OpenAI 牽頭推共同標準與評測框架,對下游採購與監管是好事;但由最領先廠商主導標準,誰寫規則誰得利,治理中立性是觀察重點。
資安
OpenAI 推出新計畫,用 AI 協助開源社群更主動地找出並修補程式漏洞,把自動化的安全能力投向長期人力吃緊的開源維護端。
OpenAI 啟動一項以 AI 協助開源社群找漏洞、補漏洞的計畫,目標很清楚:讓那些撐起整個軟體世界、卻長年缺人缺錢的開源專案,能用上自動化的安全能力。今天從手機到雲端服務,底層都疊著大量開源元件,其中不少由極少數志工在業餘維護,安全審查長期是奢侈品。
把 AI 推進這個環節的合理性在於規模與枯燥度。找漏洞需要逐行讀大量程式、反覆驗證可疑路徑,正是人力最稀缺、最容易疲乏出錯的苦工,也正是模型能大量、不喊累地代勞的地方。先讓模型跑一輪、標出可疑處交人複核,能把有限的人力集中在真正需要判斷的決策點上。
這條線跟近期整個產業把『AI 防守』做成商品的方向一致。本站上一期才談過最大模型公司開始把資安能力標準化、向開源維護者開放;OpenAI 這次的計畫等於同一股力量的延伸——攻擊方早就在用 AI 找破口,防守方若不跟上,差距只會擴大。
要打的折扣是:AI 抓漏洞會誤報、也會漏報,最終仍需人類專家定奪,否則可能淹沒維護者本就稀薄的精力,甚至被一堆雜訊拖垮。真正的考驗在落地細節——複核機制夠不夠紮實、會不會反而製造噪音。但方向上,把最燒人力的安全苦工交給模型先跑,對開源生態確實是雪中送炭。
歸剛點評|開源元件撐起整個軟體世界,安全審查卻長年缺人。攻擊方早在用 AI 找破口,OpenAI 把防守能力送進最缺人的開源端方向正確;成敗在複核機制——AI 會誤報漏報,搞不好反而淹沒維護者本就稀薄的精力。
勞動
Oracle 裁員約 2.1 萬人,同時舉債投入數十億美元擴建 AI 資料中心基礎設施,用一手砍人、一手重押算力的姿態加碼這場軍備競賽。
Ars Technica 報導,Oracle 進行約 2.1 萬人的大規模裁員,同一時間卻在 AI 資料中心上砸下數十億美元,且部分資金來自舉債。一邊大幅縮減人力、一邊靠借錢重押算力基建,這套打法把當前大廠的選擇赤裸地攤開:把錢從人身上挪到 GPU 與機房上。
邏輯不難理解。AI 浪潮下,算力與資料中心被視為未來幾年最關鍵的稀缺資源,誰先把機房、電力、冷卻備齊,誰就握有承接 AI 需求的入場券。Oracle 過去在雲端市場相對被邊緣,如今想靠 AI 基建這波重新搶位,於是把資源大幅向資本支出傾斜。
風險在於『舉債』兩個字。用借來的錢押注一個仍在膨脹、回報週期未明的賽道,等於對 AI 需求會持續高燒下注。若需求不如預期、或利率與融資環境轉緊,債務的重量會立刻反噬。本站近期數次提到資料中心的水電爭議與資本狂熱,Oracle 的高槓桿正是這股熱度的極端樣本。
對受影響的兩萬多名員工,這是再具體不過的現實:公司財報上的『AI 投資』,有一部分是用他們的工作換來的。當『因 AI 而裁員』與『為 AI 而舉債』在同一家公司同時發生,所謂效率提升的代價由誰承擔,答案寫得清清楚楚。
歸剛點評|一手裁兩萬一千人、一手舉債砸 AI 機房,Oracle 把大廠的選擇攤開:把錢從人挪到 GPU。賭的是 AI 需求持續高燒;用借來的錢押注回報週期未明的賽道,需求或利率一翻臉,債務重量會立刻反噬。
勞動
TechCrunch 維護一份逆時序的滾動清單,記錄 2026 年內把 AI 列為裁員因素的大型科技公司,讓『因 AI 而裁員』從個別新聞變成可追蹤的整體趨勢。
TechCrunch 做了一份持續更新的清單,逆時序羅列 2026 年以來、把 AI 明確列為裁員原因之一的大型科技公司。把零散的裁員消息收進同一張表,原本各自為政的新聞就拼成一條清楚的趨勢線——這一年裡,越來越多公司願意公開把『因為 AI』寫進裁員理由。
願意把話講白本身就是訊號。過去企業裁員多半歸因於景氣、重組或策略調整,如今直接點名 AI,代表自動化取代人力已經從預測變成管理層敢於對外承認的決策依據。當前一則 Oracle 的兩萬一千人裁員,正好是這張清單上最新、最沉重的一筆。
對上班族,這份清單的價值在於把焦慮具象化成可查的事實,而不是停在『AI 會不會搶工作』的空泛討論。哪些產業、哪些職能先被點名,攤在表上一目了然,也讓個人在規劃技能與職涯時,有實際的風向可以參照。
要提醒的是,公司對外宣稱的『因 AI』未必全是真相——有時 AI 只是包裝成本結構調整、過度擴張後縮編的體面說法。但即便摻了水分,企業選擇用 AI 當理由這件事,已經反映了一種新的話術常態:把人力縮減講成技術升級。清單越長,這套敘事就越根深蒂固。
歸剛點評|把零散裁員拼成一條趨勢線:2026 年越來越多公司敢公開把『因 AI』寫進裁員理由。自動化取代人力從預測變成管理層願意承認的決策依據;即便部分是體面包裝,這套『把縮編講成升級』的話術正在變成常態。
資金
斯德哥爾摩新創 Fika Jobs 募得 400 萬美元,打造影音優先的招聘平台,結合 AI 面試代理與短影音履歷,做出一個介於 LinkedIn 與 TikTok 之間的求職產品。
瑞典斯德哥爾摩新創 Fika Jobs 拿到 400 萬美元資金,要做一個影音優先的招聘平台。核心有兩塊:一是用短影音取代傳統文字履歷,讓求職者用幾十秒的影片秀自己;二是讓 AI 代理直接出面初步面試候選人。團隊自己形容,成品像 LinkedIn 和 TikTok 的混血。
切入點瞄準的是招聘流程裡最耗時的前段。海量履歷篩選、第一輪電話面試,向來是人資的苦差事,也是求職者最常石沉大海的環節。把首輪面試交給 AI 代理,理論上能讓每個投遞者都至少被『談過一次』,再把人類面試官的精力留給後段真正關鍵的判斷。
把短影音當履歷,是順著年輕世代的內容習慣走。對在鏡頭前自在、難以用制式履歷凸顯特質的求職者,這是新的表現舞台;但反過來,鏡頭表現力與工作能力是兩回事,過度看臉、看口條,可能讓不擅長影音的人吃悶虧,也可能把既有的外貌與表達偏見搬進招聘。
更敏感的是 AI 面試本身。由代理初篩,效率與一致性可能提升,公平性卻是大哉問——模型評分的標準是否透明、會不會放大訓練資料裡的偏見,都還沒有好答案。這 400 萬美元賭的是『招聘自動化』的早期紅利,但這類產品最終會不會被求職者信任,要看它怎麼處理公平與透明這兩道坎。
歸剛點評|把首輪面試交給 AI 代理、用短影音取代文字履歷,賭的是招聘自動化的早期紅利。效率與『人人至少被談一次』是賣點;但鏡頭表現不等於工作能力,AI 評分的公平與透明沒解,搞不好把外貌與表達偏見直接搬進招聘。
基建
面對外界對資料中心耗水耗電的不滿,Nvidia 主打下一代 Rubin 全液冷參考設計,宣稱靠讓系統運行在更高溫度,消除了大量電力浪費與幾乎所有用水。
Nvidia 出面回應外界對 AI 資料中心耗水耗電的批評,端出下一代 Rubin 全液冷參考設計,宣稱這套架構『消除了大量電力浪費與幾乎所有用水』。關鍵手法是讓系統運行在更高的溫度——容許機房跑得更熱,就能減少對外部水資源蒸發散熱的依賴。
技術邏輯說得通。傳統資料中心常靠蒸發冷卻散熱,過程要大量耗水;改用全液冷、並把可接受的運行溫度往上拉,散熱迴路就能更封閉、更省水。對被在地社區盯著用水量的資料中心來說,這是直接回應壓力點的設計取向。
但要分清『廠商宣稱』與『實際落地』。Nvidia 講的是參考設計的理論效益,真實機房能省多少,取決於營運方怎麼蓋、當地氣候與電網條件如何。而且就算用水問題改善,耗電、佔地、對電網的衝擊這些更根本的爭議,並沒有跟著消失。
把它放回本站近期一連串資料中心爭議來看,這是產業在公眾壓力下的典型動作:先挑最容易被攻擊、也最有解的『用水』下手,做出可宣傳的改善。值得肯定,但別把單一指標的進步當成整體永續達標——AI 基建對資源的胃口,仍是接下來幾年躲不掉的硬題。
歸剛點評|資料中心耗水耗電被在地社區盯上,Nvidia 先挑最有解的『用水』下手,靠全液冷加跑更熱來省水。技術邏輯成立,但這是參考設計的理論值;耗電、佔地、電網衝擊這些更根本的爭議沒跟著消失,別把單一指標進步當整體永續達標。
產業
過去三年 Meta 智慧眼鏡幾乎等同 Ray-Ban,如今 Meta 推出不掛 Ray-Ban 品牌、價格更親民的新款,提供多種款式與顏色,想把這類裝置推向更大眾的市場。
過去三年,『Meta』與『Ray-Ban』在智慧眼鏡這塊幾乎是同義詞,靠雷朋的時尚招牌打進主流。如今 Meta 換了打法,推出不掛 Ray-Ban 品牌、價格更親民的新款智慧眼鏡,並備好多種款式與七種顏色——擺明要從『時尚配件』往『人人買得起的日常裝置』走。
拿掉精品聯名、把價格壓低,是把產品從早期嘗鮮者推向大眾的標準動作。智慧眼鏡要真正普及,門檻不只在功能,更在於價格與選擇夠不夠多。多款式、多顏色加上更低的入手價,等於把受眾從『願意為雷朋設計買單的人』擴大到『只是想試試看 AI 眼鏡的人』。
背後是 Meta 在穿戴式 AI 上的長期算盤。手機這個入口被蘋果與 Google 牢牢把住,眼鏡被視為下一個可能繞過手機、讓 AI 隨身在場的硬體載體。先靠雷朋打出品牌認知,再用平價款衝量、鋪開使用者基數,是合理的兩段式佈局。
但平價的代價通常是規格與隱私的取捨。鏡頭隨身、隨時可錄,向來是智慧眼鏡最敏感的爭點;款式越多、戴的人越多,路人『有沒有被拍』的不安也跟著放大。Meta 能不能在壓低價格的同時把隱私設計做扎實,會決定這波平價攻勢是擴大版圖、還是擴大反彈。
歸剛點評|拿掉 Ray-Ban 精品聯名、壓低價格衝量,Meta 想把智慧眼鏡從時尚配件推成人人買得起的日常裝置——眼鏡被視為繞過手機、讓 AI 隨身在場的下一個入口。但戴的人越多,路人『有沒有被拍』的隱私不安也越大。
社會
據報導,Netflix、A24、Focus Features 與華納旗下 Clockwork 都已對導演 Guadagnino 拍奧特曼的傳記劇情片《Artificial》踩煞車、放棄發行;Neon 與 Mubi 仍有意願,但局面顯示好萊塢在這題上格外謹慎。
據 The Verge 報導,導演 Luca Guadagnino 以 OpenAI 共同創辦人暨執行長 Sam Altman 為主角的傳記劇情片《Artificial》,發行之路意外坎坷:Netflix、A24、Focus Features 以及華納兄弟旗下的 Clockwork,都已決定不接這部片的發行。目前仍對影片有興趣的,只剩 Neon 與 Mubi 兩家。
一部由名導執導、題材正當紅的電影,竟讓多家發行巨頭接連退避,本身就耐人尋味。可能的顧慮並不難猜:AI 正是當下最敏感的公共議題,OpenAI 與奧特曼又處在輿論與監管的風暴中心,碰這個題目,等於同時要面對科技圈、創作圈、以及對 AI 戒慎恐懼的大眾三方的目光。
好萊塢與 AI 的關係本就緊繃。前一陣子的勞資爭議裡,AI 是否取代編劇與演員是核心戰場;如今要拍一部把 AI 教父當主角的電影,創作社群內部的情緒並不單純。發行商的退縮,與其說是看衰票房,不如說是不想替一個還在沸騰、立場兩極的題材背書。
把它接回本站近期『好萊塢與 AI』的線索看——一頭是片廠拿 AI 資金、與科技公司合作,另一頭卻對直接歌頌或描繪 AI 巨頭的內容避之唯恐不及。這種既要又怕的矛盾,正好說明娛樂產業面對 AI 時內心有多分裂:商業上靠近,敘事上保持距離。
歸剛點評|名導執導、題材正紅的奧特曼傳記片卻讓多家發行巨頭接連退避——不是看衰票房,是不想替一個立場兩極、還在沸騰的 AI 題材背書。一頭拿 AI 資金合作、一頭對描繪 AI 巨頭的內容避之唯恐不及,娛樂業面對 AI 的分裂全寫在這裡。
政策
The Verge 報導,企業背景的 AI 超級政治行動委員會在一場地方選舉砸下 2,700 萬美元,圍繞紐約一個選區與候選人 Alex Bores,凸顯 AI 產業正大手筆介入政治、想預先影響監管走向。
The Verge 揭露,一群企業背景的 AI 超級政治行動委員會(super PAC),在一場看似不起眼的地方選舉裡砸下高達 2,700 萬美元,焦點落在紐約第 12 選區與候選人 Alex Bores 身上。一場地方層級的選戰湧入這個量級的資金,本身就說明 AI 產業已把政治影響力當成必爭之地。
地方選舉之所以值得砸重金,在於它是監管的上游。許多對 AI 的實質約束——資料、安全、責任歸屬——往往從州與地方層級先成形,再向上擴散。趁立法者還沒坐穩位子時就用資金表態,等於在規則被寫死之前,先卡進影響力,把對自己不利的法案壓在搖籃裡。
這延續了本站先前談過的『資本不停』主線:AI 巨頭的錢不只流向算力與人才,也大量湧入遊說與政治。當企業能用超級 PAC 在選舉中投放這種量級的資金,民意與業界利益之間的天平會往哪邊傾,是每個關心 AI 治理的人都得正視的問題。
對一般人,這條新聞的提醒很實際:未來決定 AI 怎麼被監管的,除了民意與專家論證,還摻進了檯面下的政治金流。AI 安全與權益的規則由誰來寫、被誰的錢影響,會直接關係到這項技術最終服務誰、又約束誰。盯緊資金流向,和盯緊技術本身一樣重要。
歸剛點評|AI 巨頭的錢不只流向算力人才,也大手筆湧入遊說與選舉。地方選戰是監管上游——趁規則寫死前先用資金卡進影響力,把不利法案壓在搖籃裡。決定 AI 怎麼被監管的,未來除了民意與專家,還有檯面下的政治金流在角力。
醫療
以 AI 圖像生成聞名的 Midjourney 罕見跨界醫療影像,宣布要做一台把使用者浸入水中的未來感超音波掃描儀,號稱『像 MRI 一樣強、像去 spa 一樣輕鬆』,但 The Verge 指出它缺乏支撐這些說法的證據。
以 AI 圖像生成走紅的 Midjourney,上週做了一件出人意料的事:跨進醫療影像。公司宣布要打造一台充滿未來感的超音波掃描儀,把使用者浸入一缸水中進行掃描,並喊出『產生像 MRI 一樣強大、卻像去一趟 spa 一樣輕鬆』的效果。對一家以生成漂亮圖片聞名的公司來說,這個跳躍幅度相當大。
問題出在證據。The Verge 直指,Midjourney 拋出的這些宏大宣稱,目前缺乏足以支撐的實證——超音波要達到接近 MRI 的診斷力,是嚴肅的醫學工程難題,不是換個包裝、加上輕鬆體驗就能跳過的。把醫療器材講得像消費電子產品發表會,本身就值得警覺。
醫療影像是高度受監管、攸關人命的領域,宣稱與臨床驗證之間隔著漫長且嚴格的距離。一家沒有醫療影像底蘊的 AI 公司,端出聽起來像科幻場景的產品,卻拿不出對應的數據,很容易讓人聯想到『行銷遠跑在技術前面』的老問題——這在 AI 健康領域近期屢見不鮮。
把它跟近期一連串『AI 健康』產品擺在一起看,會更清楚當下的風氣:靠模型與漂亮敘事先把概念炒熱,臨床實證往後補。對使用者,健康類產品的判斷標準應該倒過來——先問有沒有經得起檢驗的證據,再看它把體驗講得多誘人。在拿到實證之前,這台水缸掃描儀更像願景,而非可信賴的醫療工具。
歸剛點評|以生成圖片聞名的公司跨界做『像 MRI 一樣強、像 spa 一樣輕鬆』的水缸超音波,卻拿不出支撐宣稱的證據。把醫療器材講得像消費電子發表會,正是 AI 健康領域『行銷跑在技術前面』的典型——健康產品該先問實證,再看願景。
健康
The Verge 試用 Fitbit Air,指出 Google Health Coach 動輒把使用者講成快要崩潰,但 Fitbit Air 在 AI 健康功能上採取較克制的設計,避開了當前 AI 健康教練動不動嚇唬人的通病。
The Verge 試用 Google 新的 Fitbit Air,開頭就吐槽 Google Health Coach 的毛病:睡眠不夠好、心率變異度低於基準、待在又熱又濕的環境太久——一連串提醒把人講得彷彿瀕臨身體崩潰。但評測的重點是,Fitbit Air 這款裝置在 AI 健康功能上採取了相對克制的取向,沒有一味用警示嚇人。
這個對比點出當前『AI 健康教練』的核心毛病:資料抓得越多,越容易把每個低於『理想值』的數字都翻譯成警訊,讓使用者天天活在『你不夠健康』的焦慮裡。把人正常的身體波動講成危機,不但沒幫上忙,反而可能製造不必要的恐慌,甚至讓人乾脆關掉不看。
Fitbit Air 的克制因此值得肯定。健康追蹤的價值在於提供有用的參考,而不是當一個整天唱衰的雲端嘮叨。少報幾個無謂的紅字、把提醒留給真正值得注意的變化,反而更能讓使用者願意長期戴著、信任它給的訊號——對穿戴裝置來說,被持續使用才是一切的前提。
放回產業脈絡,這呼應了 AI 產品從『功能堆好堆滿』往『拿捏分寸』成熟的轉向。把模型的判斷直接倒給使用者很容易,難的是知道什麼時候該閉嘴。Fitbit Air 示範了一件事:在健康這種高度個人、容易引發焦慮的場景,克制本身就是一種產品力。
歸剛點評|AI 健康教練的通病是資料抓越多、越愛把正常波動翻成警訊,讓人天天活在『你不夠健康』的焦慮裡。Fitbit Air 示範了反向操作——在容易引發焦慮的健康場景,知道什麼時候該閉嘴、克制本身就是一種產品力。
研究
MIT Tech Review 報導,研究者用超音波影像捕捉人手皮膚底下的肌肉與肌腱活動,藉此教機器手更精準地模仿人類靈巧的動作,解決機器人長年難以複製手部細膩操作的難題。
MIT Technology Review 報導一項機器人研究:研究團隊用超音波影像,去捕捉人手皮膚底下肌肉與肌腱的實際活動,再用這些訊號教機器手模仿人類動作。人手協調 34 條肌肉、27 個關節、上百條肌腱與韌帶,能做出無數細膩動作,而機器人長年笨拙的原因之一,就是難以看清皮膚底下到底發生了什麼。
超音波在這裡解的是『資料』難題。過去要讓機器手學人手,多半只能從外部觀察動作表象,看不到驅動這些動作的內部肌肉如何收縮協調。用超音波直接探進皮膚底下,等於把人手操作時的『內部劇本』錄下來,機器手就有更貼近真實的範本可以學,而非只憑外觀硬猜。
這條路對機器人靈巧度意義重大。手部操作是機器人進工廠、進家庭最難啃的骨頭——抓握、施力、微調這些人類不假思索的動作,對機器一直是天險。把人類肌肉活動當成高品質的學習訊號,是繞過『動作捕捉只看得到表面』瓶頸的聰明做法。
當然從實驗室到實用還有距離:超音波擷取的設備、即時性、跨個體的泛化都要解,能不能搬出受控環境也是問號。但方向上,這替『教機器人像人一樣用手』提供了一條新資料管道。當機器手真的學會人手那套底層協調,從製造到照護的許多自動化場景,門檻都會跟著降低。
歸剛點評|機器人最難啃的骨頭就是手——抓握、施力、微調這些人類不假思索的動作對機器是天險。用超音波錄下皮膚底下肌肉的『內部劇本』當學習訊號,繞過『動作捕捉只看表面』的瓶頸;真學會了,從製造到照護的自動化門檻都會降低。
研究
一篇新論文指出長跑型 LLM 代理會悄悄失敗——太早鎖定一種對證據的解讀,然後把剩下的時間都花在維護它。研究者把這稱為『過早承諾』,並提出用跨次運行的隱藏狀態收斂當早期診斷指標。
一篇 HF Daily Papers 收錄的研究點出長跑型 LLM 代理的一種隱形失敗:它們會在早期就鎖定對證據的某一種解讀,接著把整段運行剩下的力氣,都拿去捍衛這個一開始的判斷。研究者把這個現象命名為『過早承諾』(premature commitment)——代理太早把路走死,而非到中途才出錯。
麻煩在於這種失敗很難被現有評分抓到。只看最終答案的評分方式,看到的是結果,看不到過程是不是早就坍縮成一條僵固的路徑。論文提出一個更早的診斷工具:把『表徵承諾』定義為多次運行在固定推理步驟上的隱藏狀態收斂,用它來偵測代理的軌跡是不是過早趨於一致、失去了探索的彈性。
對正在大量導入代理的團隊,這項研究戳中要害。代理被寄望去自動跑長流程、自己查資料、自己推進,但若它早早認定一個錯誤前提就一路硬幹,最後交出的答案可能錯得很有自信,外人還難以察覺。能在過程中、而非事後才發現它『鑽牛角尖』,對可靠性是實打實的幫助。
把它接回本站近期的『代理進入 loop 時代』線索看,會更有感:當一群代理開始在背景無人值守地長跑,這種悄悄走偏卻不自知的失敗,風險只會放大。先有辦法診斷,才談得上修正——這類針對代理失敗模式的研究,是讓自動化代理真正可信賴的必要基礎工程。
歸剛點評|代理被寄望自己跑長流程,但它會太早鎖定一種解讀、然後一路硬幹——只看最終答案的評分抓不到這種『過早承諾』。當代理開始無人值守地長跑,這種悄悄走偏卻自信滿滿的失敗風險放大;先能診斷,才談得上修正。
研究
一篇論文挑戰『任何短程式能解的任務,都能教模型用思維鏈照做』的直覺,證明對某一類可辨識的程序,這個假設會失敗,替思維鏈的能力邊界畫出一條線。
一篇 HF Daily Papers 的研究,挑戰了一個很普遍的直覺:只要一個任務能用一段短程式解出來,就能把步驟寫成思維鏈(chain-of-thought)、再微調模型照著走。作者證明,對某一類可辨識的程序,這個假設會失敗——能寫成程式、能驗證對錯,不代表模型就學得會把它當成推理鏈跟著做。
方法相當扎實。研究用九個來自確定性生成器的推理任務當測試台,把生成器逆向工程成 Python 解法,再把這些解法渲染成思維鏈、蒸餾進模型。公開與隱藏的資料切分共用同一組生成器,等於用沒見過的資料來代理真實的測試準確率,盡量排除模型只是死背的可能。
結論的重量在於它替『思維鏈』畫了一條能力邊界。業界常把 CoT 當成讓模型『學會推理』的萬靈丹——把步驟攤開、加上訓練,模型就會了。這篇研究指出,有一整類程序就是無法靠這套方式被穩定教會,能驗證解答正確,和能被學成可重現的推理過程,是兩回事。
對天天靠 CoT 提示去逼模型『一步步想』的開發者,這是務實的提醒:不是所有把步驟寫清楚就能搞定的問題。理解模型在哪裡學得會、哪裡學不會,比盲目相信『多想幾步就會對』更重要,也替後續該怎麼設計訓練與推理流程,提供了更清醒的地基。
歸剛點評|業界常把思維鏈當成讓模型學會推理的萬靈丹——把步驟攤開加訓練就會了。這篇用九個確定性任務證明:有一整類程序就是無法靠 CoT 穩定教會。能驗證答案正確,和能被學成可重現的推理,是兩回事,替 CoT 畫了能力邊界。
開源
NousResearch 的 hermes-agent 登上 GitHub 趨勢榜,定位是一個會隨使用者一起成長的開源 AI 代理,延續這家社群把前沿代理能力做成可自部署開源工具的路線。
開源實驗室 NousResearch 推出的 hermes-agent 登上 GitHub 趨勢榜,標語直白:『會跟著你一起成長的代理』(the agent that grows with you)。延續這家社群一貫的風格——把前沿的代理能力,做成任何人都能取用、能自己部署的開源專案,而非鎖在某家公司的雲端服務裡。
『跟著你成長』這個定位,瞄準的是當前多數代理的痛點:每次對話結束就忘光,無法把跟你互動累積的偏好、脈絡、習慣留下來。一個能隨使用慢慢長出個人化記憶的代理,理論上用得越久越懂你,這正是把通用工具變成貼身助手的關鍵差異。
更值得標記的是它的開源屬性。當 Anthropic、OpenAI 紛紛把『懂你公司、懂你脈絡』的代理能力做成閉源商品(像今天頭條的 Claude Tag),NousResearch 這類社群選擇把對等的能力開放出來,讓在意資料自主、不想把脈絡交給外部廠商的人多一條路走。這對整個生態的健康很重要。
當然,登上趨勢榜代表關注度,不等於成熟度——開源代理在穩定性、易用性、長期維護上,往往還追不上商業產品的打磨。但有一群人持續把這些能力做成可自部署的工具,至少確保了『個人化、會成長的代理』不會只有閉源這一種選項。對重視掌控權的使用者,這條開源支線值得追蹤。
歸剛點評|當大廠把『懂你脈絡、會成長』的代理做成閉源商品(如今日頭條 Claude Tag),NousResearch 選擇把對等能力開源,讓在意資料自主、不想把脈絡交給外部廠商的人多一條路。登榜代表關注度不等於成熟度,但確保了個人化代理不會只剩閉源一種選項。
觀點
科幻作家暨科技記者 Cory Doctorow 為新書《The Reverse Centaur's Guide to Life After AI》受訪,主張若要戳破 AI 泡沫,得從其根部結構性問題著手,而非只看表面熱度。
科幻作家暨科技記者 Cory Doctorow 帶著新書《The Reverse Centaur's Guide to Life After AI》接受 Ars Technica 訪談,核心主張是:要戳破 AI 泡沫,得朝它的根部下手。與其爭論某個產品好不好用、某家公司值不值那個估值,他更想談的是支撐這整套熱潮的底層結構問題。
書名裡的『reverse centaur(反向半人馬)』是理解他論點的鑰匙。正向的半人馬是人主導、AI 輔助,人借工具放大能力;反向半人馬則倒過來——人被降格成替自動化系統補位、收尾、扛責任的零件。Doctorow 擔心的,正是 AI 的部署方式常把人推向後者,名為輔助,實為把人綁進機器的節奏裡。
他『打根部』的視角,跟單純喊『AI 是不是泡沫』很不一樣。泡沫的討論往往停在估值與炒作,他則指向勞動條件、權力分配、平台對使用者的箝制這些結構性病灶——若這些根不處理,就算某一波熱度退了,造成傷害的機制還在,換個名字捲土重來。
把它擺在本站近期一連串裁員、舉債、資本狂熱的新聞旁邊讀,格外有對照感:當市場一面倒地往上堆資源,像 Doctorow 這樣從『誰受益、誰承擔代價』切入的批判聲音,提供了必要的另一個視角。同不同意他是一回事,但在熱潮裡保留一個追問根部的冷靜聲音,本身就有價值。
歸剛點評|與其爭論 AI 是不是泡沫,Doctorow 要談根部:勞動條件、權力分配、平台箝制。『反向半人馬』是把人降格成替自動化補位扛責的零件。在一片裁員、舉債、資本狂熱裡,從『誰受益、誰承擔代價』切入的冷靜批判,本身就有價值。
產業
Google 從 6 月 23 日起擴充 Google Home 的人臉辨識功能,目標是讓智慧家庭攝影機更不容易因為你背對鏡頭,就把你誤認成別人。
Google 宣布從 6 月 23 日起擴充 Google Home 的人臉辨識能力,主打一個很具體的改善:就算你沒有正面對著鏡頭、甚至背對攝影機,系統也比較不會把你認錯成別人。對裝了智慧家庭攝影機的家庭,這解決的是日常最惱人的小毛病——明明是自己人,卻被誤標成陌生人。
技術上的進步在於擺脫對正臉的依賴。傳統人臉辨識多半要看得到清楚的正面五官,一旦人側身、低頭或背對,辨識就容易失準。Google 顯然在用更多體態、衣著等線索輔助判斷,讓系統在『看不清臉』的情況下,仍能維持對家庭成員的正確辨認。
便利的另一面是隱私的老問題。攝影機要更會認人,前提是它持續在分析、記憶誰長什麼樣、穿什麼,這些生物與行為特徵的蒐集,向來是智慧家庭最敏感的地帶。辨識越準,代表系統對你的掌握越細——好處是少認錯人,代價是更深的個人特徵被持續建檔。
把它放進更大的圖景看,這是 AI 一步步滲進居家日常的縮影:辨識精度的每一次提升,都同時推進便利與監看兩條線。對使用者,值得做的是搞清楚這些辨識資料存在哪、怎麼用、能不能關,再決定要讓攝影機認你認到多細,而非急著一味拒絕或全盤接受。
歸剛點評|攝影機要更會認人,前提是它持續分析、記憶你長什麼樣、穿什麼。辨識精度每提升一次,都同時推進便利與監看兩條線——好處是少認錯人,代價是更深的個人特徵被持續建檔。該搞清楚的是這些資料存哪、怎麼用、能不能關。
產業
The Verge 試用 Sony Xperia 1 VIII 的 AI Camera Assistant,發現實際效果跟先前用它拍出的難看樣張一樣不堪——一個把以拍照見長的品牌反向拖累的 AI 功能。
The Verge 試用 Sony Xperia 1 VIII 上的新功能『AI Camera Assistant』,結論毫不留情:它跟看起來一樣糟。更尷尬的是,Sony 上個月發表這支手機時,竟是用一批『Sony 相機多年來最難看的照片』來宣傳,而那些照片正是出自這個新的 AI 相機助手之手。一個以影像為招牌的品牌,被自家 AI 功能反向拖累。
問題的諷刺之處在反差。Sony 在相機與感光元件領域是公認的老牌強者,影像本該是它最不該失手的戰場。偏偏硬塞進一個拉低成品質感的 AI 助手,等於用一個半生不熟的功能,去稀釋自己最值錢的專業形象,得不償失。
這正好是當前『AI 功能塞好塞滿』風氣的反面教材。許多廠商急著在產品上貼 AI 標籤,把『有沒有 AI』當成賣點,卻沒先確認它到底有沒有把事情做得更好。當 AI 功能讓核心體驗變差,貼這個標籤不但加不了分,反而成了拖累,消費者也不買單。
對照同一天 Fitbit Air『克制地用 AI』獲得好評,Sony 這個案例像是另一端的警示:AI 不是加上去就贏,硬加在自己最強的領域、又沒做好,傷的是品牌信任。真正成熟的做法,是先問這個 AI 有沒有把產品變更好,而不是急著證明『我也有 AI』。
歸剛點評|以影像為招牌的 Sony,竟用 AI 拍出的難看樣張宣傳新機,被自家 AI 功能反向拖累。當前『AI 功能塞好塞滿』的反面教材——AI 不是加上去就贏,硬加在自己最強的領域又沒做好,傷的是品牌信任。對照 Fitbit Air 的克制,高下立判。