第 10 期2026-06-19(台北時間)
第十期,今天 AI 一邊走進醫院救孩子,一邊在搶電、搶人、搶話語權。五條主線整理如下。
- AI 走進醫院:OpenAI 的 o3 替波士頓兒童醫院 18 個查不出病因的孩子找到診斷,登上 NEJM AI,院方累計已解開 40 多件懸案。同一天它又把 ChatGPT 的健康回答找醫師重新校準,半夜問 AI 健康問題拿到的會更像衛教窗口。
- 開源大爆發:中國 Z.ai 用 MIT 授權釋出可能最強的純文字開源模型 GLM-5.2,Lightricks 也開源了能生影片配音的 LTX-2。兩者正好接住第九期『海外閉源模型隨時可能被斷線』的警鐘,給想自己抱回機房的團隊一條後路。
- 資本還在燒:推理服務 Baseten 傳募 15 億美元、估值 130 億,世界模型新星 General Intuition 傳募 3 億。熱錢同時押基礎設施與前沿應用,賭的是 AI 用量只增不減。
- 政治全面開打:FERC 幫資料中心開搶電快速通道,Sanders 提 7 兆基金要大廠交半數股票給全民,Amazon 員工因反對蓋資料中心面臨解雇。算力擴張的代價,電、土地、社區安寧都有人在承擔。
- 一條離家很近:中國壓力下,台灣正擴大造無人機,自用之外連美軍的單都想接。AI 自主系統成了國防與製造的交會點,也是少數能把地緣風險轉成訂單的方向。
頭條
波士頓兒童醫院的遺傳科醫師手上,有一批拖了好幾年都查不出原因的孩子。6 月 18 日刊在 NEJM AI 的研究說明,團隊把 376 件這樣的未解病例丟給 OpenAI 的 o3 Deep Research 模型重新跑一遍,最後替其中 18 個孩子找到了確切的診斷,分布在神經發育、神經肌肉、不明原因猝死與早發性精神病等幾類疾病。這些都是先前一線醫師與專科團隊看過、卻沒能定案的案子。
模型做的事,是把每個孩子的臨床表現、基因定序找到的變異,和全世界已發表的醫學文獻三邊兜在一起,提出「這個變異可能對應哪一種罕病」的假設清單,再交回給醫師判讀。罕病難就難在,關鍵線索常常散落在一篇冷門論文裡,資料其實不缺,缺的是時間——忙碌的醫師沒辦法讀遍所有文獻。AI 一次把這些線索掃過、列出可能性,等於替醫師把大海撈針的前段做掉。
放大來看,波士頓兒童醫院說,AI 在更廣泛的使用裡已經幫他們解開 40 多件過去無解的罕病案例,省下大約 6 萬小時的工時,並把超過 700 萬美元的人力成本挪去做別的事。要強調的是,最後拍板的還是醫師,AI 給的是假設而非結論,錯誤的方向同樣會被列出來,需要人去刪去驗。
對台灣的家庭,這個方向值得關注。罕病確診常常是一場跑遍醫院、等上好幾年的長征,孩子拖著沒有名字的病。把 AI 當成「文獻假設產生器」接進臨床流程,不會取代醫師,但能把確診的時間從幾年壓到可以期待的範圍。誰先把這套流程接進健保體系與醫學中心,誰就能讓更多家庭早一點等到答案。
歸剛點評|罕病確診常拖好幾年,AI 把「讀遍全世界文獻」這段苦工壓成幾分鐘,醫師再來判讀。它影響的是真實的孩子與家庭,也是少數能說清楚「AI 到底救了誰」的案例。台灣醫學中心該認真評估怎麼把這套接進來。
產品
OpenAI 推出 GPT-5.5 Instant,主打改善 ChatGPT 在健康與身心問題上的回答品質:更強的推理、更會看上下文、講得更白話,並請醫師參與評測。同一週 OpenAI 也端出罕病診斷研究,健康成了它的重點戰場。
OpenAI 6 月 18 日說明 GPT-5.5 Instant 在健康與身心領域做了哪些調整。重點放在三件事:回答前先把使用者的處境想清楚、用一般人聽得懂的話講、遇到該就醫的狀況會明確提醒去看醫生,而不是含糊帶過。為了確認改了之後真的有變好,OpenAI 找了醫師一起設計評測題目、打分數。
會特別強調這塊,是因為愈來愈多人把 ChatGPT 當成第一個問健康問題的地方。半夜身體不舒服、看完醫生有聽沒有懂、不知道某個檢查數字代表什麼,很多人會先丟給 AI。問題是健康問題答錯的代價很高,講得太篤定會誤導人、講得太保守又等於沒講,過去模型常在這兩端擺盪。
GPT-5.5 Instant 的做法,是讓模型先確認情況再回答,例如先問清楚症狀多久、有沒有其他狀況,再給對應的建議,並在該轉診時把話說明白。對台灣使用者,這代表深夜那個「要不要掛急診」的問題,得到的回應會更接近一個謹慎的衛教窗口,而不是一段安撫人心卻沒重點的話。
要提醒的是,再會講的 AI 也不是醫師,它沒看到你本人、摸不到你的身體、調不出你的病歷。把它當成查資料、整理問題、想清楚要問醫師什麼的助手很好用;真有狀況,該掛號還是得掛號。OpenAI 自己也把「明確提醒就醫」寫進這次的改動裡。
歸剛點評|半夜身體不舒服先問 AI 已經是常態,OpenAI 把健康回答的品質當成正面戰場在打,還拉醫師進來評分。對天天用 ChatGPT 的台灣人,這直接關係到你問健康問題時拿到的是衛教還是空話。
開源
中國 AI 實驗室 Z.ai 先在 6 月 13 日把 GLM-5.2 給了付費寫程式用戶,6 月 16 日直接以 MIT 授權釋出完整開源權重。這是一個總參數約 7,530 億的 MoE 巨獸,檔案 1.51TB、支援百萬 token 上下文,被 Simon Willison 評為大概是目前最強的純文字開源模型。
Z.ai 這次分兩步走。6 月 13 日先把 GLM-5.2 開放給訂閱寫程式方案的用戶用,6 月 16 日再把完整權重以 MIT 授權公開,任何人都能下載、商用、改造。獨立評論者 Simon Willison 看過之後說,這大概是現在最強的純文字開源權重模型。
規格本身很嚇人:總參數約 7,530 億,採用混合專家(MoE)架構,每次推論只啟動其中一小部分,所以跑起來沒有總參數聽起來那麼重;完整檔案 1.51TB,支援百萬 token 的超長上下文。要注意它只吃文字,看圖的能力 Z.ai 另外放在 GLM-5V 系列,而那個系列目前沒有開源。
MIT 授權是這件事真正的重點。它幾乎沒有附加限制,企業可以下載回自己機房部署、接自己的資料、做商業產品,不必把資料送出去、也不用看別人臉色決定哪天斷線。對在意資料落地與成本的團隊,這種等級的開源權重等於把頂規模型的選擇權交回自己手上。
延續本站第九期講過的 Anthropic 因一道出口管制全球下線的案例,GLM-5.2 正好是另一端的答案:當閉源模型隨時可能因政治因素被關掉,一個能自己抱回家、授權又乾淨的強力開源模型,就是最實際的後路。台灣團隊值得認真測它在中文與程式任務上的表現,至少先養成可切換的架構習慣。
歸剛點評|當閉源模型會因政治因素被斷線,一個 MIT 授權、能自己抱回機房的頂規開源模型就是真正的避險。GLM 出自中國實驗室,資料落地與信任要自己評估,但它把『不被單一供應商掐住』從口號變成可執行的選項。
產業
Amazon AI 主管 Peter DeSantis 向彭博證實,AWS 正在洽談把自研 AI 晶片 Trainium 賣給其他資料中心。源頭是執行長 Jassy 四月致股東信裡的盤算:若把晶片業務獨立出來、同時供應 AWS 與第三方,年營收規模上看 500 億美元。
過去 Amazon 的 Trainium 晶片主要自己用,撐自家雲端 AWS 的 AI 算力。Peter DeSantis 這次告訴彭博,公司正在和其他資料中心洽談直接把 Trainium 賣出去,目前還在很早的階段。這條線的源頭,是 Jassy 四月那封年度股東信裡寫的:自家晶片搶手到他開始認真想對外賣。
那個被反覆提到的 500 億美元怎麼來的?Jassy 的算法是,假設 Amazon 的晶片業務獨立成一家公司,把今年產出的晶片同時賣給 AWS 和外部第三方,年化營收大約就是這個量級。Amazon 手上其實藏了一門巨大的晶片生意,過去都被內部消化掉了。
真正的看點在 Nvidia。整個 AI 算力市場長年被 Nvidia 的 GPU 與 CUDA 生態綁住,買家苦於缺貨又貴。Amazon 若把 Trainium 拿出來外賣,等於在 Nvidia 的地盤旁邊開第二家店,給資料中心多一個選擇。Google 的 TPU、微軟的自研晶片也在走類似的路,雲端三巨頭都想擺脫對單一供應商的依賴。
對台灣的半導體與伺服器供應鏈,這是值得盯的訊號。雲端大廠自研晶片愈賣愈開,代工、封測、散熱、機櫃這些環節的訂單結構會跟著變。誰能同時接到 Nvidia 與這些自研晶片陣營的單,誰的位置就最穩;押錯邊則可能在下一波洗牌裡被邊緣化。
歸剛點評|雲端大廠自研晶片從自用走向外賣,是在 Nvidia 的金礦旁邊開分店。對台灣供應鏈,這牽動代工、封測、散熱的訂單怎麼分配,押對陣營很重要。
產業
準備在第四季 IPO 的 OpenAI,一週內連挖兩名重量級人物:Transformer 共同發明人、Gemini 共同負責人 Noam Shazeer 從 Google DeepMind 跳槽,前川普政府 AI 政策官員 Dean Ball 也將於 7 月 6 日加入領導新團隊 Strategic Futures。
OpenAI 已經祕密遞件申請 IPO,目標第四季掛牌,上市前正在補強陣容。周三 Noam Shazeer 宣布離開 Google DeepMind,他是 2017 年那篇奠基性論文《Attention Is All You Need》的共同作者,Transformer 架構的發明人之一,也當過 Gemini 的共同負責人、創過 AI 角色扮演公司 Character AI。
Sam Altman 在 X 上說,Shazeer 是「從 OpenAI 最一開始我就最想合作的人之一」,還補了一句「只花了十年」。這句玩笑話的潛台詞是,OpenAI 追了這個人很久。對一家準備上市、要向投資人證明技術實力的公司,把 Transformer 的發明者掛進名單,是很有份量的招牌。
另一手是 Dean Ball。他去年在白宮短暫任職,參與發布美國的 AI 行動計畫後離開,回到偏自由意志主義的智庫 Foundation for American Innovation 當資深研究員。他在 X 上說 7 月 6 日將加入 OpenAI,領導一個叫 Strategic Futures 的新團隊,名字聽起來就是管長期策略與政策布局。
一週內同時拿下頂尖技術人才與前政府政策人脈,透露 OpenAI 上市這場仗要打兩條線:技術上維持領先讓投資人埋單,政治上補強和華府打交道的能力。延續第九期 Anthropic 與白宮的角力,前沿 AI 公司現在比的早就包含誰在華府有人、誰能在監管風向裡站穩。
歸剛點評|上市前同時補技術招牌與政治人脈,看得出 OpenAI 知道這場仗一半在實驗室、一半在華府。把 Transformer 發明人掛進名單是給投資人看的硬實力,挖前白宮官員則是補監管時代的生存能力。
資金
TechCrunch 報導,AI 推理服務新創 Baseten 接近敲定一輪 15 億美元募資,估值約 130 億美元,距離上一次大額募資只隔幾個月。資本對「把模型跑起來」這門生意的押注,明顯還沒退燒。
Baseten 做的是 AI 推理(inference)服務,幫企業把訓練好的模型實際部署、跑出結果、扛住流量。TechCrunch 報導它快談定一輪 15 億美元的新募資,估值來到約 130 億美元。值得注意的是,這距離它上一次的大額募資才幾個月,募資節奏快得不尋常。
會這麼搶,是因為市場焦點正從「訓練模型」轉向「跑模型」。前幾年資金都砸在訓練更大的模型上,但模型訓好之後,真正天天燒錢、也天天賺錢的,是每一次使用者送出請求、模型即時回應的那個推理環節。誰能把推理跑得又快又便宜又穩,誰就握住了 AI 落地後的金流。
這股熱度被稱為「推理淘金熱」。前一天才有同類消息:世界模型新創 General Intuition 傳募 3 億美元、估值約 20 億。一邊是基礎設施層的推理服務,一邊是應用層的世界模型,資本兩頭都在加碼,顯示大家賭的是 AI 用量會持續暴衝、對算力與部署的需求只增不減。
對台灣的新創與投資人,這個訊號要冷靜讀。推理這門生意的護城河多半在工程效率與成本控制,不是講故事就能贏;估值衝得快,遇到用量不如預期或大廠自己下海做,回檔也會很快。看到「幾個月又一輪」這種節奏,更該問的是單位經濟算不算得過來,而不是跟著喊熱。
歸剛點評|資金重心從『訓練模型』移到『跑模型』,因為推理才是 AI 落地後天天進帳也天天燒錢的環節。Baseten 幾個月又一輪的節奏很猛,但護城河在工程效率,估值衝太快回檔也會快,看熱鬧前先問單位經濟。
政策
美國聯邦能源管理委員會(FERC)要求電網營運商給資料中心一條併網的快速通道,讓這些吃電大戶能更快接上電網。問題是,這道命令解決了排隊速度,卻沒處理發電量本身不足的缺口。
FERC 下令要電網營運商替資料中心的併網申請開快速通道。背景是 AI 資料中心對電力的胃口大到驚人,一座大型園區的用電可能抵得上一座小城市,而傳統的併網排隊流程動輒數年,跟不上 AI 蓋資料中心的速度,於是政府直接出手插隊。
但 TechCrunch 點出關鍵問題:快速通道只解決了「排隊」,沒解決「總量」。把資料中心往隊伍前面挪,電網能接的電並沒有變多,發電與輸電的實體瓶頸還在。當有限的電被優先撥給資料中心,排在後面的住宅、工廠、其他產業可能被往後推,電價與供電穩定都會受影響。
這碰到的是 AI 時代最硬的物理限制:電。模型再強、晶片再多,沒有足夠的電都跑不起來。美國現在用行政命令幫 AI 搶電,等於把「AI 優先」寫進能源分配,背後是一場資料中心與一般用電戶搶插座的角力,誰排前面是政治決定。
對台灣,這是很值得對照的預演。台灣土地與電力都緊張,AI 資料中心要落地,同樣會撞上供電與電網承載的天花板。美國的做法是讓資料中心插隊,台灣若要發展在地 AI 算力,得先想清楚電從哪來、怎麼在資料中心與民生工業之間分配,否則快速通道只是把搶電的衝突提早引爆。
歸剛點評|AI 最硬的限制不是模型也不是晶片,是電。美國用行政命令讓資料中心插隊搶電,等於把『AI 優先』寫進能源分配。台灣電力本就緊張,這是一場遲早要面對的預演。
政策
參議員 Bernie Sanders 提出法案,要求年營收至少 2 億美元的 AI 大廠一次性繳出 50% 股票,組成規模約 7 兆美元的主權財富基金,每年發 5% 股利給美國民眾,估計人均超過 1,000 美元。AI 巨頭大概都會跳腳。
Sanders 的法案核心很直接:凡是年營收達到 2 億美元以上的領先 AI 公司,要一次性繳出 50% 的股票,注入一個新設的主權財富基金。和一般課稅不同的地方是,他要公司繳的是股票而非現金,等於讓美國全民直接變成這些 AI 巨頭的大股東,基金規模估計約 7 兆美元。
錢怎麼回到人民手上?這個基金設定每年 5% 的股利,直接發給美國民眾,Sanders 估計人均一年能拿到超過 1,000 美元;公司若繼續成長,多出來的收益就拿去投教育、住房、醫療等公共服務。基金由新設的「民主 AI 獨立委員會」管理,七名委員由總統提名、參議院同意,採兩黨制。
Sanders 的理由是一句話:「當一項公共資源創造了財富,公眾就該分享這份財富。」他的論點是,AI 之所以強,靠的是全社會數十年累積的資料、公共研究與基礎建設,成果卻高度集中在少數公司與富豪手裡,所以該把一部分股權還給出了力的大眾。
這個方案幾乎不可能原封不動通過,AI 巨頭必然強烈反對,逼公司交股票在法律與憲法上也會有大戰。但它把一個愈來愈尖銳的問題擺上檯面:當 AI 取代大量工作、財富極速集中,社會該怎麼重新分配紅利。對台灣,這場辯論值得超前思考,因為 AI 帶來的就業與分配衝擊,遲早也會敲到我們的門。
歸剛點評|AI 讓財富極速集中到少數公司,Sanders 用『全民變股東、每年領股利』把分配問題逼上檯面。法案大概過不了,但它問的『AI 紅利該怎麼分給社會』是台灣遲早躲不掉的辯論。
產品
Adobe 把 AI 助理鋪進整套 Creative Cloud 的計畫全面啟動,Photoshop、Premiere、Illustrator 都開始推出能對話的聊天機器人,使用者用講的就能下指令修圖、剪片、做設計。
Adobe 這次把 AI 助理直接做進旗艦軟體。Photoshop、Premiere、Illustrator 陸續推出對話式的助理,使用者不必記一堆工具列在哪、快捷鍵是什麼,直接用文字描述想要的結果,例如「把背景換掉」「把這段剪短一點」,助理就去執行。先以 beta 形式推出。
這對軟體操作是不小的改變。Photoshop、Premiere 這類專業軟體向來以難學出名,功能多到要花好幾年才摸熟,很多人卡在「我知道想要什麼效果,但不知道哪個選單做得到」。對話式助理等於在你和複雜介面之間放了一個翻譯,把意圖直接變成操作。
Adobe 的盤算是守住創作者這塊地盤。Midjourney、各種文字生圖工具正從外圍搶走「我只是想要一張圖」的輕量需求,Adobe 的反擊是讓既有的專業工具更好用,留住已經付費、靠它吃飯的設計師與剪輯師,不讓他們有理由跳出生態系。
對台灣的設計與影音工作者,短期是生產力工具,學習曲線變平、出活更快;中長期則要面對門檻被拉低後的競爭。當改圖剪片變成「會講話就會用」,純技術操作的價值會下滑,能談清楚需求、有審美與創意判斷的人,反而更值錢。把助理當加速器、把精力移到判斷力,是比較務實的調整。
歸剛點評|專業軟體最大的痛點是難學,Adobe 用對話式助理在你和複雜介面之間放了翻譯。門檻被拉平後,純操作的價值下滑,能談需求、有審美判斷的人更值錢,台灣創作者該趁早把重心移過去。
產品
Adobe 替 Firefly AI 助理推出新功能,並重新設計 AI studio,讓使用者能在既有設計的基礎上編輯、生成新作品,工具會記住你創作過的東西長什麼樣。
Adobe 為 Firefly 推出一批新能力,同時把 AI studio 整個重新設計。新版的重點是「記憶」:它記得你之前做過的設計、用過的元素與風格,讓你能在原有作品的基礎上繼續編輯、延伸生成,而不是每次都從一張白紙重來。
這解決了生成工具一個很惱人的毛病。多數文字生圖工具是「一次性」的,每次生成都像擲骰子,要它在同一個角色、同一套視覺風格上接著做,往往會跑掉、對不起來。對需要維持品牌一致性的商業設計,這種記不住前文的特性幾乎沒法用在正式專案。
讓工具記住專案的脈絡,等於把生成式 AI 從「玩具」往「能交付的生產工具」推。設計師最在意的就是一致性:同一個產品的不同素材、同一支廣告的不同尺寸,視覺要連得起來。Firefly 往記憶與專案延續的方向走,是衝著真正的商業使用場景去的。
對台灣的品牌與行銷團隊,這類功能愈成熟,內部自製視覺素材的可行性就愈高。過去要外包或養設計團隊才做得出的一整套視覺,未來可能由一兩個人帶著會記憶的工具就能維持風格產出。Adobe 與 Midjourney 在同一天都往醫療、設計的縱深走,這個賽道的工具迭代速度只會更快。
歸剛點評|生成工具最大的弱點是記不住前文、每次重來,做不了需要一致性的商業案。Adobe 讓 Firefly 記住你的專案脈絡,是把它從玩具推向能交付的工具,台灣行銷團隊自製素材的門檻會再降。
產業
以文字生圖爆紅的 Midjourney,執行長 David Holz 展示了公司第一款硬體產品與全身超音波掃描的應用,還透露要在舊金山蓋一間 spa。他自己也承認,這方向跟生貓圖差很多。
Midjourney 過去是文字生圖的代名詞,使用者打幾個字就能生出精美圖像。執行長 David Holz 這次秀出公司第一款硬體產品,把觸角伸進醫療影像,展示全身超音波掃描的應用,還順帶提到要在舊金山開一間 spa。連他本人都說,這跟大家熟悉的「生貓圖 Midjourney」差很多。
一家純軟體的生圖公司,為什麼要碰硬體和超音波?合理的解讀是,Holz 想把 Midjourney 在影像生成與理解上的本事,從「畫出不存在的圖」延伸到「看懂真實世界的影像」。醫療影像是一個資料密集、又極需精準的領域,若 AI 真能輔助判讀,價值遠高於做幾張漂亮插圖。
這一步充滿不確定。醫療是高度監管、容錯極低的領域,一家以創意生圖起家的公司要切進去,得跨過認證、臨床驗證、責任歸屬等一連串門檻,spa 計畫更像 Holz 個人風格的延伸而非主線。把它看成創辦人對「AI 還能做什麼」的大膽試探,比看成成熟產品線更貼切。
放在同一天的脈絡裡,OpenAI 做罕病診斷、Adobe 強化醫療相關的視覺能力、Midjourney 跨進超音波,生圖與影像 AI 公司不約而同往醫療靠攏。對台灣,醫療影像本就是強項,這波趨勢提醒在地團隊:影像生成的技術紅利,正在從娛樂用途流向真正能救人也能賺錢的臨床場景。
歸剛點評|生圖公司集體往醫療影像靠攏,因為『看懂真實影像』比『畫漂亮圖』值錢太多。Midjourney 這步很冒險、spa 計畫更像創辦人玩票,但方向對:影像 AI 的紅利正從娛樂流向臨床。
政策
The Verge 的 Decoder 播客請來資深 AI 記者 Hayden Field,從 Anthropic 的 Fable 5、Mythos 5 遭禁談起,討論一個愈來愈逼人的問題:當 AI 被認定太危險而該下線,到底是誰、用什麼標準在做這個決定。
延續本站第九期報導的 Anthropic 因白宮出口管制把 Fable 5、Mythos 5 對全球下線,The Verge 的 Decoder 播客找來資深 AI 記者 Hayden Field,把這件事攤開來談。她平常上節目,通常都是因為某個地方出了狀況,這次的核心提問很尖銳:當某個 AI 被貼上「太危險」、該關掉的標籤,這個判斷是誰做的、依據又是什麼。
問題的麻煩之處在於沒有公認的裁判。一個模型危不危險,可以從國安、從濫用風險、從商業競爭、從政治立場切入,每個角度給出的答案都不一樣。白宮、AI 公司、五角大廈、學界各有各的標準與利益,當這些標準互相打架,最後拍板的往往是手上有權力按開關的人,未必最懂技術。
Anthropic 的案例之所以關鍵,是它把這個抽象問題變成現場直播。一個被廣泛使用的模型,因為一道連業界都看不太懂的命令說關就關,等於示範了「太危險」這個標籤可以多模糊、又能多有殺傷力。標準不透明的時候,平台會傾向過度防守,寧可全關也不願承擔風險。
對台灣的開發者與企業,這場討論的實際意義是:你依賴的海外 AI,可能因為一個你完全參與不了、也看不懂標準的決定就消失。除了技術上預留替代方案,也該開始關注各國對 AI 的監管走向,因為決定你工具命運的,愈來愈是政策與權力,模型本身好不好反而是其次。
歸剛點評|『AI 太危險』這個標籤誰來貼、依據什麼,現在沒有公認裁判,最後按開關的常是握權力的人而非最懂技術的人。對依賴海外 AI 的台灣團隊,工具的命運愈來愈由政策決定,得開始盯監管風向。
社會
三名 Amazon 軟體工程師本月在西雅圖市議會聽證會上,替限制資料中心擴張的提案作證,事後表示因此面臨懲處甚至被解雇。AI 帶來的環境與社區衝擊,正在自家員工身上引爆衝突。
事情發生在西雅圖。三名 Amazon 軟體工程師本月初到市議會的聽證會上作證,支持對資料中心擴張設限的提案,作證一開頭還引用了相關說法。據 The Verge 報導,他們之後表示因為這次發言面臨公司的紀律處分,甚至可能被解雇。
衝突的源頭是資料中心的代價。AI 熱潮讓科技公司瘋狂蓋資料中心,這些設施吃掉大量電力與水、佔地廣、還影響周邊社區的環境與電價。一邊是公司的擴張需求,一邊是員工身為在地居民對自家社區的擔憂,當員工選擇站到限制那一方,就和雇主的利益正面對撞。
員工因為公開立場面臨懲處,把一個敏感問題推到台前:科技公司員工能不能在自己住的城市,以公民身分公開反對雇主的擴張計畫。這牽涉言論、勞權與企業利益的拉扯,也讓 AI 基礎建設的社會成本,從遙遠的環境議題變成具體的飯碗問題。
放在同一天 Sanders 提案要全民共享 AI 紅利、FERC 幫資料中心搶電的脈絡裡,這則新聞補上了被忽略的一塊:AI 的算力擴張不是免費的,電、水、土地、社區安寧都有人在承擔。對台灣,資料中心若要在地落腳,與在地居民的協調同樣躲不掉,這是一堂提前上演的課。
歸剛點評|AI 算力擴張不是免費的,電、水、土地、社區安寧都有人承擔。員工因公開反對雇主擴張而面臨解雇,把這筆社會成本變成具體的飯碗衝突。台灣資料中心要落地,同樣躲不掉與在地居民的協調。
資金
TechCrunch 報導,新創 General Intuition 正洽談募資 3 億美元、估值約 20 億美元。它用遊戲剪輯平台 Medal 每年 20 億支、來自千萬月活用戶的影片,訓練具身 AI 與世界模型。
General Intuition 做的是具身 AI(embodied AI)與世界模型,目標是讓 AI 學會理解物理世界怎麼運作、東西會怎麼移動。它的獨門資料來源很特別:遊戲剪輯平台 Medal 每年產生約 20 億支影片,來自 1,000 萬名月活躍使用者,等於一座海量的「世界如何運作」影像庫。TechCrunch 說它正談一輪約 3 億美元、估值約 20 億的募資。
用遊戲影片訓世界模型,邏輯其實通順。遊戲畫面裡充滿了物體運動、碰撞、因果關係,又有大量玩家操作的紀錄,是相對乾淨又便宜的世界互動資料。比起在真實世界蒐集機器人動作資料,這種來源量大、成本低,很適合教 AI 預測「接下來會發生什麼」。
世界模型被視為下一個重要方向。會聊天、會生圖的 AI 處理的是符號與像素,而世界模型要讓 AI 在腦中建立對物理世界的預測能力,這是機器人、自動駕駛、遊戲 NPC 真正智慧化的關鍵。前一天 Baseten 募 15 億押注推理基礎設施,這天資本又押世界模型,顯示熱錢正同時往基礎層與前沿應用兩頭流。
對台灣,這條線提醒兩件事。其一,資料的來源與獨佔性愈來愈值錢,General Intuition 的籌碼就是別人拿不到的 Medal 影片庫;其二,世界模型若成熟,會直接餵養機器人與自駕,而這些正是台灣製造業想升級的方向。看懂資本在賭什麼,比追逐單一熱門題目更重要。
歸剛點評|世界模型要讓 AI 在腦中預測物理世界怎麼動,是機器人與自駕真正智慧化的關鍵。General Intuition 的籌碼是別人拿不到的 20 億支遊戲影片——資料的獨佔性愈來愈值錢,這點台灣製造業升級時要記住。
產業
Snapchat 母公司 Snap 又拆掉一個內部單位。新公司 Dotmo 由離開 Snap 的現職員工組成,專注 AI 影片生成的開發,分拆的主因是成本太高。
Snap 再次把一個內部團隊分拆出去。新成立的 Dotmo 由一批離開 Snap 的現職員工組成,主攻 AI 影片生成技術。TechCrunch 報導,這次分拆的直接原因是成本:AI 影片這條線太燒錢,Snap 選擇讓團隊帶著技術獨立出去,自己不再扛全部開銷。
這反映 AI 影片生成的殘酷經濟。訓練與運行影片生成模型需要海量算力,比文字、靜態圖貴上好幾個量級,對一家本業是社群 App、財務壓力不小的公司,硬養這樣一個高成本團隊很吃力。與其勉強內部燒錢,不如讓它出去獨立募資、自負盈虧。
分拆對雙方未必是壞事。團隊脫離母公司的預算限制與內部優先順序,可以更專注、也更容易拿到外部資金;Snap 則甩掉一塊重擔,把資源集中在核心業務上。代價是 Snap 等於承認自己沒辦法在 AI 影片這個熱門賽道直接競爭,只能用分拆換取一點關聯。
放在這天的資金新聞旁邊看格外有意思:一邊是 Baseten、General Intuition 拿到巨額募資往前衝,一邊是 Snap 燒不起只能把團隊推出門。同樣在 AI 影片與生成的賽道,口袋深、估值高的玩家加速擴張,資源有限的公司被迫退場。對台灣中小型科技公司,這是清楚的提醒:在重資本的 AI 賽道,沒想清楚錢從哪來就別硬跳。
歸剛點評|AI 影片生成貴到一家社群公司養不起,Snap 只能把團隊推出門自負盈虧。同一天有人募巨資狂奔、有人燒不起退場,重資本賽道的分水嶺很現實:沒想清楚錢從哪來就別硬跳。
社會
交友平台 Match 的調查顯示,約 47% 的美國單身者對 AI 介入約會持負面態度,但不少交友 App 使用者願意接受 AI 幫忙潤飾個人檔案、提供聊天開場建議。對 AI 的態度,卡在反感與真香之間。
Match 公布一份單身者調查,約 47% 的美國單身者對「在約會裡用 AI」抱持負面看法。但同一批人裡,許多交友 App 的使用者並不排斥讓 AI 幫忙把個人檔案寫得更好,或在不知道怎麼開口時,給一點聊天的開場建議。態度明顯是分裂的。
這種分裂其實很好懂。約會的核心是真誠與信任,大家擔心的是對面那個人到底是不是真人、那些動人的訊息是不是 AI 代寫的,這會直接戳到關係的根本。但同時,寫自我介紹、想第一句話要說什麼,又是很多人真心覺得卡關、想要有人幫一把的環節。
界線落在「AI 幫我表達自己」還是「AI 代替我假裝成另一個人」。前者像請朋友幫你看看履歷、潤一下用字,大家接受度高;後者等於用 AI 製造一個不存在的人設去騙人,碰到的就是誠信底線。同一個工具,用在哪一端,觀感天差地別。
這份調查是觀察大眾怎麼接納 AI 的好樣本:人們會按場景、按有沒有觸碰核心價值來分,很少全盤接受或全盤拒絕。對台灣做面向消費者產品的團隊,這是實用的提醒——把 AI 定位成「幫使用者更好地做自己」會被歡迎,定位成「替使用者偽裝」則會踩雷,分寸決定產品的生死。
歸剛點評|人對 AI 很少全收或全拒,多半按場景分:幫你『更好地表達自己』被歡迎,幫你『假裝成別人』就踩誠信底線。這份約會調查是觀察大眾接納 AI 的好樣本,做消費產品的台灣團隊該記住這條分界。
研究
兩篇 Hugging Face 熱門論文 iOSWorld 與 MyPCBench,提出評測「個人化智能」手機與電腦代理的新基準。它們指出現有測試多在沒有個人色彩的環境裡跑,和真實部署有落差,主張 AI 代理要能理解使用者的身分、歷史與偏好。
iOSWorld 與 MyPCBench 這兩套新基準,盯的是同一個缺口。一個好用的手機或電腦代理,應該認得操作它的是「你」——你的身分、你的使用習慣、你存在裝置上的歷史與偏好,而不是把每個使用者都當成一張白紙。論文指出,現在多數評測都在沒有個人脈絡的環境裡進行,模型在測試裡表現好,搬到真實裝置上卻常常水土不服。
差別在哪?舉例來說,你叫代理「把昨天那封信轉給常合作的廠商」,它得知道「昨天那封信」是哪封、「常合作的廠商」是誰,這些都藏在你的裝置與過往紀錄裡。一個只會執行通用指令、卻讀不懂你個人脈絡的代理,做起真正貼身的任務就會頻頻出錯。
這兩套基準的價值,是把「個人化」從一句口號變成可以打分的標準。有了能衡量的指標,研究者才知道模型在理解個人脈絡上到底進步了多少,廠商也才有共同的尺去比較誰家的代理更貼心。手機與電腦代理要從展示走向天天能用,這類評測是必要的基礎工程。
對台灣的應用開發者,這提醒了下一階段的競爭點。當大家用的底層模型差距縮小,能不能安全又準確地讀懂使用者的個人脈絡、把貼身任務做對,會成為產品好不好用的關鍵差異。同時,個人脈絡牽涉大量隱私資料,怎麼在貼心與隱私之間拿捏,會是繞不過去的設計課題。
歸剛點評|AI 代理要從展示走到天天能用,關鍵是讀懂『你』的個人脈絡而不是把人當白紙。這兩套基準把個人化變成能打分的標準,也預告下一階段的競爭點:在貼心與隱私之間拿捏,台灣應用開發者該提早想。
資安
ServiceNow 在 Hugging Face 發表 MosaicLeaks,專門測試研究型 AI 代理在工作過程中會不會無意間洩漏該保密的資訊。當企業把愈來愈多敏感任務交給代理,這類資安評測變得很關鍵。
ServiceNow 發表的 MosaicLeaks,問的是一個很實際的問題:你交給研究型 AI 代理的機密,它守得住嗎?這類代理會幫你查資料、整理文件、跨多個來源彙整答案,過程中會接觸到大量敏感資訊。MosaicLeaks 就是設計來測它會不會在輸出、引用或對外查詢時,把不該講的內容說溜嘴。
風險來自代理的運作方式。一個研究代理為了完成任務,可能同時讀內部機密文件、又上網查公開資料、還和其他工具往來。資訊在這些動作之間流動時,很容易發生它把內部機密當成一般素材,寫進回答、塞進搜尋查詢、或在引用來源時不慎曝光,使用者卻渾然不覺。
這正是 AI 代理熱潮底下被低估的一塊。大家忙著比代理多會做事、能串多少工具,卻很少認真測它會不會在過程中漏資料。MosaicLeaks 把這個盲點變成可以系統化檢驗的項目,讓開發者在部署前就能知道自家代理的保密能力有多可靠,而不是出事了才補。
對台灣的企業,這個提醒很直接。當你準備把法務、財務、研發這類碰機密的工作交給 AI 代理,先問它守不守得住秘密,和問它做不做得快一樣重要。導入代理前,把資料外洩納入評估清單、設好權限與審計,是避免把方便變成風險的基本功。
歸剛點評|大家忙著比 AI 代理多會做事,卻很少測它會不會在過程中把機密說溜嘴。企業要把碰機密的工作交給代理,『守不守得住秘密』和『做不做得快』一樣重要,導入前就該把資料外洩納入評估。
開源
Lightricks 在 GitHub 開源 LTX-2,一個能同時生成影像與聲音的音視訊生成模型,並附上官方的 Python 推論套件與 LoRA 訓練工具,登上 GitHub 趨勢榜。在 Snap 燒不起 AI 影片的同一天,開源陣營端出能自己跑的選項。
Lightricks 開源了 LTX-2,這是一個音視訊(audio–video)生成模型,能同時產出畫面與聲音。它隨附官方的 Python 推論套件和 LoRA 訓練工具,意思是開發者不只能直接用,還能用自己的資料微調,做出特定風格或用途的版本,目前在 GitHub 趨勢榜上很顯眼。
附上 LoRA 訓練工具是重點。LoRA 是一種輕量微調技術,不必重訓整個大模型,用相對少的資料和算力就能讓模型學會新風格或新題材。對個人開發者和小團隊,這代表他們有機會在開源的影片模型上,做出貼合自己需求的客製版本,而不是只能用大廠給好的成品。
這跟同一天 Snap 因成本拆掉 AI 影片團隊形成有趣對照。商業公司算不過帳、選擇退場的領域,開源社群反而把工具攤開來給所有人用。閉源大廠燒巨資追求最頂的品質,開源路線則靠可自行部署、可微調、零授權費,在另一條軌道上累積能量。
對台灣的創作者與獨立開發者,開源音視訊模型把門檻拉低了一截。過去做 AI 影片得仰賴付費雲端服務、按用量計費,現在多了一個能自己抱回機房、依需求微調、不必看供應商臉色的選項。配合本期 GLM-5.2 開源權重,今天可說是開源陣營很有看頭的一天。
歸剛點評|商業公司算不過帳退場的 AI 影片領域,開源社群反而把工具攤開給所有人用,還附微調工具。對台灣獨立開發者,這是能自己抱回機房、不必按用量付費的選項,配合 GLM-5.2 開源,今天開源很有看頭。
社會
Ars Technica 報導,面對中國的壓力,台灣正擴大無人機的生產與國防採購,這些投入除了自身防衛,也可能順勢打進美軍與海外市場。AI 與自主系統正成為台灣國防與產業的交會點。
在中國的軍事壓力下,台灣正擴大無人機的生產與國防採購。Ars Technica 報導,台灣的無人機支出計畫除了強化自身防衛,也可能把這條供應鏈延伸到海外,包括接美軍的訂單。無人機愈來愈倚重 AI 與自主導航,國防需求就和台灣擅長的科技製造接上了線。
這背後有清楚的戰略邏輯。現代無人機在偵察、目標辨識、自主飛行上大量用到 AI,是典型的軟硬整合產品,而台灣本來就有強大的電子與精密製造基礎。把國防需求轉化成產業能力,既補上自我防衛的缺口,又可能養出一個能外銷的新興產業,是一舉兩得的盤算。
對美軍的吸引力也說得通。美國正想擺脫對特定來源無人機與零組件的依賴,台灣的製造實力與民主供應鏈身分,剛好對上這個需求。地緣政治的緊張,反而為台灣的無人機產業開了一扇通往國際市場的門,把壓力轉成訂單。
放在本站長期關注的脈絡裡,這則新聞很具體地說明了,AI 的影響早就超出聊天機器人的範圍。當多數 AI 新聞繞著模型和晶片打轉,自主系統正悄悄改寫國防與製造的版圖,而台灣站在這個交會點上。對在地產業,這是少數能把地緣風險直接轉為產業機會的方向,值得認真投入。
歸剛點評|當多數 AI 新聞繞著模型晶片打轉,自主系統正改寫國防與製造的版圖,而台灣剛好站在交會點上。地緣壓力反而替台灣無人機產業開了通往美軍與國際市場的門,這是少數能把風險轉成訂單的方向。