歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

第 8 期2026-06-17(台北時間)

第八期,火箭公司開始大買 AI。SpaceX 在史上最大 IPO 後幾天,宣布用 600 億美元股票吃下編程工具 Cursor,對外喊出 26 兆美元的 AI 市場想像,等於把上市募到的籌碼全押在追趕 OpenAI 與 Anthropic 上。另一頭,Anthropic 和白宮的 Mythos/Fable 出口管制還在延燒,這次連《大西洋》引述的資安界都跳出來說「你管的是防守方的工具」。錢的真相也被掀開:外洩財報顯示 OpenAI 一年燒掉好幾十億美元,ChatGPT 全球市占首度跌破五成。資安面更不平靜,Copilot 被挖出能偷走兩步驟驗證碼的重大漏洞。歸剛欸,當估值、政治、虧損、漏洞同一天擺上桌,AI 這場牌局比的早已超出誰的模型強,而是落到誰撐得住、誰守得住。

頭條

SpaceX 用 600 億美元股票收購 Cursor:火箭公司把賭注全押在 AI 編程上

SpaceX 上週才剛完成史上最大規模的 IPO,這週就端出 600 億美元的全股票收購案,把 AI 編程工具 Cursor 整碗端走。TechCrunch、The Verge 與 Ars Technica 都證實這筆交易,目的寫得很白:補強 SpaceX 內部那個一直跑不快的 AI 部門。Cursor 是近兩年崛起最快的 AI 寫程式工具之一,主打讓開發者用自然語言指揮 AI 改整個專案的程式碼,正好填上 SpaceX 在生成式 AI 上的缺口。

用全股票而非現金付帳,這個細節很關鍵。SpaceX 剛上市、股價正熱,等於拿被市場捧高的紙上身價去換一家真正有產品、有工程團隊的公司,而不必動用 IPO 募到的現金。Ars Technica 的標題講得直接:兩家公司各自單打都很難贏,合起來才有機會跟 Anthropic、OpenAI 同桌。SpaceX 向投資人開出的胃口更大,宣稱看到一個 26 兆美元的 AI 潛在市場,這個數字本身就是說給股東聽的成長故事。

把前幾期的線索接起來看會更完整。第五期我們就提醒過,SpaceX 掛牌時被市場當成「AI 概念股」在估值,一家火箭公司的本益比被 AI 想像撐起來;第七期它完成史上最大 IPO、首日大漲 19%。現在這筆 Cursor 收購,等於是把外界的 AI 期待兌現成實際動作——你說我是 AI 公司,那我就真的去買一家 AI 公司給你看。

對台灣的工程團隊,有兩個現實要注意。第一,AI 編程工具的競爭正在被巨頭資本快速整併,獨立小工具被高價收編的速度越來越快,選工具時要把「會不會被買走、買走後策略會不會轉彎」算進去。第二,當火箭、社群、AI 全被同一個集團越攏越緊,單一供應商出事的連帶風險也跟著放大,重要的開發流程別綁死在一個還在證明自己的新平台上。

歸剛點評|一週之內從史上最大 IPO 到 600 億美元收購,SpaceX 用紙上身價換真實 AI 戰力,把「我是 AI 公司」的故事做成了動作。對開發者來說,最該記的是工具整併正在加速,押注新平台前先想清楚它三年後還在不在、策略會不會變。
來源:TechCrunch · The Verge · Ars Technica
產業資金

SpaceX 估值膨脹到 2.6 兆美元,盤中一度超車 Amazon

SpaceX 自上週五掛牌以來估值再增加 1 兆美元,衝上 2.6 兆美元,盤中一度短暫超越 Amazon。

SpaceX 的股價狂飆還沒停。TechCrunch 報導,從上週五正式掛牌交易到現在,這家公司的估值又增加了 1 兆美元,總值衝到 2.6 兆美元,盤中甚至短暫越過 Amazon。一家本業是發射火箭與經營星鏈衛星網路的公司,市值竟然摸到全球最大電商與雲端巨頭的位置,這個對比本身就說明市場現在多熱。

為什麼漲這麼凶?關鍵還是 AI 敘事。第五期我們就拆解過,SpaceX 上市時是被當成「AI 概念股」在定價,投資人買的早已超出火箭本身,更看重它把 AI 接進星鏈、衛星、火箭製造的整套想像。這週宣布 600 億美元收購 Cursor,正好替這套敘事加柴火——市場看到它真的在 AI 上花大錢,估值就再往上跳一階。

風險是,2.6 兆美元的身價是建立在「未來會成」的預期上,而非當下的 AI 營收。第七期它首日大漲 19%、完成史上最大 IPO,市場情緒已經拉到極高點;一旦 Cursor 整合不順或 AI 部門遲遲交不出成績,這 1 兆美元的增幅也可能同樣快地蒸發。對看戲的人來說,這是一堂活生生的「估值與基本面落差」教材:紙上市值漲得越快,回吐時也越猛。

歸剛點評|市值灌水到能跟 Amazon 並肩,靠的是 AI 想像而非眼前營收。漲得有多快,回吐時就有多急,這是觀察 AI 泡沫情緒的最佳溫度計。
來源:TechCrunch
政策監管

Mythos/Fable 出口管制再延燒:資安界警告白宮關掉的是防守方的工具

Anthropic 與白宮的 Mythos/Fable 封鎖案持續發酵。資安專家 Katie Moussouris 直指 Fable 5 的出口管制反而傷害美國的網路防禦,《大西洋》與 The Verge 補上更多內幕。

Anthropic 被白宮以國安為由要求下架 Mythos 5 與 Fable 5 的風波,這週又有新進展。Simon Willison 引述《大西洋》記者 Matteo Wong 的報導指出,Luta Security 執行長、資安老將 Katie Moussouris 拿到了白宮那份關於 Fable 越獄能力的報告,並直言對 Fable 5 的出口管制其實會傷害美國自己的網路防禦——因為防守方同樣依賴這類模型去找漏洞、補破口。

The Verge 的長文〈Inside the fight over Claude Mythos 5〉則把時間軸補得更完整:當全美還在慶祝美國隊首度奪下世界盃、紐約尼克拿下總冠軍時,Anthropic 整個週末都在跟川普政府纏鬥。這場仗的核心矛盾沒變——白宮把前沿模型的越獄能力當成必須管制的武器,資安社群卻認為同一個能力是防守方的盾,一刀切下去,受傷的是想守住系統的人。

把第六、第七期接起來看,這已經是同一條主線的第四、五塊拼圖。第六期揭露白宮真正怕的是中國拿到「找漏洞神器」;第七期幾十位資安老將連署反對、TechCrunch 拆穿封鎖跟越獄無關。現在連《大西洋》引述的權威專家都加入,論點高度一致:把模型當戰略物資鎖起來,擋住的不只是壞人,還有所有正當的防守者。

對台灣的資安團隊與企業,這條線的提醒很實際。前沿模型現在會因為一份不公開的國安判斷被緊急管制,能不能用、誰能用,隨時可能變動。把資安流程裡的 AI 工具當成「可能哪天就被斷供」來規劃,預留本地或替代方案,別讓整套偵測、修補流程吊在一個隨時可能被政府拔線的模型上。

歸剛點評|封鎖案延燒到第五天,論點越來越清楚:把模型當武器鎖起來,傷到的是防守方。對任何把 AI 接進資安流程的團隊,這是一記響亮的供應鏈警鐘——能用的工具,明天可能就因一紙管制消失。
研究突破

OpenAI 推「部署模擬」:在模型上線前先預測它會怎麼行為

OpenAI 發表 Deployment Simulation 方法,利用真實對話資料在模型部署前預測其行為,藉此改善安全評估。

OpenAI 這週發表了一套叫 Deployment Simulation(部署模擬)的方法,核心想法是:與其等模型上線後才發現問題,不如在部署前就先用真實對話資料模擬它將會怎麼回應,把潛在的危險行為提前抓出來。官方把這定位成安全與評估流程的升級,目標是讓上線前的測試更貼近真實使用情境,而非只跑一堆人工設計的測試題。

為什麼這件事重要,得從現在模型評估的痛點講起。傳統的評測多半靠固定的測試集,模型很容易「考前猜題」,在標準題庫上表現亮眼,一碰到真實世界五花八門的問法就露餡。用真實對話分布去模擬部署環境,等於把考場換成更接近實戰的場景,理論上能更早發現模型在邊角案例上的失控傾向。

把它放進這幾期的脈絡看會特別有意思。整個禮拜的頭條都在講 Mythos/Fable 因為「越獄能力」被白宮管制,業界對「模型上線後會不會被玩壞」的焦慮拉到最高。OpenAI 這時推出上線前的行為預測工具,剛好打在這個焦慮點上——對監管者與企業客戶來說,能在部署前就把風險量化,是一個很有說服力的賣點。對台灣想導入大模型的團隊,這也提示了一個方向:別只看模型在 benchmark 上的分數,要問供應商有沒有貼近真實情境的部署前評估。

歸剛點評|在所有人都擔心模型上線後失控的這個禮拜,OpenAI 端出上線前先預測行為的工具,時機抓得很準。對導入大模型的團隊,這提醒你選型時別只看跑分,要追問供應商的部署前安全評估做到什麼程度。
來源:OpenAI
官方發布

DeepMind 攜手英國政府:用 AI 加速建房審批決策

英國政府與 Google DeepMind 合作打造 AI 原型系統,目標是加快住宅建案的規劃審批決策。

Google DeepMind 這次把 AI 用到了一個很接地氣的地方:幫英國政府加速蓋房子。官方部落格宣布,雙方合作打造一套 AI 驅動的原型系統,鎖定住宅建案的規劃審批流程,目標是讓那些卡在行政程序裡的建案決策跑得更快。英國長年苦於住房供給不足,而審批的冗長正是其中一個老大難的瓶頸。

這套系統要解的痛點很具體。一份建案申請往往牽涉海量的法規文件、環境評估、歷史紀錄與地方意見,承辦人員得人工比對、逐項核對,光是把資料讀完就曠日廢時。AI 的角色是把這些非結構化的文件快速整理、標出關鍵爭點、提示相關法規,讓人類審查官能把時間花在判斷而非翻文件上。重點在於它定位是輔助決策,最終拍板還是人。

值得注意的是,這是政府主動找上前沿 AI 公司,把 AI 放進公共行政核心流程的案例。對照本週另一條新聞——五角大廈炫耀用 AI 寫國會要求的報告——可以看到一個趨勢:AI 正從消費端往政府治理端滲透。對台灣,這類案例有參考價值:公部門導入 AI,最有感的切入點往往是這種文件密集、流程冗長的審批業務,但同樣得守住「AI 輔助、人類負責」的底線,避免把判斷權整碗交給模型。

歸剛點評|政府主動把 AI 塞進公共行政的核心流程,這是 AI 從消費端走向治理端的明確訊號。對台灣公部門,文件密集的審批業務正是最有感的導入點,但底線要守住:AI 整理資料,人類負責拍板。
產業資金

外洩財報:OpenAI 一年虧損數十億美元,營收成長被研發吃光

外洩的審計財報顯示,OpenAI 雖然營收持續成長,卻被龐大的研發與其他支出蓋過,一年虧損數十億美元。

Ars Technica 取得的一份外洩審計財報,把 OpenAI 的真實財務狀況攤在桌上:營收確實在成長,但被巨額的研發與營運支出吃得乾乾淨淨,結果是一年虧損好幾十億美元。這份是經過會計師審計的數字,不是市場傳言,分量比一般爆料重得多。

虧損的結構說明了前沿 AI 這門生意有多燒錢。訓練與運行頂級模型需要天量的算力、頂尖人才的薪酬、以及不斷往下一代模型砸的研發投入,這些支出的成長速度比營收還快。換句話說,使用者越多、模型越強,要燒的錢也越多,營收成長追不上成本膨脹,帳面就只能繼續紅字。

把它跟本週其他新聞擺在一起看格外諷刺。同一週,SpaceX 估值衝到 2.6 兆、花 600 億買 Cursor,整個產業沉浸在天文數字的樂觀裡;但 OpenAI 這份審計財報像一盆冷水,提醒大家最領先的玩家其實還在大失血。第六期我們也談過「AI 巨頭擠著上市」,資本市場的熱度和底層的獲利能力之間,落差正越拉越大。對台灣的投資人與創業者,這是一個務實的提醒:別被估值數字迷惑,AI 公司能不能把營收變成利潤,才是長期能不能活下來的關鍵。

歸剛點評|最領先的 AI 公司一年還在虧好幾十億,這盆冷水正好澆在 SpaceX 2.6 兆估值的同一週。提醒投資人與創業者:估值是故事,能不能把營收變利潤才是生死線。
來源:Ars Technica
資安

Copilot 重大漏洞 SearchLeak:駭客可竊取使用者的兩步驟驗證碼

一個名為 SearchLeak 的漏洞讓駭客能從 Copilot 使用者手中竊取 2FA 驗證碼,再次暴露業界在 LLM 安全上的結構性弱點。

Ars Technica 揭露一個影響 Copilot 的重大資安漏洞,命名為 SearchLeak。透過這個漏洞,攻擊者可以從使用者手中竊取兩步驟驗證(2FA)的驗證碼——而 2FA 本來是保護帳號最後一道防線。一旦這道防線能被繞過,攻擊者就有機會接管帳號,後果不容小覷。

更值得警惕的是 Ars Technica 的判斷:這個案例再次證明業界在 LLM 安全上的做法一次又一次失敗。問題的根源在於大模型會把它讀到的內容當成可信指令來執行,攻擊者只要把惡意指令藏進模型會接觸到的資料裡(例如搜尋結果、網頁、文件),就能誘導模型做出洩漏敏感資訊這類它本不該做的事。這類「提示注入」的攻擊面,是把 LLM 接進真實系統後幾乎無法徹底封死的老問題。

把它放回本週的脈絡,諷刺感很強。整個禮拜大家在吵 Mythos/Fable 模型「越獄能力」該不該被政府管制,討論的是抽象的國安風險;SearchLeak 卻是一個此時此刻、實實在在能偷走你驗證碼的具體漏洞。對台灣的企業與個人,提醒很直接:把 AI 助理接上信箱、行事曆、企業內部系統時,等於是把提示注入的攻擊門也一起打開了。導入前先想清楚 AI 能碰到哪些敏感資料、出事時的最壞情況是什麼,別為了方便把所有權限一次給滿。

歸剛點評|當大家忙著吵模型該不該被政府管制,一個能偷走 2FA 驗證碼的真實漏洞已經在眼前。提示注入是 LLM 接進真實系統後幾乎封不死的老問題,把 AI 助理接上信箱與內部系統前,先把權限和最壞情況想清楚。
來源:Ars Technica
產業

Anthropic 喊停 Claude Agent SDK 的按 token 計費,重度用戶逃過一劫

Anthropic 暫停了原訂週一上路的 Claude Agent SDK 按 token 計費方案,該方案原本會大幅推升重度用戶的成本。

Anthropic 這週按下暫停鍵,喊停了原本要在週一上路的 Claude Agent SDK 按 token 計費方案。根據 Ars Technica,這套新計費方式如果照原訂上路,會讓重度使用者的費用大幅暴增,等於對最依賴這套工具的開發者開了一張更貴的帳單。社群反彈之後,公司決定先踩煞車。

事情的關鍵在於計費模式的轉變對誰最痛。Claude Agent SDK 是讓開發者打造自動化代理(agent)的工具,這類代理在跑任務時往往會大量、反覆地呼叫模型,token 消耗的量級跟一般聊天完全不同。一旦改成嚴格按 token 計價,那些把代理跑得最勤、最依賴自動化的進階用戶,成本會被放大得最厲害,剛好打到平台最核心的擁護者。

Anthropic 願意在上路前喊停,至少說明它聽到了開發者的聲音。但這也反映出整個產業的一個結構張力:本週稍早 Ars Technica 才揭露 OpenAI 一年虧數十億,前沿模型的算力成本高到嚇人,平台遲早得想辦法把成本轉嫁出去。對台灣靠這些 SDK 開發產品的團隊,提醒很實際——把成本結構押在單一供應商的計費政策上,風險不小。今天能暫停,不代表明天不會用別的方式漲回來,架構設計時最好預留替代方案與成本上限。

歸剛點評|平台願意聽開發者的話踩煞車是好事,但前沿模型成本高到 OpenAI 一年虧數十億,計費遲早要漲。靠 SDK 吃飯的團隊別把成本押在單一供應商的政策上,預留替代方案與成本上限才安全。
來源:Ars Technica
產業

ChatGPT 全球市占首度跌破五成,Gemini 與 Claude 在後追趕

ChatGPT 的市占率首次跌破 50%,但仍以超過 11 億月活躍用戶穩坐第一,Gemini 以 6.62 億、Claude 以 2.45 億緊追在後。

AI 聊天助理的版圖正在重新洗牌。TechCrunch 報導,ChatGPT 的全球市占率首度跌破 50%——這是一個象徵意義很強的門檻,代表它從「幾乎獨佔」走向「最大但不再過半」。不過先別急著唱衰,ChatGPT 仍以超過 11 億的月活躍用戶穩穩坐在第一,規模依然冠絕群雄。

真正的看點是後面追兵的速度。同一份數據顯示,Gemini 已經累積 6.62 億月活躍用戶,Claude 也來到 2.45 億。Google 靠著把 Gemini 塞進搜尋、Android、Workspace 等龐大既有產品線,用「順便就用到」的方式快速擴大基數;Anthropic 的 Claude 則在開發者與企業端站穩腳跟。市場從一家獨大,正在變成三強鼎立的格局。

把這條跟本週其他新聞串起來看更有味道。ChatGPT 市占跌破五成的同一週,Ars Technica 揭露 OpenAI 一年還在虧數十億;用戶最多、卻也燒錢最凶、市占還在被蠶食,OpenAI 的壓力可想而知。第六期我們也提過「不是每個人都在用 AI 做每件事」的潑冷水論點,市場成長終究有天花板。對台灣的產品團隊,這提醒你別把雞蛋全放在單一模型供應商——三強競爭對使用者是好事,多方比價、保留切換彈性,是這個階段最划算的策略。

歸剛點評|從一家獨大走向三強鼎立,對使用者是好消息。但 ChatGPT 市占跌破五成、OpenAI 又同週被爆一年虧數十億,壓力全寫在臉上。產品團隊此時最該做的是保留切換彈性,別把身家押在單一模型供應商。
來源:TechCrunch
產品

Android 17 與 Wear OS 7 發布,Google 把 Gemini 功能再往外推

Google 釋出 Android 17 與 Wear OS 7,帶來新的多工處理、家長控制與安全工具,並進一步擴展 Gemini 的 AI 功能。

Google 這週正式釋出 Android 17 與手錶系統 Wear OS 7。TechCrunch 整理的更新重點包括全新的多工處理工具、家長控制、安全功能,以及智慧手錶端的升級。但這次發布真正的主軸,還是把 Gemini 的 AI 功能更深地織進整個系統,讓 AI 助理不再只是一個 App,而是手機與手錶體驗的底層。

把 AI 塞進作業系統這一步,戰略意義很大。當 Gemini 變成 Android 預設、隨手可叫的能力,使用者「順便就用到」的門檻幾乎降到零,這正是上一條新聞裡 Gemini 月活能衝到 6.62 億的關鍵打法。對 Google 來說,掌握全球最普及的行動作業系統,等於握有一條別人沒有的 AI 分發管道,不必靠使用者主動下載就能觸及數十億裝置。

對台灣的開發者與使用者,有兩層意義。對開發者,系統級的 AI 能力意味著 App 可以直接呼叫底層的 Gemini,但也代表 Google 的平台掌控力又加深一層,做產品時要評估自己會不會被平台原生功能吃掉。對一般使用者,AI 越來越像水電一樣內建在裝置裡,方便之餘也該留意:哪些資料被送去雲端、哪些功能可以關掉,把隱私的主導權握在自己手上。

歸剛點評|把 Gemini 織進作業系統,是 Google 用「順便就用到」衝高市占的核心打法,數十億 Android 裝置就是它獨有的分發管道。開發者要小心被平台原生功能吃掉,使用者則該留意哪些資料被送上雲端。
來源:TechCrunch
政策監管

司法部出手力挺 xAI:稱 Grok 的違規燃氣渦輪關乎國安與軍事

美國司法部主張 xAI 用於 Grok 資料中心的未獲許可燃氣渦輪攸關國家、經濟與能源安全,協助 xAI 對抗 NAACP 提起的污染訴訟。

美國司法部這週跳下來替 xAI 撐腰。TechCrunch 與 Ars Technica 報導,xAI 在 Grok 資料中心使用了一批未取得許可的燃氣渦輪發電機,遭 NAACP 提起污染訴訟;司法部卻主張這些渦輪攸關「國家、經濟與能源安全」,因為五角大廈需要 xAI 持續運轉,連帶為它的環保爭議解套。

這背後是一個很實際的矛盾:訓練與運行大模型極度吃電,而電網的供給跟不上 AI 的胃口,於是業者自己架發電機補電力缺口。xAI 的做法是直接燒天然氣發電,繞過了正常的環保許可程序。當地社群以空污為由提告,本來是環境議題,現在卻被政府用「軍方需要 Grok 打仗」的國安理由壓了過去。

把它跟本週另一條新聞——五角大廈炫耀 150 萬人在用生成式 AI、用 AI 寫國會報告——擺在一起看,一條清楚的線浮現了:AI 已經被美國政府正式當成軍事與國安基礎設施,連帶讓它享有一般企業沒有的法律與環保豁免。對台灣,這提供了一個值得警惕的觀察:當 AI 被貼上「國安」標籤,環境、社區、程序正義這些原本該被檢視的成本,很容易被一句國安理由輕輕帶過。算力擴張的環境代價,不該因為掛上國安招牌就免於討論。

歸剛點評|當 AI 被貼上「軍方需要」的國安標籤,環保許可、社區空污這些成本就被一句話帶過。這條線跟五角大廈炫耀 150 萬人用 AI 是同一張臉:AI 正被當成國安基礎設施,順帶享有一般企業沒有的豁免。
來源:TechCrunch · Ars Technica
政策監管

五角大廈炫耀用 AI 寫國會報告,宣稱 150 萬人正在用生成式 AI

五角大廈誇耀已用 AI 撰寫國會要求的法定報告,並宣稱有 150 萬名人員正在使用生成式 AI 工具;MIT Technology Review 同步推出 AI 成為「軍事顧問」的專題。

五角大廈這週大方炫耀它的 AI 成績單。Ars Technica 報導,國防部表示已經用 AI 來撰寫國會要求的法定報告,並宣稱旗下有多達 150 萬名人員正在使用生成式 AI 工具。把 AI 用來生產要呈交國會的官方文件,這個用法本身就很有話題性——畢竟這類報告講求準確與問責,交給會產生幻覺的模型來寫,風險不小。

與此同時,MIT Technology Review 推出一份訂閱專題電子書,主題正是「AI 如何成為下一個軍事顧問」,集結六篇報導,講軍隊如何用 AI 模型來輔助決策。兩條新聞湊在一起,描繪出同一個趨勢:AI 正快速地從後勤文書,走向參與軍事判斷的核心位置。

這件事的隱憂在於問責與可靠性。第五期我們報過 KPMG 因為報告裡出現 AI 幻覺而被迫撤回;如果連專業審計報告都會被 AI 寫錯,那麼用 AI 生產國會法定報告、甚至輔助軍事決策,一旦出錯,後果的量級完全不同。對台灣,這條線的提醒是雙面的:AI 進政府與國防是擋不住的趨勢,但越是高風險、高問責的場景,越需要嚴格的人類審查與可追溯機制。把 AI 當成會出錯的草稿工具是合理的,把它當成不需查證的權威來源則很危險。

歸剛點評|從寫文書到輔助軍事決策,AI 正擠進高問責的核心場景。但第五期 KPMG 才因 AI 幻覺撤回報告,越是高風險的場景越需要嚴格的人類審查——把 AI 當會出錯的草稿可以,當不查證的權威很危險。
產業

Robinhood 裁員 10%,執行長刻意不把鍋甩給 AI

Robinhood 宣布裁員 10%,但執行長 Vlad Tenev 在公告中明顯避開了同業愛用的「為 AI 重組」說法。

Robinhood 這週宣布裁員 10%,但 TechCrunch 注意到一個耐人尋味的細節:執行長 Vlad Tenev 在裁員公告裡,刻意沒有跟上同業那套「為了擁抱 AI 而重組人力」的標準說詞。過去一年,無數科技公司一邊裁掉成千上萬人、一邊把原因包裝成「AI 讓我們更有效率」,Tenev 這次選擇不這麼說,反而顯得突出。

為什麼這個「沒說什麼」值得寫成一條新聞?因為它戳破了一個越來越浮濫的公關話術。把裁員歸因於 AI,聽起來像是公司站在技術前沿、主動轉型,比承認「業務沒做好、成本要砍」體面得多。但 TechCrunch 的觀察是:用 AI 當裁員藉口已經越來越行不通,員工和市場都看得出來,這套說法常常只是把經營問題塗上一層科技濾鏡。

把它跟本週另一條新聞對照很有意思——調查顯示六成美國消費者反感品牌訊息裡硬塞「AI」。無論對外行銷還是對內溝通,過度消費「AI」這個詞的反作用力正在浮現。對台灣的企業主與管理者,這是一個務實的提醒:AI 確實會改變人力結構,但拿它當所有決策的萬用藉口,短期或許好看,長期會折損信任。該為經營負責的事,還是得誠實地講清楚。

歸剛點評|用 AI 當裁員藉口越來越行不通,員工和市場都看得穿這層科技濾鏡。搭配同週「六成消費者反感品牌談 AI」一起看,過度消費 AI 這個詞的反作用力正在浮現——該誠實負責的事,別拿 AI 來塗脂抹粉。
來源:TechCrunch
社群熱議

調查:六成美國消費者看到品牌講「AI」就反感

WordPress VIP 最新調查顯示,六成美國消費者對品牌訊息裡的「AI」字眼感到反感,即使企業越來越重視 AI 搜尋帶來的流量。

AI 行銷的反作用力浮上檯面。TechCrunch 報導,WordPress VIP 的最新調查發現,高達六成的美國消費者表示,品牌訊息裡出現「AI」這個字反而讓他們倒胃口。諷刺的是,企業端正好相反——越來越多公司把 AI 搜尋當成重要的流量來源,拼命在內容裡塞 AI 關鍵字,想被 AI 推薦給使用者。

這個落差揭示了一個有趣的錯位。對企業來說,「AI」是技術領先、值得宣傳的賣點;但對被疲勞轟炸的消費者來說,滿天飛的「AI 驅動」「AI 賦能」早已變成空洞的行銷噪音,甚至讓人懷疑產品本身是不是不夠好,才要靠時髦詞撐場面。消費者要的是產品好不好用,而非它掛了多少個 AI 標籤。

把它跟本週 Robinhood 那條對照,主題完全一致:無論對外賣產品還是對內解釋裁員,過度消費「AI」這個詞都開始招來反感。對台灣的品牌與行銷團隊,這是一個及時的提醒——與其把「AI」當成萬用形容詞貼滿文案,不如老實講清楚產品到底解決了什麼問題、帶來什麼具體好處。消費者已經對術語免疫,真正打動人的還是看得到、摸得到的價值。

歸剛點評|企業猛塞 AI 關鍵字想討好演算法,消費者卻已經對術語免疫、看到就倒胃口。這跟 Robinhood 那條是同一個主題:過度消費 AI 反招反感。行銷團隊與其貼滿 AI 標籤,不如老實講產品到底解決了什麼問題。
來源:TechCrunch
研究突破

Ling 與 Ring 2.6 技術報告:兆級參數的即時 agentic 智慧

一份技術報告介紹 Ling 與 Ring 2.6 模型,主打在兆級參數規模下同時做到低延遲回應與強推理能力的高效 agentic 智慧。

Hugging Face 上一份新發表的技術報告介紹了 Ling 與 Ring 2.6 系列模型,主打一個業界長期難解的平衡:在兆級參數(trillion-parameter)的龐大規模下,同時做到低延遲的即時回應與強大的推理能力。簡單說,就是又要模型夠大夠聰明、又要它反應夠快,這兩件事通常是互相拉扯的。

為什麼這個平衡難達成?模型越大、推理能力越強,跑一次的運算量也越重,回應自然越慢;但 agentic(代理式)應用——也就是讓 AI 自己拆解任務、一步步執行——對延遲特別敏感,因為一個任務裡要連續呼叫模型好幾十次,每次慢一點,整體就拖垮。Ling 與 Ring 2.6 的技術重點,就是用更高效的架構讓兆級模型在保持推理力的同時還能即時回應,讓它真正適合拿來跑代理任務。

把它放進本週脈絡看,正好補上一塊。SpaceX 花 600 億買 Cursor、Anthropic 暫停 Agent SDK 計費,整週都圍著「agentic AI」這個主軸打轉,而 agentic 應用能不能跑得順、跑得便宜,底層就取決於這類兼顧速度與推理的模型。對台灣的技術團隊,這提醒你關注模型選型時除了看能力,更要看「在代理任務的高頻呼叫下,延遲與成本撐不撐得住」——這往往才是產品能不能上線的真正關卡。

歸剛點評|agentic 應用對延遲極度敏感,一個任務要連呼叫模型幾十次。兆級模型能否兼顧速度與推理,是這類產品能不能上線的真正關卡。本週從 Cursor 收購到 Agent SDK 都繞著 agentic 打轉,底層拼的就是這種效率。
研究突破

Memento:靠「重建以記憶」做出角色一致的長影片生成

新論文 Memento 提出「重建以記憶」的方法,解決長影片生成中角色在不同鏡頭、視角與場景轉換間難以保持一致的老問題。

長影片生成有一個惱人的老毛病:同一個角色,跨到下一個鏡頭、換個視角或場景,長相、衣服、特徵就悄悄變了樣。Hugging Face 上的新論文 Memento 就是衝著這個問題來的,提出一套「重建以記憶」(Reconstruct to Remember)的方法,讓重複出現的主角在各種鏡頭、運動與場景切換之間維持一致。

問題的根源在於現有方法處理長時間一致性的能力有限。生成模型一幀一幀往下畫時,缺乏一個穩定的「記憶」來鎖住角色該長什麼樣,畫得越久、跳的鏡頭越多,誤差就越滾越大。Memento 的思路是透過重建機制,讓模型在生成新畫面時不斷回頭參照、校準主角的樣貌,等於替模型裝上一個短期記憶,把角色的身份特徵牢牢綁住。

別小看這個技術細節,它正是 AI 影片能不能從「炫技短片」走向「實用內容」的關鍵門檻。沒有角色一致性,AI 就只能做幾秒鐘的素材,做不了有連續劇情、有固定主角的長片。對台灣的內容創作者與影視團隊,這類研究的進展值得追蹤——一旦長影片的一致性被攻克,用 AI 做動畫、廣告、教學影片的可行性會大幅提升,成本結構也會跟著重寫。

歸剛點評|角色一致性是 AI 影片從炫技短片走向實用長片的關鍵門檻。沒有它,AI 只能做幾秒素材;攻克它,用 AI 做動畫、廣告、教學影片的成本結構就會被重寫。內容與影視團隊值得持續追蹤這條線。
社群熱議

開發者實測:Qwen3.6-27B 是很能打的本地編程模型

知名開發者 Georgi Gerganov 公開背書,表示過去一個半月幾乎每天用 Qwen3.6-27B 跑編程任務,證實它是很有能力的本地模型。

本地大模型的實力又被加了一筆有份量的背書。Simon Willison 引述知名開發者 Georgi Gerganov(llama.cpp 專案的核心人物)的說法:他百分之百可以證實,Qwen3.6-27B 是一個非常能打的本地編程模型,過去一個半月他幾乎天天拿它來寫程式。出自這位專門讓大模型能在個人裝置上跑的開發者之口,這個評價特別有說服力。

重點在於「本地」兩個字。Qwen3.6-27B 是 270 億參數規模的開源模型,能直接跑在開發者自己的機器上,不必把程式碼送上雲端、不必呼叫付費 API、也不會因為哪天供應商斷線或漲價就停擺。對重視隱私或想控制成本的開發者來說,一個能在本地穩定跑編程任務的開源模型,省下的錢只是其次,真正的價值在於「不被別人掐脖子」的自主權。

把它放進本週脈絡剛好是個有趣的對照。一邊是 SpaceX 花 600 億買 Cursor、Anthropic 為 Agent SDK 計費喊停,雲端閉源陣營在資本與政策的漩渦裡翻騰;另一邊,開源本地模型悄悄地越來越好用,給了開發者一條「自己掌握全部」的退路。對台灣的工程師,這是一個實在的提醒:在評估 AI 編程工具時,別只盯著最貴最強的雲端方案,本地開源模型如今已經成熟到能扛日常工作,把它納入選項能大幅降低對單一供應商的依賴。

歸剛點評|本地開源模型已經成熟到能扛日常編程,給了開發者一條「不被別人掐脖子」的退路。當雲端陣營在資本與政策漩渦裡翻騰,把本地開源模型納入選項,是降低單一供應商依賴最實在的一步。
社群熱議

南韓全民瘋 AI 連刷臉過海關,與首位腦機介面重度使用者

MIT Technology Review 的 The Download 聚焦南韓對 AI 的全民狂熱,從刷臉通關到日常深度依賴,同時報導一位漸凍症患者成為首位腦機介面重度使用者。

MIT Technology Review 的每日電子報 The Download 這期挑了兩個很有畫面的故事。一是南韓對 AI 的全民級狂熱:從刷臉通關海關,到把 AI 嵌進日常生活的各個角落,這個國家對 AI 的擁抱程度走在世界前列。二是一位漸凍症(ALS)患者,成為腦機介面(BCI)的首位重度使用者,靠植入裝置與外界溝通、操作裝置。

南韓的案例值得台灣參考,因為兩地在人口結構與科技採用上有不少相似之處。當一個社會把 AI 與生物辨識做到「刷臉就能過關」的普及程度,便利性確實驚人,但隱私與監控的界線也被一併往前推。全民習慣用臉、用 AI 處理一切的同時,個資集中、辨識資料外洩的風險也隨之放大,這是任何想跟進的社會都得同步面對的代價。

腦機介面那條線則指向更長遠的未來。對漸凍症這類失去行動與表達能力的患者,BCI 是把「想法直接變成行動」的革命性突破,意義無可取代。但「首位重度使用者」也意味著我們正踏進一個全新領域,從醫療倫理、資料安全到長期影響都還在摸索。對台灣,這兩個故事合起來是一面鏡子:AI 與人體、與日常的融合正在加速,享受便利的同時,社會該如何在隱私、倫理與監控之間畫線,是現在就該開始討論的功課。

歸剛點評|南韓刷臉過關的全民 AI 狂熱,是便利與監控界線被往前推的活案例,跟台灣人口與科技採用相似,值得當鏡子。BCI 重度使用者則提醒:AI 與人體的融合在加速,隱私與倫理的線該現在就開始畫。
產品

蘋果 2027 傳聞:帶鏡頭的 AirPods 為 AI 而生,第二款折疊 iPhone 在路上

彭博記者 Mark Gurman 爆料更多蘋果 2027 產品細節,包括為 AI 設計、配備鏡頭的 AirPods,以及第二款折疊 iPhone。

WWDC 剛落幕,彭博知名爆料記者 Mark Gurman 又端出更多蘋果未來產品的細節。The Verge 整理的重點裡,最吸睛的是兩件:一款配備鏡頭的 AirPods,且明確是「為 AI 而生」;以及蘋果的第二款折疊 iPhone。這些被指向 2027 年的產品,透露出蘋果接下來幾年的硬體佈局方向。

帶鏡頭的 AirPods 這個構想,方向很清楚是衝著 AI 來的。當耳機裝上鏡頭,AI 助理就能「看見」使用者眼前的世界——你看到什麼、它就能理解什麼,進而提供情境化的協助。這跟業界一窩蜂往智慧眼鏡、可穿戴 AI 裝置鑽的方向一致(本週 Qualcomm 才剛發表為智慧眼鏡設計的新晶片),等於是把 AI 的感知能力從手機螢幕,延伸到貼著身體、隨時在線的穿戴裝置上。

不過要提醒,這些終究是 2027 年的傳聞,蘋果的習慣是「能不能做好再說」。第五期我們報過 iOS 27 把 AI 修圖塞進相機時「刻意保守」,蘋果在 AI 上向來走穩健路線,不急著追風口。對台灣的消費者與供應鏈,這類爆料的價值在於看趨勢而非追日期:穿戴式 AI、折疊裝置是明確的方向,但真正落地的時間與規格,還是要等蘋果自己拍板。把它當成產業風向參考,別當成購物清單。

歸剛點評|帶鏡頭的 AirPods 等於把 AI 的感知從螢幕延伸到貼身穿戴裝置,方向跟本週 Qualcomm 的智慧眼鏡晶片一致。但這是 2027 年傳聞,蘋果向來走穩健路線,看趨勢就好,別當購物清單。
來源:The Verge
產業資金

Probably 募得 900 萬美元,要打造更可靠、少幻覺的 AI

新創 Probably 募得 900 萬美元,目標是阻止幻覺與事實錯誤傳到使用者面前,讓 AI 的準確度能向確定性系統看齊。

一家名為 Probably 的新創這週宣布募得 900 萬美元。TechCrunch 報導,它要解的問題是當下大模型最致命的軟肋——幻覺與事實錯誤。Probably 的目標是攔在使用者前面,不讓這些錯誤直接傳到終端用戶眼前,讓 AI 的準確度能向「確定性系統」(也就是會給出穩定、可驗證答案的傳統軟體)看齊。

為什麼有人願意砸錢解這題?因為幻覺正是阻擋大模型進入高風險場景的最大門檻。聊天閒談時答錯無傷大雅,但醫療、金融、法律、工程這些領域,一個編造的數字或事實就可能釀成大禍。誰能在不犧牲大模型靈活性的前提下,把可靠度拉到企業敢放心用的水準,誰就握有一個巨大的市場。Probably 押的正是這個缺口。

把它跟本週其他新聞串起來看,需求面再清楚不過。同一週,五角大廈用 AI 寫國會報告、Copilot 被挖出能洩漏驗證碼的漏洞、第五期 KPMG 還因 AI 幻覺撤回報告——這些全在喊同一件事:模型夠聰明了,但「夠可靠」還差得遠。對台灣的創業者與技術團隊,這是一個值得記下的方向:在通用大模型之上,做「可靠性」「事實查核」「防幻覺」這層中介,是一個被真實痛點撐起來、而且還很空的賽道。

歸剛點評|幻覺是擋住大模型進入醫療、金融、法律的最大門檻。在通用模型之上做「可靠性、防幻覺」這層中介,是被真實痛點撐起、而且還很空的賽道。本週從五角大廈到 KPMG 都在喊同一件事:夠聰明了,但還不夠可靠。
來源:TechCrunch

今日快訊