歸剛誒AI 第22期｜2026-07-01：Anthropic 推出 Claude Sonnet 5：逼近 Opus 4.8 的水準，價格卻砍一截

第 22 期2026-07-01（台北時間）

七月開場，前沿大廠火力全開。Anthropic 同日端出 Claude Sonnet 5 與旗艦級新產品 Claude Science，宣告 AI 競爭從『拚跑分』轉向『拚工作流』；Google 用 Nano Banana 2 Lite 把生圖推進幾秒一張的生產線時代；OpenAI 則用 GeneBench-Pro 在科學評測卡位。另一條暗線同時浮現——AI 瀏覽器被『2+2=5』哄騙、agent 互相轉帳、agent 上手機，當 AI 從回答問題升級到自己動手做事，安全把關的份量只會越來越重。

模型

Anthropic 推出 Claude Sonnet 5：逼近 Opus 4.8 的水準，價格卻砍一截

在

月

日

早

上

丟

出

，

官

方

一

句

話

總

結

整

個

產

品

定

位

：

表

現

接

近

自

家

旗

艦

，

但

跑

起

來

便

宜

得

多

。

三

個

主

打

場

景

是

寫

程

式

、

跑

、

處

理

專

業

工

作

，

賣

點

直

接

對

著

「

要

大

量

呼

叫

模

型

、

又

付

不

起

旗

艦

價

」

的

開

發

者

。

把

它

定

調

為

比

、

更

划

算

的

選

項

，

等

於

親

手

在

自

家

產

品

線

中

間

補

了

一

刀

價

格

帶

。

開

發

者

第

一

時

間

先

翻

「

」

開

發

文

件

、

而

非

官

方

公

告

，

因

為

那

裡

的

資

訊

比

較

能

拿

來

動

手

做

。

他

注

意

到

系

統

卡

有

一

段

值

得

玩

味

：

在

資

安

攻

擊

類

任

務

上

的

能

力

明

顯

低

於

更

高

階

的

型

號

。

這

條

刻

意

的

弱

化

算

不

上

缺

陷

，

比

較

像

發

布

前

的

精

算

—

美

國

政

府

近

期

對

前

沿

模

型

的

網

路

攻

擊

能

力

盯

得

很

緊

，

把

這

條

能

力

壓

低

，

模

型

才

放

得

出

來

、

不

會

卡

在

審

查

關

。

換

句

話

說

，

這

版

的

「

弱

」

是

設

計

過

的

。

把

寫

程

式

與

的

實

用

能

力

拉

滿

，

同

時

刻

意

削

掉

容

易

踩

政

府

紅

線

的

攻

擊

面

，

用

一

個

能

過

審

、

又

夠

便

宜

的

組

合

去

搶

市

佔

。

對

台

灣

的

工

程

團

隊

來

說

，

這

代

表

你

接

下

來

選

時

多

了

一

個

性

價

比

很

高

的

中

階

選

項

；

但

也

要

記

得

，

便

宜

的

代

價

之

一

是

某

些

能

力

被

刻

意

關

掉

，

不

是

它

做

不

到

，

是

廠

商

不

讓

它

做

。

歸剛點評｜Sonnet 5 把「接近旗艦、價格腰斬」變成可量產的中階武器，直接壓 GPT-5.5 與 Gemini Pro 的成本帶。對天天燒 token 的台灣團隊，這是少數能無痛換上去省錢的版本；但系統卡那段刻意削弱攻擊力，提醒你模型能力越來越受政府監管牽動。

來源：Anthropic　·　TechCrunch　·　Simon Willison

產品

Claude Science 上線：Anthropic 把 Claude Code 那套搬給科學家

Anthropic 發表 Claude Science，一個給科學家用的工作台，整合研究常用的工具與套件，能像 Claude Code 一樣依高階指令自主跑運算研究，省去在資料庫、管線、工具間切換。

在

一

場

面

向

藥

廠

高

管

、

生

技

創

辦

人

與

研

究

者

的

活

動

上

，

發

表

了

。

定

位

很

清

楚

：

它

要

對

科

學

研

究

做

的

事

，

就

是

對

軟

體

工

程

做

的

事

。

給

它

一

句

簡

短

的

高

階

指

令

，

它

能

自

主

執

行

有

意

義

的

運

算

工

作

，

並

接

上

研

究

者

最

常

用

的

工

具

與

套

件

。

直

接

稱

它

是

最

新

的

旗

艦

產

品

。

值

得

注

意

的

是

，

這

次

的

賭

注

押

在

工

作

流

，

又

一

個

新

模

型

反

而

不

是

重

點

。

點

出

，

的

價

值

在

於

把

科

學

家

從

「

在

資

料

庫

、

分

析

管

線

、

各

種

工

具

之

間

來

回

跳

」

的

瑣

碎

裡

解

放

出

來

，

給

他

們

一

個

統

一

的

環

境

做

計

算

型

研

究

。

一

個

生

物

資

訊

學

家

平

常

可

能

要

同

時

開

十

幾

個

視

窗

、

手

動

接

資

料

格

式

，

想

做

的

是

把

這

條

長

鏈

收

進

一

個

可

對

話

的

工

作

台

。

這

步

棋

的

商

業

邏

輯

也

很

明

白

。

前

沿

模

型

彼

此

的

純

能

力

差

距

正

在

縮

小

，

光

靠

跑

分

已

經

拉

不

開

差

距

，

真

正

的

護

城

河

是

「

把

模

型

嵌

進

某

個

專

業

領

域

的

真

實

工

作

流

裡

」

。

先

用

在

工

程

師

圈

站

穩

，

現

在

把

同

一

套

打

法

複

製

到

生

技

與

製

藥

這

種

高

客

單

、

高

黏

著

的

領

域

。

對

台

灣

的

學

研

與

生

技

團

隊

，

這

是

一

個

訊

號

：

下

一

波

競

爭

的

戰

場

，

從

『

誰

的

模

型

強

』

移

到

『

誰

把

工

作

流

做

得

深

』

。

歸剛點評｜Anthropic 沒發新模型卻發旗艦產品，等於宣告純跑分時代的紅利見頂，護城河改挖在垂直工作流。Claude Code 打工程師、Claude Science 打生技製藥，都是高客單高黏著的肥肉；台灣學研圈值得早點摸它的深度，別等到對手都接上了才動。

來源：Anthropic　·　MIT Technology Review　·　TechCrunch

模型

Google 出 Nano Banana 2 Lite 與 Gemini Omni Flash：幾秒出圖、便宜到誇張

Google 發表更快更便宜的影像模型 Nano Banana 2 Lite，出一張圖只要幾秒；同場還有 Gemini Omni Flash。畫質沒旗艦好看，但勝在速度與成本，鎖定要量產 AI 內容的創作者。

在

部

落

格

一

口

氣

丟

出

兩

個

新

東

西

：

影

像

模

型

，

和

。

重

點

全

押

在

「

快

」

與

「

便

宜

」

。

實

測

後

的

形

容

很

直

白

—

畫

質

可

能

沒

那

麼

好

看

，

但

出

一

張

圖

只

要

幾

秒

鐘

。

也

把

它

定

位

成

給

創

作

者

量

產

內

容

用

的

工

具

。

這

裡

的

取

捨

很

清

楚

。

完

整

版

的

追

求

單

張

的

最

高

品

質

，

版

則

反

過

來

—

犧

牲

一

部

分

細

緻

度

，

換

來

幾

乎

即

時

的

生

成

速

度

與

更

低

的

單

張

成

本

。

對

需

要

一

次

生

成

上

百

張

縮

圖

、

社

群

配

圖

、

廣

告

素

材

變

體

的

人

，

這

個

交

換

非

常

划

算

，

因

為

這

類

用

途

本

來

就

不

需

要

每

張

都

是

藝

術

品

，

要

的

是

夠

用

、

量

大

、

又

快

。

把

這

條

新

聞

放

回

產

業

脈

絡

看

，

影

像

生

成

正

在

快

速

分

層

：

一

邊

是

追

求

極

致

畫

質

的

旗

艦

，

一

邊

是

追

求

速

度

與

成

本

的

輕

量

版

，

各

自

服

務

不

同

需

求

。

本

站

自

家

每

天

張

配

圖

也

走

本

機

生

圖

、

約

到

分

鐘

的

路

線

，

正

好

說

明

一

件

事

—

當

生

圖

變

成

日

常

生

產

線

的

一

環

，

速

度

與

成

本

的

重

要

性

常

會

壓

過

『

最

漂

亮

』

。

這

次

等

於

把

這

個

趨

勢

做

成

了

官

方

產

品

。

歸剛點評｜影像生成正式分層：旗艦拚畫質、Lite 版拚速度成本。對天天要量產社群圖、廣告變體的台灣小編與行銷，幾秒一張、單價極低的工具比『最美』更實用。Google 把這個取捨直接做成產品線，等於宣告生圖進入生產線時代。

來源：Google DeepMind　·　TechCrunch　·　Ars Technica

研究

OpenAI 推 GeneBench-Pro：用真實基因體資料考 AI 的科學底子

OpenAI 發表 GeneBench-Pro，一套用複雜真實資料測 AI 在基因體、生物學與科學研究表現的評測，並附案例研究，想看模型在硬科學上到底有幾兩重。

推

出

，

一

套

新

的

評

測

基

準

，

專

門

測

在

基

因

體

學

、

生

物

學

與

科

學

研

究

上

的

表

現

。

和

很

多

用

人

造

題

目

的

評

測

不

同

，

它

強

調

用

複

雜

的

真

實

世

界

資

料

集

來

考

模

型

，

還

另

外

放

了

一

份

案

例

研

究

，

把

模

型

實

際

解

題

的

過

程

攤

開

來

看

。

這

個

方

向

和

前

一

條

撞

在

同

一

個

風

口

上

，

不

是

巧

合

。

當

各

家

都

把

矛

頭

對

準

科

學

研

究

這

塊

市

場

時

，

第

一

個

要

解

決

的

問

題

就

是

『

怎

麼

證

明

在

硬

科

學

上

真

的

有

用

』

。

跑

分

平

台

這

時

就

變

成

兵

家

必

爭

之

地

—

誰

定

義

了

被

廣

泛

採

用

的

評

測

標

準

，

誰

就

握

有

話

語

權

，

能

用

對

自

己

有

利

的

題

型

去

框

定

『

什

麼

叫

強

』

。

自

己

出

題

、

自

己

附

案

例

，

背

後

有

這

層

卡

位

的

算

計

。

對

實

際

做

研

究

的

人

來

說

，

這

類

評

測

值

得

用

但

別

盡

信

。

真

實

基

因

體

資

料

確

實

比

玩

具

題

更

接

近

日

常

，

但

一

個

由

模

型

廠

商

自

己

設

計

、

自

己

公

布

成

績

的

基

準

，

天

生

就

有

選

擇

性

呈

現

的

空

間

。

比

較

務

實

的

看

法

是

把

當

成

一

個

參

考

座

標

，

搭

配

、

等

其

他

陣

營

的

評

測

交

叉

看

，

而

不

是

單

看

一

家

的

榜

單

就

下

結

論

。

進

科

學

的

競

賽

才

剛

開

打

，

評

測

標

準

本

身

就

是

這

場

仗

的

一

部

分

。

歸剛點評｜當 Anthropic、OpenAI 同週都撲向科學研究市場，評測標準成了卡位戰場——誰定義『什麼叫強』，誰就握話語權。GeneBench-Pro 用真實基因體資料是進步，但廠商自己出題自己評分，台灣研究者該交叉看多家榜單，別被單一基準帶風向。

來源：OpenAI　·　OpenAI 案例研究

晶片

Nvidia 挑戰者 Etched 估值衝上 50 億美元，推論晶片已簽 10 億訂單

主打推論的 AI 晶片新創 Etched 估值達 50 億美元，並表示其晶片驅動的推論系統已簽下 10 億美元合約。專攻推論這個被 Nvidia 相對忽略的環節，搶分一塊正在膨脹的大餅。

晶

片

新

創

估

值

來

到

億

美

元

，

而

且

不

是

純

靠

故

事

撐

—

公

司

說

，

由

其

晶

片

驅

動

的

推

論

系

統

已

經

有

億

美

元

的

合

約

在

手

。

在

這

個

動

輒

喊

願

景

的

賽

道

，

能

拿

出

實

際

簽

約

金

額

是

相

對

硬

的

證

據

。

的

打

法

是

專

攻

『

推

論

』

這

一

段

。

訓

練

模

型

需

要

的

是

最

頂

的

，

但

模

型

訓

練

好

之

後

、

每

天

被

使

用

者

一

次

呼

叫

的

『

推

論

』

，

才

是

長

期

最

大

、

最

持

續

的

算

力

支

出

。

的

通

用

什

麼

都

能

做

，

賭

的

是

用

為

推

論

量

身

打

造

的

專

用

晶

片

，

在

這

個

特

定

場

景

做

到

更

高

的

性

價

比

。

當

全

世

界

的

應

用

都

從

『

訓

練

期

』

走

向

『

天

被

用

的

服

務

期

』

，

推

論

需

求

會

像

滾

雪

球

一

樣

放

大

。

這

也

是

整

個

產

業

正

在

發

生

的

事

：

一

家

獨

大

的

局

面

，

正

被

一

群

專

攻

細

分

場

景

的

對

手

從

邊

緣

啃

食

。

之

外

還

有

、

等

各

走

各

路

。

它

們

短

期

內

都

撼

動

不

了

的

霸

主

地

位

，

但

只

要

服

務

的

使

用

量

持

續

暴

衝

，

推

論

市

場

大

到

連

專

用

晶

片

廠

都

能

分

到

億

訂

單

，

這

個

結

構

就

回

不

去

了

。

對

關

注

半

導

體

的

台

灣

讀

者

，

這

是

供

應

鏈

下

一

個

值

得

盯

的

變

數

。

歸剛點評｜訓練要 Nvidia 頂規 GPU，但模型上線後天天被呼叫的『推論』才是長期最大算力錢坑。Etched 用專用晶片切這塊，10 億簽約是硬證據。對台灣半導體供應鏈，推論專用晶片崛起是 Nvidia 一家獨大鬆動的早期訊號，值得追。

來源：TechCrunch

產業

OpenAI 公布 ChatGPT 採用數據：用得更多、玩得更廣、全球擴張

OpenAI 釋出 Signals 數據，顯示 ChatGPT 全球採用持續成長：使用者用得更頻繁、探索更多功能，並在不同地區與語言帶動成長。

公

布

了

一

批

名

為

的

內

部

數

據

，

描

繪

的

全

球

採

用

樣

貌

。

三

個

重

點

趨

勢

：

使

用

者

用

得

更

頻

繁

、

願

意

探

索

更

多

功

能

、

而

且

成

長

動

能

跨

越

不

同

地

區

與

語

言

往

外

擴

散

。

簡

單

說

，

的

成

長

有

兩

層

：

用

戶

數

變

多

，

加

上

既

有

用

戶

把

它

用

得

更

深

、

新

市

場

也

持

續

上

車

。

『

用

得

更

深

』

這

件

事

比

『

用

戶

數

成

長

』

更

值

得

注

意

。

一

個

產

品

如

果

只

是

註

冊

數

漂

亮

，

但

大

家

用

一

兩

次

就

丟

，

那

是

泡

沫

；

但

若

使

用

者

從

只

會

問

題

，

慢

開

始

用

更

多

進

階

功

能

、

把

它

接

進

日

常

工

作

流

，

那

代

表

黏

著

度

在

往

下

扎

根

。

特

別

強

調

功

能

探

索

的

擴

大

，

等

於

在

說

正

在

從

『

嘗

鮮

玩

具

』

變

成

『

工

作

必

需

品

』

。

跨

語

言

、

跨

地

區

的

成

長

則

牽

動

另

一

條

線

。

早

期

生

成

式

的

紅

利

集

中

在

英

語

世

界

，

現

在

成

長

往

非

英

語

市

場

擴

散

，

意

味

著

本

地

化

內

容

、

在

地

語

料

、

在

地

法

遵

的

需

求

會

跟

著

放

大

。

對

華

語

圈

的

產

品

與

內

容

業

者

，

這

既

是

壓

力

也

是

機

會

—

壓

力

在

於

全

球

巨

頭

的

觸

角

伸

進

你

的

語

言

市

場

，

機

會

在

於

懂

在

地

、

貼

近

本

地

使

用

情

境

的

服

務

，

仍

是

巨

頭

一

時

補

不

齊

的

縫

。

歸剛點評｜用戶數成長是表象，『既有用戶用得更深、接進工作流』才是黏著度扎根的真訊號，代表 ChatGPT 從玩具變必需品。跨語言擴張則直接打進華語市場——對台灣產品業者，這是巨頭壓境與在地化機會同時到來的雙面刃。

來源：OpenAI

資安

新攻擊再添一筆：跟 AI 說『2+2=5』就能讓它照禁令辦事

資安研究揭露針對 AI 瀏覽器的新攻擊：只要先讓模型接受一個明顯錯誤的前提（如 2+2=5），就能把它誘進一個守則失效的『夢境』，進而執行原本被禁止的指令。

報

導

了

一

個

針

對

瀏

覽

器

的

新

攻

擊

手

法

，

原

理

簡

單

到

讓

人

發

毛

：

只

要

先

告

訴

大

型

語

言

模

型

一

個

明

顯

錯

誤

的

前

提

，

比

方

說

『

』

，

並

讓

它

接

受

，

就

能

把

模

型

一

步

拐

進

一

個

『

守

則

不

再

適

用

』

的

虛

構

情

境

，

接

著

它

就

會

乖

執

行

原

本

該

被

擋

下

來

的

禁

止

指

令

。

研

究

者

形

容

這

像

是

把

哄

進

一

個

夢

境

，

在

夢

裡

護

欄

全

部

失

效

。

為

什

麼

這

招

有

效

，

要

從

瀏

覽

器

的

本

質

說

起

。

這

類

產

品

會

替

你

讀

網

頁

、

自

動

點

按

、

填

表

單

、

甚

至

代

你

操

作

帳

號

，

等

於

把

瀏

覽

器

的

控

制

權

交

給

一

個

會

被

文

字

內

容

牽

著

走

的

模

型

。

攻

擊

者

只

要

在

網

頁

裡

埋

進

精

心

設

計

的

文

字

，

就

能

在

你

毫

不

知

情

的

情

況

下

，

改

寫

模

型

對

『

現

在

情

境

是

什

麼

、

什

麼

能

做

什

麼

不

能

做

』

的

判

斷

。

問

題

的

根

源

是

『

模

型

會

無

條

件

接

受

被

餵

進

來

的

前

提

』

這

個

根

本

特

性

，

跟

某

個

無

關

。

資

安

圈

一

再

對

瀏

覽

器

搖

頭

，

道

理

就

在

這

裡

。

一

般

網

頁

攻

擊

頂

多

偷

資

料

，

但

一

個

被

接

管

的

可

以

用

你

的

身

分

主

動

做

事

—

轉

帳

、

發

訊

、

改

設

定

。

對

台

灣

使

用

者

的

務

實

建

議

是

：

先

別

把

高

權

限

的

帳

號

（

網

銀

、

公

司

後

台

、

主

要

信

箱

）

交

給

會

自

動

操

作

的

瀏

覽

器

；

要

嘗

鮮

，

就

用

一

個

權

限

受

限

、

沒

綁

重

要

資

產

的

環

境

。

便

利

和

風

險

在

這

類

工

具

上

是

綁

在

一

起

賣

的

。

歸剛點評｜AI 瀏覽器把點按轉帳的控制權交給會被文字牽著走的模型，攻擊者埋一句『2+2=5』就能讓護欄失效、用你的身分辦事。問題出在模型會無條件接受餵進來的前提這個根本特性，跟單一 bug 無關。台灣使用者務實做法：別把網銀、公司後台交給會自動操作的 AI 瀏覽器。

來源：Ars Technica

產業

Amazon 砸 10 億設 FDE 組織，跟著 OpenAI、Anthropic 派工程師駐點客戶

Amazon 成立投入 10 億美元的「前線部署工程師」（FDE）組織，工程師將進駐企業內部，部署量身打造的 agent，主打快速上線與讓客戶能自立運作。

宣

布

成

立

一

個

投

入

億

美

元

的

新

組

織

，

做

的

是

『

前

線

部

署

工

程

師

』

（

，

）

的

活

。

這

個

團

隊

的

工

程

師

會

直

接

進

駐

到

客

戶

企

業

內

部

，

替

對

方

部

署

量

身

打

造

的

，

目

標

放

在

兩

件

事

：

上

線

要

快

，

以

及

讓

客

戶

最

終

能

自

己

運

作

、

不

必

一

直

依

賴

外

部

。

值

得

注

意

的

是

，

這

是

跟

在

與

之

後

—

兩

家

先

前

都

已

經

組

了

類

似

的

駐

點

工

程

隊

伍

。

這

個

模

式

其

實

是

從

資

料

分

析

公

司

發

揚

光

大

的

：

與

其

賣

你

一

套

軟

體

自

己

摸

索

，

它

派

人

坐

進

你

的

辦

公

室

，

把

工

具

硬

接

進

你

的

真

實

業

務

裡

。

對

來

說

這

特

別

關

鍵

，

因

為

一

個

通

用

模

型

擺

在

那

裡

，

多

數

企

業

根

本

不

知

道

怎

麼

把

它

變

成

有

用

的

東

西

。

真

正

能

收

錢

、

收

大

錢

的

，

是

『

有

人

來

幫

我

把

它

接

好

、

跑

起

來

、

解

決

我

這

個

產

業

的

具

體

問

題

』

。

三

家

巨

頭

同

時

押

這

條

路

，

透

露

出

一

個

產

業

共

識

：

模

型

本

身

越

來

越

像

水

電

，

差

異

化

拉

不

開

，

真

正

的

營

收

與

護

城

河

在

『

落

地

服

務

』

。

賣

是

低

毛

利

的

薄

利

多

銷

，

派

工

程

師

駐

點

做

客

製

整

合

才

是

高

客

單

、

高

黏

著

的

肥

肉

。

對

台

灣

的

系

統

整

合

商

與

顧

問

業

，

這

既

是

警

訊

也

是

機

會

—

警

訊

是

巨

頭

親

自

下

海

搶

這

塊

，

機

會

是

台

灣

本

地

企

業

更

吃

在

地

團

隊

的

貼

身

服

務

，

這

是

遠

端

巨

頭

難

完

全

取

代

的

。

歸剛點評｜三巨頭同押 FDE 駐點模式，等於承認模型本身淪為水電、差異化在落地服務。賣 API 薄利、派人客製整合才是高客單肥肉。對台灣 SI 與 AI 顧問業是雙面刃：巨頭親自下海搶單，但本地企業更吃在地貼身服務這道縫。

來源：TechCrunch

工具

X 推出官方 MCP server，讓 AI 工具更好接它的平台

X 上線一個託管的 MCP server，讓開發者更容易把 AI 應用接上 X 的 API。MCP 正快速變成 AI 工具與外部服務之間的通用接頭。

（

前

身

）

推

出

了

一

個

官

方

託

管

的

，

目

的

是

讓

開

發

者

更

容

易

把

應

用

串

接

到

的

。

換

句

話

說

，

以

後

想

做

一

個

會

自

動

讀

、

發

、

分

析

上

討

論

的

工

具

，

接

線

會

比

以

前

簡

單

得

多

。

（

）

這

個

由

提

出

的

開

放

協

議

，

正

在

以

驚

人

的

速

度

變

成

世

界

的

『

通

用

接

頭

』

。

它

的

角

色

有

點

像

—

在

它

出

現

以

前

，

每

個

工

具

要

接

每

個

外

部

服

務

都

得

各

寫

各

的

串

接

，

雜

亂

又

重

複

；

想

做

的

是

定

一

個

標

準

規

格

，

讓

任

何

模

型

、

任

何

工

具

都

能

用

同

一

套

方

式

去

接

資

料

庫

、

與

各

種

服

務

。

本

站

近

期

已

經

連

續

報

導

多

起

相

關

動

態

，

這

次

連

這

種

大

平

台

都

親

自

下

場

提

供

官

方

，

說

明

這

個

標

準

正

在

從

開

發

者

圈

的

共

識

，

變

成

平

台

方

主

動

擁

抱

的

事

實

標

準

。

對

開

發

者

，

這

是

好

消

息

—

少

寫

一

堆

膠

水

程

式

碼

。

但

平

台

主

動

開

也

有

它

的

算

計

：

當

大

家

的

都

習

慣

透

過

你

的

官

方

接

頭

來

存

取

你

的

服

務

，

你

就

把

自

己

卡

在

了

工

作

流

的

關

鍵

節

點

上

，

順

便

掌

握

了

誰

在

用

、

怎

麼

用

的

數

據

。

便

利

從

來

不

是

免

費

的

，

平

台

願

意

鋪

路

，

是

因

為

這

條

路

最

後

通

往

它

自

己

。

歸剛點評｜MCP 正從開發者共識變成平台主動擁抱的事實標準，連 X 都親自開官方接頭。對開發者是少寫膠水碼的好消息；但平台鋪路有算計——讓所有 agent 都從你的接頭進來，就把自己卡進 AI 工作流的關鍵節點。台灣開發者值得趁早熟悉 MCP 生態。

來源：TechCrunch

人物

做撲克 AI 的 DeepMind 三人組，現在替量化對沖基金賺錢

三位前 DeepMind 研究者創辦、總部在布拉格的 AI 實驗室 EquiLibre Technologies 估值已超過 5 億美元，把當年打撲克 AI 的技術轉用到量化金融。

三

位

前

研

究

者

創

辦

的

實

驗

室

，

估

值

已

經

超

過

億

美

元

。

這

家

公

司

總

部

設

在

布

拉

格

，

三

位

創

辦

人

的

來

歷

是

當

年

打

造

撲

克

的

同

一

批

人

，

現

在

他

們

把

這

套

本

事

拿

去

替

量

化

對

沖

基

金

賺

錢

。

從

撲

克

跳

到

金

融

，

看

起

來

跨

界

，

技

術

上

其

實

一

脈

相

承

。

撲

克

和

很

多

棋

類

遊

戲

最

大

的

不

同

在

於

『

不

完

全

資

訊

』

—

你

看

不

到

對

手

的

牌

，

必

須

在

資

訊

缺

失

、

對

手

會

騙

你

的

情

況

下

做

最

優

決

策

。

金

融

市

場

恰

是

同

一

類

問

題

：

你

不

知

道

別

人

手

上

有

什

麼

、

下

一

步

要

幹

嘛

，

還

得

在

充

滿

雜

訊

與

對

手

博

弈

的

環

境

裡

押

注

。

當

年

為

了

在

牌

桌

上

戰

勝

人

類

而

磨

出

來

的

決

策

演

算

法

，

換

個

場

景

就

成

了

量

化

交

易

的

利

器

。

這

也

是

人

才

流

動

的

一

個

縮

影

：

頂

尖

研

究

者

從

大

廠

帶

著

看

家

本

領

出

走

，

把

原

本

為

了

研

究

或

遊

戲

開

發

的

技

術

，

導

進

金

融

這

種

錢

最

厚

的

場

域

。

對

台

灣

讀

者

的

提

醒

有

兩

層

：

一

是

在

量

化

金

融

的

滲

透

只

會

更

深

，

市

場

博

弈

正

被

越

來

越

強

的

演

算

法

接

管

；

二

是

這

種

『

學

術

突

破

→

金

融

變

現

』

的

路

徑

，

正

在

成

為

頂

尖

人

才

繞

過

大

廠

、

自

立

門

戶

的

標

準

劇

本

。

歸剛點評｜撲克和金融都是『不完全資訊下做最優決策』，技術一脈相承。三人組帶著 DeepMind 看家本領出走變現，是『學術突破→金融落袋』的標準劇本。提醒台灣讀者：量化市場正被越來越強的演算法接管，博弈門檻只會更高。

來源：TechCrunch

政策

AI 砍掉新鮮人工作？新報告打臉：高強度採用者反而增員 10%

一份新報告發現，「高強度導入 AI」的企業整體人力增加 10.2%，其中入門級職位還成長 12%，反駁了 AI 會消滅基層工作的說法，讓這場勞動辯論更加複雜。

關

於

到

底

會

不

會

搶

走

工

作

，

一

直

是

兩

派

各

說

各

話

。

最

新

一

份

報

告

又

往

這

鍋

裡

丟

了

顆

變

數

：

它

發

現

『

高

強

度

導

入

』

的

企

業

，

整

體

人

力

不

減

反

增

，

成

長

了

；

更

顛

覆

直

覺

的

是

，

這

些

公

司

的

入

門

級

職

位

還

成

長

了

。

這

直

接

打

臉

了

『

會

先

殺

死

基

層

與

新

鮮

人

工

作

』

的

流

行

說

法

。

怎

麼

解

讀

這

個

反

直

覺

的

數

字

，

要

小

心

。

一

種

說

法

是

讓

生

產

力

大

增

、

公

司

業

務

擴

張

，

於

是

反

而

需

要

更

多

人

—

把

餅

做

大

，

連

帶

連

基

層

職

缺

一

起

變

多

。

但

另

一

種

冷

靜

的

可

能

是

因

果

倒

置

：

本

來

就

在

成

長

、

本

來

就

敢

大

舉

招

人

的

公

司

，

才

更

有

餘

力

大

手

筆

導

入

，

所

以

你

看

到

的

『

增

員

』

未

必

是

造

成

的

，

而

是

『

會

成

長

的

公

司

剛

好

也

愛

用

』

。

同

一

份

數

據

，

兩

種

故

事

都

講

得

通

。

所

以

這

份

報

告

的

真

正

價

值

，

與

其

說

證

明

了

『

不

搶

工

作

』

，

不

如

說

它

提

醒

大

家

別

被

任

一

邊

的

口

號

帶

著

走

。

對

就

業

的

影

響

，

高

度

取

決

於

產

業

、

職

能

、

公

司

階

段

，

籠

統

地

說

『

一

定

毀

掉

拯

救

工

作

』

都

太

粗

糙

。

對

台

灣

的

勞

工

與

雇

主

，

比

較

實

際

的

是

看

自

己

這

個

產

業

、

這

個

職

位

，

是

當

你

的

工

具

還

是

替

代

你

—

答

案

因

人

而

異

，

不

會

有

一

個

全

體

適

用

的

標

準

答

案

。

歸剛點評｜這份報告的價值不在『證明 AI 不搶工作』，而在戳破兩派口號——數字可能只是『會成長的公司剛好也愛用 AI』的因果倒置。提醒台灣勞工雇主：AI 衝擊高度取決於你的產業職能，別被任一邊的標語綁架，看自己的位置才實際。

來源：TechCrunch

工程

OpenAI 靠大規模 core dump 分析，揪出潛藏 18 年的老 bug

OpenAI 工程團隊用大規模 core dump 分析，追查罕見的基礎設施崩潰，最後同時挖出一個硬體故障與一個埋了 18 年的軟體 bug。

的

工

程

團

隊

分

享

了

一

個

硬

派

的

除

錯

故

事

：

他

們

用

大

規

模

的

（

程

式

崩

潰

時

留

下

的

記

憶

體

快

照

）

分

析

，

去

追

查

基

礎

設

施

上

那

些

罕

見

、

難

以

重

現

的

崩

潰

，

最

後

一

口

氣

挖

出

兩

個

元

兇

—

一

個

是

硬

體

故

障

，

另

一

個

是

埋

藏

了

整

年

的

軟

體

。

這

件

事

的

工

程

意

義

，

遠

比

『

修

了

個

』

來

得

大

。

在

跑

的

超

大

規

模

叢

集

上

，

崩

潰

常

是

百

萬

分

之

一

的

機

率

才

出

現

一

次

，

你

根

本

沒

辦

法

照

著

步

驟

重

現

，

傳

統

那

套

『

跟

著

複

現

一

遍

』

完

全

失

效

。

的

做

法

是

把

這

當

成

流

行

病

學

來

做

—

不

去

追

單

一

個

案

，

而

是

蒐

集

海

量

崩

潰

快

照

，

統

計

分

析

找

出

共

通

模

式

，

像

疾

管

署

找

傳

染

源

一

樣

定

位

問

題

。

他

們

把

這

篇

文

章

取

名

為

『

流

行

病

學

』

，

正

是

這

個

意

思

。

對

工

程

人

來

說

，

這

裡

有

兩

個

值

得

帶

走

的

點

。

第

一

，

時

代

的

可

靠

度

工

程

，

越

來

越

仰

賴

在

巨

量

規

模

上

做

統

計

式

診

斷

，

而

不

是

靠

單

機

的

直

覺

。

第

二

，

一

個

埋

了

年

的

能

被

翻

出

來

，

說

明

這

類

大

規

模

分

析

方

法

的

威

力

—

它

能

照

亮

那

些

平

常

頻

率

太

低

、

根

本

沒

人

注

意

得

到

的

暗

角

。

當

你

的

系

統

大

到

一

定

程

度

，

連

最

罕

見

的

問

題

都

會

頻

繁

發

生

，

這

套

方

法

論

會

越

來

越

重

要

。

歸剛點評｜超大規模叢集上，崩潰是百萬分之一機率、無法複現，傳統 debug 失效。OpenAI 改用『流行病學』式統計診斷揪出 18 年老 bug，是 AI 時代可靠度工程的範式轉移。對台灣後端與 SRE 工程師，這套巨量規模統計除錯法值得學起來。

來源：OpenAI

產業

Wix 旗下 vibe-coding 平台 Base44 自研模型，新創開始找自己的護城河

Wix 旗下的 vibe-coding 平台 Base44 開始推出自家 AI 模型，期望最終能超越前沿模型。這反映 AI 新創在套殼之外，開始尋找自己的防禦縱深。

被

收

購

的

平

台

，

開

始

推

出

自

己

的

模

型

，

並

放

話

希

望

它

最

終

能

超

越

前

沿

模

型

。

所

謂

，

指

的

是

用

自

然

語

言

描

述

需

求

、

讓

直

接

生

出

可

運

行

軟

體

的

那

類

工

具

，

過

去

主

要

是

接

別

人

的

模

型

來

做

這

件

事

。

這

步

棋

背

後

是

新

創

共

同

的

焦

慮

：

護

城

河

在

哪

裡

。

過

去

兩

年

大

量

爆

紅

的

產

品

，

骨

子

裡

都

是

在

或

的

模

型

外

面

包

一

層

介

面

，

也

就

是

俗

稱

的

『

套

殼

』

。

套

殼

的

問

題

是

門

檻

太

低

、

太

容

易

被

複

製

，

而

且

命

脈

捏

在

模

型

供

應

商

手

上

—

對

方

一

漲

價

、

一

改

政

策

、

甚

至

自

己

下

場

做

你

的

功

能

，

你

就

被

掐

住

喉

嚨

。

自

研

模

型

，

就

是

想

把

這

條

命

脈

拿

回

自

己

手

上

。

但

自

研

也

是

條

險

路

。

從

頭

訓

練

一

個

有

競

爭

力

的

模

型

，

燒

的

錢

與

算

力

都

是

天

文

數

字

，

多

數

新

創

根

本

撐

不

起

；

而

且

就

算

做

出

來

，

要

超

越

資

源

無

上

限

的

前

沿

大

廠

談

何

容

易

。

比

較

可

能

的

真

實

版

本

是

：

不

見

得

要

做

出

全

世

界

最

強

的

模

型

，

而

是

做

一

個

『

在

這

個

特

定

任

務

上

夠

好

、

又

完

全

由

我

掌

控

成

本

與

走

向

』

的

專

用

模

型

。

對

台

灣

的

新

創

，

這

是

個

值

得

想

清

楚

的

選

擇

題

—

套

殼

跑

得

快

但

沒

縱

深

，

自

研

有

縱

深

但

燒

錢

，

中

間

那

條

『

垂

直

場

景

專

用

模

型

』

的

路

，

往

才

是

務

實

解

。

歸剛點評｜套殼門檻低、命脈被模型商捏住，這是所有 AI 新創的共同焦慮。Base44 自研是想把命脈拿回手上，但從頭訓練燒錢且難贏大廠。對台灣 AI 新創，真正務實的常是中間路線：做垂直場景夠用、成本自控的專用模型，而非追全世界最強。

來源：TechCrunch

加密

加密交易所 OKX 想讓 AI agent 互相雇用、互相付錢

OKX 打造一個給 AI agent 的市場，把支付、身分與信譽整合在一起，讓 agent 之間可以彼此雇用與付款，押注一個由機器自主交易的經濟雛形。

加

密

貨

幣

交

易

所

推

出

了

一

個

野

心

不

小

的

構

想

：

打

造

一

個

給

的

市

場

，

把

支

付

、

身

分

與

信

譽

三

件

事

整

合

在

一

起

，

讓

之

間

能

夠

互

相

雇

用

、

互

相

付

錢

。

簡

單

講

，

就

是

讓

不

只

替

人

類

辦

事

，

還

能

自

己

去

『

發

包

』

給

另

一

個

，

並

完

成

付

款

。

要

讓

經

濟

跑

得

動

，

點

出

的

三

塊

拼

圖

缺

一

不

可

。

支

付

解

決

『

怎

麼

付

』

—

加

密

貨

幣

天

生

適

合

機

器

即

時

、

跨

境

、

小

額

地

結

算

；

身

分

解

決

『

你

是

誰

』

—

得

有

辦

法

確

認

對

面

那

個

不

是

冒

牌

貨

；

信

譽

解

決

『

能

不

能

信

』

—

得

有

機

制

記

錄

誰

交

付

得

好

、

誰

常

擺

爛

，

才

知

道

該

找

誰

。

把

這

三

塊

湊

齊

，

理

論

上

就

能

讓

一

群

在

沒

有

人

類

逐

筆

批

准

的

情

況

下

，

自

主

分

工

、

交

易

、

協

作

。

這

個

願

景

很

性

感

，

但

也

要

冷

靜

看

。

一

個

沒

有

人

類

即

時

把

關

、

彼

此

自

動

轉

帳

的

網

路

，

風

險

面

非

常

大

：

一

旦

某

個

被

誘

導

或

被

攻

擊

（

呼

應

今

天

另

一

條

瀏

覽

器

被

『

』

哄

騙

的

新

聞

）

，

錢

可

能

在

你

反

應

過

來

之

前

就

自

動

流

走

了

。

再

加

上

這

是

加

密

交

易

所

主

導

，

本

質

上

也

是

在

替

自

家

的

鏈

上

交

易

找

新

的

需

求

來

源

。

對

台

灣

讀

者

，

把

它

當

成

一

個

值

得

觀

察

的

早

期

實

驗

就

好

—

自

主

經

濟

是

真

趨

勢

，

但

現

階

段

，

讓

機

器

自

動

錢

這

件

事

，

謹

慎

永

遠

比

興

奮

重

要

。

歸剛點評｜agent 互相付錢需要支付、身分、信譽三塊拼圖，加密天生適合機器結算。但無人類即時把關的自動轉帳網路風險巨大——呼應今天 AI 瀏覽器被『2+2=5』哄騙那條，被攻陷的 agent 可能在你反應前就把錢轉走。趨勢是真的，謹慎更重要。

來源：TechCrunch

產品

Google NotebookLM 新功能：把你的筆記變成 TikTok 風格短影音

NotebookLM 新增功能，能根據你上傳的資料生成 60 秒直式 AI 短影音，走 TikTok 風格，先對 Google AI Ultra 與 Pro 訂戶開放。

的

又

加

了

新

花

樣

：

它

現

在

能

根

據

你

上

傳

的

資

料

，

自

動

生

成

秒

的

直

式

短

影

音

，

走

的

是

那

種

快

節

奏

風

格

。

這

個

功

能

先

對

與

訂

戶

開

放

，

給

的

示

範

案

例

，

是

把

『

澳

洲

那

場

失

敗

的

鴯

鶓

戰

爭

』

這

類

冷

知

識

做

成

短

片

。

的

進

化

路

線

很

值

得

玩

味

。

它

最

早

爆

紅

是

靠

『

把

文

件

變

成

兩

個

主

持

人

對

談

的

』

，

把

枯

燥

的

資

料

變

成

能

用

聽

的

；

現

在

這

條

短

影

音

，

是

同

一

個

邏

輯

往

視

覺

端

再

走

一

步

—

把

你

丟

進

去

的

研

究

資

料

、

筆

記

、

報

告

，

自

動

轉

成

最

容

易

被

現

代

人

吞

下

去

的

內

容

形

態

。

核

心

命

題

始

終

是

同

一

個

：

降

低

消

化

資

訊

的

門

檻

，

讓

你

不

必

逐

字

讀

完

，

也

能

快

速

抓

到

重

點

。

這

對

內

容

生

態

是

把

雙

面

刃

。

好

處

是

，

學

生

、

研

究

者

、

知

識

工

作

者

能

用

極

低

成

本

把

硬

資

料

變

成

好

懂

的

影

音

，

自

學

與

傳

播

都

更

省

力

。

隱

憂

是

，

當

『

把

任

何

東

西

自

動

做

成

秒

爽

片

』

變

得

零

成

本

，

內

容

的

同

質

化

與

淺

薄

化

也

會

加

速

—

什

麼

都

被

壓

成

秒

直

式

短

片

，

深

度

閱

讀

的

空

間

會

不

會

被

進

一

步

擠

壓

？

對

台

灣

的

內

容

創

作

者

，

這

類

工

具

是

順

手

的

助

力

，

但

別

讓

『

能

快

速

做

出

影

音

』

取

代

了

『

有

沒

有

值

得

做

成

影

音

的

東

西

』

。

歸剛點評｜NotebookLM 從 podcast 對談走到 TikTok 短影音，核心都是降低資訊消化門檻。對台灣知識工作者與創作者是省力助力，但零成本量產 60 秒爽片也會加速內容淺薄化——工具能幫你做得快，前提是你得先有值得做的東西。

來源：The Verge

開源

開源 agent 程式 OpenClaw 終於登上 Android 與 iOS

免費開源的 agentic 程式 OpenClaw 終於推出 Android 與 iOS 版本，把自主 agent 的能力帶進手機。

免

費

又

開

源

的

程

式

終

於

上

了

手

機

，

與

版

本

同

步

登

場

。

用

了

一

個

生

動

的

說

法

：

這

個

自

主

程

式

『

終

於

入

侵

你

的

手

機

了

』

。

對

一

直

在

桌

面

端

追

這

個

專

案

的

人

，

這

代

表

你

現

在

能

隨

身

帶

著

一

個

能

自

己

規

劃

、

自

己

動

手

做

事

的

。

的

看

點

在

於

它

是

開

源

的

。

和

封

閉

的

商

業

不

同

，

開

源

代

表

任

何

人

都

能

檢

視

它

的

程

式

碼

、

自

己

架

設

、

按

需

求

改

造

，

不

必

把

資

料

與

信

任

全

押

在

某

一

家

公

司

身

上

。

對

重

視

隱

私

、

或

想

把

深

度

客

製

進

自

己

工

作

流

的

進

階

使

用

者

，

這

種

『

能

看

、

能

改

、

能

自

架

』

的

特

性

極

具

吸

引

力

，

也

是

開

源

社

群

一

直

以

來

相

對

於

大

廠

閉

源

產

品

的

核

心

優

勢

。

但

上

手

機

這

件

事

，

便

利

與

風

險

同

樣

綁

在

一

起

。

一

個

能

自

主

操

作

的

跑

在

你

隨

身

、

裝

滿

個

人

資

料

與

帳

號

的

手

機

上

，

一

旦

被

惡

意

指

令

利

用

，

可

造

成

的

破

壞

比

在

桌

機

上

更

貼

身

。

這

也

呼

應

了

今

天

另

外

兩

條

新

聞

—

瀏

覽

器

被

哄

騙

、

自

動

轉

帳

—

同

一

個

主

題

反

覆

出

現

：

當

從

『

回

答

問

題

』

升

級

到

『

自

己

動

手

做

事

』

，

我

們

交

出

去

的

權

限

越

來

越

大

，

對

它

的

安

全

把

關

就

越

不

能

馬

虎

。

想

嘗

鮮

的

台

灣

使

用

者

，

建

議

先

在

權

限

受

控

的

範

圍

內

玩

，

別

一

上

來

就

給

它

你

最

重

要

帳

號

的

鑰

匙

。

歸剛點評｜OpenClaw 開源、可自架可改的特性對重隱私的進階用戶很香，但 agent 上手機讓風險更貼身。呼應今天 AI 瀏覽器被哄、agent 自動轉帳——同個主題反覆出現：AI 從回答問題升級到自己動手，交出的權限越大，安全把關越不能馬虎。

來源：TechCrunch

倫理

Netflix 在《威利旺卡》實境秀用 AI 合成已故 Gene Wilder 配音

Netflix 確認實境秀《Wonka: The Golden Ticket》9 月 23 日上線，旁白採用 AI 生成的已故演員 Gene Wilder 聲音，再度踩上用 AI 重現逝者的爭議線。

釋

出

新

預

告

，

確

認

實

境

秀

《

》

將

於

月

日

上

線

。

爭

議

點

在

於

：

節

目

的

旁

白

用

的

是

生

成

的

聲

音

—

這

位

以

年

版

威

利

旺

卡

聞

名

的

演

員

已

經

過

世

。

預

告

裡

的

場

景

是

實

景

搭

建

、

不

是

假

造

的

，

但

那

把

熟

悉

的

嗓

音

，

是

演

算

法

合

成

的

。

用

復

活

已

故

演

員

的

聲

音

與

形

象

，

是

這

兩

年

娛

樂

圈

最

敏

感

的

灰

色

地

帶

。

支

持

方

會

說

，

這

是

對

經

典

角

色

的

致

敬

，

能

讓

新

世

代

重

新

感

受

到

那

個

聲

音

的

魅

力

；

反

對

方

則

質

疑

，

一

個

無

法

再

表

達

意

願

的

逝

者

，

他

的

聲

音

被

商

業

專

案

拿

去

用

，

授

權

與

尊

嚴

的

界

線

到

底

在

哪

裡

？

聲

音

是

表

演

者

最

具

人

格

辨

識

度

的

資

產

之

一

，

當

它

能

被

任

意

重

建

並

商

用

，

整

個

產

業

對

『

同

意

』

的

定

義

都

會

被

迫

重

寫

。

這

件

事

也

和

近

期

娛

樂

圈

的

另

一

個

趨

勢

扣

在

一

起

：

把

虛

構

作

品

裡

的

殘

酷

情

境

改

編

成

真

人

實

境

競

賽

（

《

魷

魚

遊

戲

》

實

境

秀

是

前

例

）

。

配

音

只

是

其

中

一

塊

拼

圖

，

背

後

是

平

台

在

內

容

生

產

上

不

斷

試

探

成

本

與

倫

理

的

下

限

。

對

台

灣

的

影

視

與

配

音

從

業

者

，

這

是

個

必

須

正

視

的

訊

號

：

合

成

聲

音

的

技

術

門

檻

已

經

低

到

能

進

主

流

製

作

，

接

下

來

該

怎

麼

用

合

約

保

護

自

己

的

聲

音

、

在

世

與

身

後

的

權

利

，

會

是

整

個

行

業

繞

不

開

的

功

課

。

歸剛點評｜AI 復活逝者聲音是娛樂圈最敏感的灰色地帶——聲音是表演者最具人格辨識度的資產，能被任意重建商用，整個產業對『同意』的定義都得重寫。對台灣配音與影視從業者是必須正視的訊號：該怎麼用合約保護在世與身後的聲音權利。

來源：The Verge

政策

川普要 AI 重新設計每個 .gov 網站，結果做出一堆『恐怖屋』

川普政府推動用 AI 重新設計所有 .gov 政府網站，但成果被形容為災難；負責的 National Design Studio 在一年後延後更新政府網站標準的計畫。

川

普

政

府

推

動

了

一

項

大

工

程

：

用

重

新

設

計

每

一

個

聯

邦

政

府

的

網

站

。

的

報

導

標

題

直

接

把

成

果

叫

做

『

設

計

的

恐

怖

屋

』

。

負

責

此

事

的

推

動

一

年

後

，

已

經

延

後

了

原

本

要

更

新

政

府

網

站

設

計

標

準

的

計

畫

。

這

個

案

例

值

得

每

個

想

無

腦

套

的

組

織

引

以

為

戒

。

政

府

網

站

不

是

拿

來

好

看

的

，

它

承

載

的

是

民

眾

繳

稅

、

查

資

料

、

申

請

福

利

、

看

法

規

這

些

攸

關

權

益

的

剛

性

功

能

，

對

無

障

礙

設

計

（

讓

視

障

、

行

動

不

便

者

也

能

用

）

、

資

訊

正

確

性

、

一

致

性

的

要

求

極

高

。

把

這

種

高

度

規

範

、

容

錯

率

極

低

的

工

作

丟

給

大

批

量

生

成

，

最

容

易

出

的

問

題

就

是

『

看

起

來

有

做

事

，

實

際

上

一

堆

細

節

崩

壞

』

—

版

面

亂

、

資

訊

錯

置

、

無

障

礙

標

準

不

符

，

對

真

正

依

賴

這

些

網

站

的

弱

勢

族

群

尤

其

是

災

難

。

往

大

裡

看

，

這

是

『

萬

能

』

敘

事

撞

上

現

實

的

一

記

響

鐘

。

確

實

能

加

速

很

多

事

，

但

在

那

些

需

要

嚴

謹

規

範

、

需

要

為

錯

誤

負

責

、

需

要

照

顧

到

每

一

種

使

用

者

的

領

域

，

貿

然

全

面

導

入

只

會

放

大

災

情

。

選

擇

踩

煞

車

、

延

後

標

準

更

新

，

其

實

是

務

實

的

修

正

。

對

台

灣

的

公

部

門

數

位

轉

型

，

這

是

一

個

現

成

的

負

面

教

材

：

可

以

當

輔

助

工

具

加

速

流

程

，

但

別

把

『

需

要

對

全

民

負

責

的

公

共

服

務

』

整

包

交

給

它

自

動

生

成

，

人

的

審

查

與

把

關

在

這

種

場

景

無

可

取

代

。

歸剛點評｜政府網站承載繳稅、查法規、申福利等剛性功能，無障礙與正確性容錯率極低，無腦套 AI 大批量生成只會放大災情、最坑弱勢族群。對台灣公部門數位轉型是現成負面教材：AI 可加速流程，但對全民負責的公共服務不能整包交給它自動生成。

來源：Ars Technica

政策

Google 發布英國經濟影響報告，喊話打造『全民 AI 開拓者』國家

Google UK 發布最新經濟影響報告，主張透過普及 AI 技能與工具，讓更多英國人享受 AI 帶來的生產力紅利，推動國家進入下一個生產力時代。

的

英

國

分

部

發

布

了

最

新

的

經

濟

影

響

報

告

，

主

軸

是

英

國

要

怎

麼

靠

進

入

下

一

個

生

產

力

時

代

。

報

告

的

核

心

訴

求

是

『

讓

更

多

人

有

能

力

解

鎖

帶

來

的

好

處

』

，

把

目

標

設

定

成

把

英

國

打

造

成

一

個

『

全

民

開

拓

者

』

的

國

家

—

也

就

是

讓

技

能

與

工

具

不

只

屬

於

科

技

菁

英

，

而

是

普

及

到

更

廣

的

勞

動

人

口

。

科

技

巨

頭

出

『

國

家

經

濟

影

響

報

告

』

，

本

身

就

是

一

種

策

略

動

作

，

得

帶

著

理

解

去

讀

。

一

方

面

，

提

升

生

產

力

、

需

要

全

民

具

備

相

應

技

能

，

這

個

大

方

向

確

實

成

立

；

但

另

一

方

面

，

由

這

種

最

大

受

益

者

來

主

導

論

述

，

難

免

把

『

多

用

（

尤

其

是

我

家

的

）

』

描

繪

成

國

家

進

步

的

必

經

之

路

。

報

告

會

強

調

紅

利

、

淡

化

代

價

，

這

是

它

的

立

場

使

然

。

看

這

類

報

告

時

，

把

它

當

成

『

一

份

立

場

明

確

的

政

策

遊

說

』

，

而

非

中

立

的

學

術

分

析

，

會

比

較

清

醒

。

撇

開

立

場

，

裡

頭

真

正

值

得

各

國

借

鏡

的

是

『

技

能

普

及

』

這

個

命

題

。

的

生

產

力

紅

利

如

果

只

集

中

在

少

數

已

經

懂

得

用

的

人

手

上

，

社

會

的

貧

富

與

機

會

差

距

只

會

被

拉

大

；

要

讓

紅

利

雨

露

均

霑

，

關

鍵

在

於

大

規

模

的

技

能

培

訓

與

工

具

可

近

性

。

對

台

灣

，

這

個

提

醒

同

樣

成

立

—

與

其

爭

論

好

不

好

，

不

如

把

力

氣

放

在

『

怎

麼

讓

更

多

一

般

勞

工

、

中

小

企

業

也

用

得

起

、

用

得

會

』

，

這

才

是

決

定

紅

利

會

集

中

還

是

擴

散

的

真

正

關

鍵

。

歸剛點評｜巨頭出『國家經濟報告』本質是政策遊說，Google 把『多用 AI』描繪成國家進步必經之路，看時要清醒。但『AI 技能普及』這命題對台灣真有借鏡：紅利若只集中在會用的人手上，差距只會拉大，怎麼讓中小企業與一般勞工用得起用得會才是關鍵。

來源：Google

產品

Acti 把 AI agent 直接塞進手機鍵盤，賭下一個入口是輸入法

新創 Acti 推出 iOS 與 Android 鍵盤，把 AI 助理嵌進輸入法，能跨 App 運作，並讓使用者用自然語言自建 AI 捷徑，押注鍵盤是 AI 助理的下一個落腳處。

新

創

公

司

押

了

一

個

有

意

思

的

賭

注

：

助

理

的

下

一

個

家

，

是

手

機

鍵

盤

。

它

推

出

的

與

新

鍵

盤

，

把

助

理

直

接

嵌

進

輸

入

法

層

，

能

跨

各

種

運

作

，

還

讓

使

用

者

用

自

然

語

言

自

己

建

立

驅

動

的

捷

徑

。

為

什

麼

是

鍵

盤

？

因

為

鍵

盤

是

手

機

上

少

數

『

無

所

不

在

』

的

介

面

。

不

管

你

在

哪

個

、

聊

天

、

寫

信

、

查

資

料

，

只

要

打

字

，

鍵

盤

就

會

跳

出

來

。

把

塞

進

這

一

層

，

等

於

讓

助

理

跟

著

你

進

到

每

一

個

，

不

必

先

切

到

某

個

專

屬

的

應

用

、

複

製

貼

上

、

再

切

回

來

。

這

個

『

跨

、

隨

叫

隨

到

』

的

特

性

，

是

專

屬

給

不

了

的

，

也

是

認

為

鍵

盤

能

成

為

入

口

的

底

氣

。

自

建

捷

徑

則

進

一

步

讓

人

能

把

常

用

的

操

作

（

翻

譯

、

改

寫

、

摘

要

）

變

成

輸

入

法

裡

的

一

鍵

快

捷

。

不

過

鍵

盤

這

個

位

置

也

有

它

的

天

險

。

輸

入

法

能

看

到

你

打

的

每

一

個

字

，

把

接

進

來

，

等

於

讓

一

個

第

三

方

有

機

會

碰

到

你

最

敏

感

的

輸

入

內

容

—

密

碼

、

私

訊

、

財

務

資

訊

。

這

類

產

品

成

敗

的

關

鍵

，

除

了

好

不

好

用

，

更

在

於

它

對

隱

私

的

處

理

是

否

讓

人

信

得

過

。

對

台

灣

使

用

者

，

第

三

方

鍵

盤

是

個

方

便

的

工

具

，

但

裝

之

前

值

得

先

弄

清

楚

：

它

把

你

打

的

字

送

去

哪

、

存

多

久

、

誰

看

得

到

。

便

利

與

隱

私

的

權

衡

，

在

輸

入

法

這

個

位

置

上

特

別

尖

銳

。

歸剛點評｜鍵盤是手機上唯一無所不在的介面，把 AI 嵌進去能跨 App 隨叫隨到，這是專屬 AI App 給不了的優勢。但輸入法看得到你打的每個字——密碼、私訊、財務。對台灣使用者，第三方 AI 鍵盤方便歸方便，裝之前先搞清楚它把你的字送去哪、誰看得到。

來源：TechCrunch

今日快訊

Anthropic 推出 Claude CorpsAnthropic
Proton 隱私聊天機器人 Lumo 2.0 本週上線TechCrunch
Podcast 平台 Riverside 跨足電子報TechCrunch
電子書借閱 App Libby 將過濾 AI 內容（但有限度）The Verge
論文：表格基礎模型到底有多通用？Hugging Face Papers
論文 SWE-Together：在互動式使用情境下評估編碼 agentHugging Face Papers
GitHub 熱門：Google 開源 agents-cliGitHub
MIT 科技評論：AI 不是你的『同事』MIT Technology Review