歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

第 22 期2026-07-01(台北時間)

七月開場,前沿大廠火力全開。Anthropic 同日端出 Claude Sonnet 5 與旗艦級新產品 Claude Science,宣告 AI 競爭從『拚跑分』轉向『拚工作流』;Google 用 Nano Banana 2 Lite 把生圖推進幾秒一張的生產線時代;OpenAI 則用 GeneBench-Pro 在科學評測卡位。另一條暗線同時浮現——AI 瀏覽器被『2+2=5』哄騙、agent 互相轉帳、agent 上手機,當 AI 從回答問題升級到自己動手做事,安全把關的份量只會越來越重。

模型

Anthropic 推出 Claude Sonnet 5:逼近 Opus 4.8 的水準,價格卻砍一截

Anthropic 推出 Claude Sonnet 5:逼近 Opus 4.8 的水準,價格卻砍一截

A

n

t

h

r

o

p

i

c

6

3

0

C

l

a

u

d

e

S

o

n

n

e

t

5

O

p

u

s

4

.

8

便

a

g

e

n

t

T

e

c

h

C

r

u

n

c

h

調

O

p

u

s

G

P

T

-

5

.

5

G

e

m

i

n

i

P

r

o

A

n

t

h

r

o

p

i

c

S

i

m

o

n

W

i

l

l

i

s

o

n

w

h

a

t

'

s

n

e

w

S

o

n

n

e

t

5

沿

A

n

t

h

r

o

p

i

c

a

g

e

n

t

滿

便

A

P

I

便

歸剛點評|Sonnet 5 把「接近旗艦、價格腰斬」變成可量產的中階武器,直接壓 GPT-5.5 與 Gemini Pro 的成本帶。對天天燒 token 的台灣團隊,這是少數能無痛換上去省錢的版本;但系統卡那段刻意削弱攻擊力,提醒你模型能力越來越受政府監管牽動。
來源:Anthropic · TechCrunch · Simon Willison
產品

Claude Science 上線:Anthropic 把 Claude Code 那套搬給科學家

Anthropic 發表 Claude Science,一個給科學家用的工作台,整合研究常用的工具與套件,能像 Claude Code 一樣依高階指令自主跑運算研究,省去在資料庫、管線、工具間切換。

Claude Science 上線:Anthropic 把 Claude Code 那套搬給科學家

A

n

t

h

r

o

p

i

c

C

l

a

u

d

e

S

c

i

e

n

c

e

C

l

a

u

d

e

C

o

d

e

M

I

T

T

e

c

h

n

o

l

o

g

y

R

e

v

i

e

w

A

n

t

h

r

o

p

i

c

A

n

t

h

r

o

p

i

c

T

e

c

h

C

r

u

n

c

h

C

l

a

u

d

e

S

c

i

e

n

c

e

C

l

a

u

d

e

S

c

i

e

n

c

e

沿

A

n

t

h

r

o

p

i

c

C

l

a

u

d

e

C

o

d

e

A

I

歸剛點評|Anthropic 沒發新模型卻發旗艦產品,等於宣告純跑分時代的紅利見頂,護城河改挖在垂直工作流。Claude Code 打工程師、Claude Science 打生技製藥,都是高客單高黏著的肥肉;台灣學研圈值得早點摸它的深度,別等到對手都接上了才動。
模型

Google 出 Nano Banana 2 Lite 與 Gemini Omni Flash:幾秒出圖、便宜到誇張

Google 發表更快更便宜的影像模型 Nano Banana 2 Lite,出一張圖只要幾秒;同場還有 Gemini Omni Flash。畫質沒旗艦好看,但勝在速度與成本,鎖定要量產 AI 內容的創作者。

Google 出 Nano Banana 2 Lite 與 Gemini Omni Flash:幾秒出圖、便宜到誇張

G

o

o

g

l

e

D

e

e

p

M

i

n

d

西

N

a

n

o

B

a

n

a

n

a

2

L

i

t

e

G

e

m

i

n

i

O

m

n

i

F

l

a

s

h

便

A

r

s

T

e

c

h

n

i

c

a

N

a

n

o

B

a

n

a

n

a

2

L

i

t

e

T

e

c

h

C

r

u

n

c

h

A

I

N

a

n

o

B

a

n

a

n

a

2

L

i

t

e

2

2

O

l

l

a

m

a

4

5

1

1

0

G

o

o

g

l

e

歸剛點評|影像生成正式分層:旗艦拚畫質、Lite 版拚速度成本。對天天要量產社群圖、廣告變體的台灣小編與行銷,幾秒一張、單價極低的工具比『最美』更實用。Google 把這個取捨直接做成產品線,等於宣告生圖進入生產線時代。
來源:Google DeepMind · TechCrunch · Ars Technica
研究

OpenAI 推 GeneBench-Pro:用真實基因體資料考 AI 的科學底子

OpenAI 發表 GeneBench-Pro,一套用複雜真實資料測 AI 在基因體、生物學與科學研究表現的評測,並附案例研究,想看模型在硬科學上到底有幾兩重。

OpenAI 推 GeneBench-Pro:用真實基因體資料考 AI 的科學底子

O

p

e

n

A

I

G

e

n

e

B

e

n

c

h

-

P

r

o

A

I

調

C

l

a

u

d

e

S

c

i

e

n

c

e

A

I

O

p

e

n

A

I

G

e

n

e

B

e

n

c

h

-

P

r

o

A

n

t

h

r

o

p

i

c

G

o

o

g

l

e

A

I

歸剛點評|當 Anthropic、OpenAI 同週都撲向科學研究市場,評測標準成了卡位戰場——誰定義『什麼叫強』,誰就握話語權。GeneBench-Pro 用真實基因體資料是進步,但廠商自己出題自己評分,台灣研究者該交叉看多家榜單,別被單一基準帶風向。
來源:OpenAI · OpenAI 案例研究
晶片

Nvidia 挑戰者 Etched 估值衝上 50 億美元,推論晶片已簽 10 億訂單

主打推論的 AI 晶片新創 Etched 估值達 50 億美元,並表示其晶片驅動的推論系統已簽下 10 億美元合約。專攻推論這個被 Nvidia 相對忽略的環節,搶分一塊正在膨脹的大餅。

Nvidia 挑戰者 Etched 估值衝上 50 億美元,推論晶片已簽 10 億訂單

A

I

E

t

c

h

e

d

5

0

1

0

E

t

c

h

e

d

N

v

i

d

i

a

G

P

U

使

N

v

i

d

i

a

G

P

U

E

t

c

h

e

d

A

I

N

v

i

d

i

a

E

t

c

h

e

d

G

r

o

q

C

e

r

e

b

r

a

s

N

v

i

d

i

a

A

I

使

1

0

歸剛點評|訓練要 Nvidia 頂規 GPU,但模型上線後天天被呼叫的『推論』才是長期最大算力錢坑。Etched 用專用晶片切這塊,10 億簽約是硬證據。對台灣半導體供應鏈,推論專用晶片崛起是 Nvidia 一家獨大鬆動的早期訊號,值得追。
來源:TechCrunch
產業

OpenAI 公布 ChatGPT 採用數據:用得更多、玩得更廣、全球擴張

OpenAI 釋出 Signals 數據,顯示 ChatGPT 全球採用持續成長:使用者用得更頻繁、探索更多功能,並在不同地區與語言帶動成長。

OpenAI 公布 ChatGPT 採用數據:用得更多、玩得更廣、全球擴張

O

p

e

n

A

I

S

i

g

n

a

l

s

C

h

a

t

G

P

T

使

C

h

a

t

G

P

T

使

O

p

e

n

A

I

調

C

h

a

t

G

P

T

A

I

使

歸剛點評|用戶數成長是表象,『既有用戶用得更深、接進工作流』才是黏著度扎根的真訊號,代表 ChatGPT 從玩具變必需品。跨語言擴張則直接打進華語市場——對台灣產品業者,這是巨頭壓境與在地化機會同時到來的雙面刃。
來源:OpenAI
資安

新攻擊再添一筆:跟 AI 說『2+2=5』就能讓它照禁令辦事

資安研究揭露針對 AI 瀏覽器的新攻擊:只要先讓模型接受一個明顯錯誤的前提(如 2+2=5),就能把它誘進一個守則失效的『夢境』,進而執行原本被禁止的指令。

新攻擊再添一筆:跟 AI 說『2+2=5』就能讓它照禁令辦事

A

r

s

T

e

c

h

n

i

c

a

A

I

2

+

2

=

5

A

I

A

I

b

u

g

A

I

A

I

a

g

e

n

t

使

A

I

便

歸剛點評|AI 瀏覽器把點按轉帳的控制權交給會被文字牽著走的模型,攻擊者埋一句『2+2=5』就能讓護欄失效、用你的身分辦事。問題出在模型會無條件接受餵進來的前提這個根本特性,跟單一 bug 無關。台灣使用者務實做法:別把網銀、公司後台交給會自動操作的 AI 瀏覽器。
來源:Ars Technica
產業

Amazon 砸 10 億設 FDE 組織,跟著 OpenAI、Anthropic 派工程師駐點客戶

Amazon 成立投入 10 億美元的「前線部署工程師」(FDE)組織,工程師將進駐企業內部,部署量身打造的 agent,主打快速上線與讓客戶能自立運作。

Amazon 砸 10 億設 FDE 組織,跟著 OpenAI、Anthropic 派工程師駐點客戶

A

m

a

z

o

n

1

0

F

o

r

w

a

r

d

D

e

p

l

o

y

e

d

E

n

g

i

n

e

e

r

F

D

E

A

I

a

g

e

n

t

O

p

e

n

A

I

A

n

t

h

r

o

p

i

c

F

D

E

P

a

l

a

n

t

i

r

A

I

西

A

P

I

A

I

歸剛點評|三巨頭同押 FDE 駐點模式,等於承認模型本身淪為水電、差異化在落地服務。賣 API 薄利、派人客製整合才是高客單肥肉。對台灣 SI 與 AI 顧問業是雙面刃:巨頭親自下海搶單,但本地企業更吃在地貼身服務這道縫。
來源:TechCrunch
工具

X 推出官方 MCP server,讓 AI 工具更好接它的平台

X 上線一個託管的 MCP server,讓開發者更容易把 AI 應用接上 X 的 API。MCP 正快速變成 AI 工具與外部服務之間的通用接頭。

X 推出官方 MCP server,讓 AI 工具更好接它的平台

X

T

w

i

t

t

e

r

M

C

P

s

e

r

v

e

r

A

I

X

A

P

I

X

X

X

A

I

M

C

P

M

o

d

e

l

C

o

n

t

e

x

t

P

r

o

t

o

c

o

l

A

n

t

h

r

o

p

i

c

A

I

U

S

B

A

I

M

C

P

A

P

I

M

C

P

X

s

e

r

v

e

r

M

C

P

A

I

a

g

e

n

t

A

I

便

便

歸剛點評|MCP 正從開發者共識變成平台主動擁抱的事實標準,連 X 都親自開官方接頭。對開發者是少寫膠水碼的好消息;但平台鋪路有算計——讓所有 agent 都從你的接頭進來,就把自己卡進 AI 工作流的關鍵節點。台灣開發者值得趁早熟悉 MCP 生態。
來源:TechCrunch
人物

做撲克 AI 的 DeepMind 三人組,現在替量化對沖基金賺錢

三位前 DeepMind 研究者創辦、總部在布拉格的 AI 實驗室 EquiLibre Technologies 估值已超過 5 億美元,把當年打撲克 AI 的技術轉用到量化金融。

做撲克 AI 的 DeepMind 三人組,現在替量化對沖基金賺錢

D

e

e

p

M

i

n

d

A

I

E

q

u

i

L

i

b

r

e

T

e

c

h

n

o

l

o

g

i

e

s

5

A

I

滿

A

I

A

I

A

I

歸剛點評|撲克和金融都是『不完全資訊下做最優決策』,技術一脈相承。三人組帶著 DeepMind 看家本領出走變現,是『學術突破→金融落袋』的標準劇本。提醒台灣讀者:量化市場正被越來越強的演算法接管,博弈門檻只會更高。
來源:TechCrunch
政策

AI 砍掉新鮮人工作?新報告打臉:高強度採用者反而增員 10%

一份新報告發現,「高強度導入 AI」的企業整體人力增加 10.2%,其中入門級職位還成長 12%,反駁了 AI 會消滅基層工作的說法,讓這場勞動辯論更加複雜。

AI 砍掉新鮮人工作?新報告打臉:高強度採用者反而增員 10%

A

I

A

I

1

0

.

2

%

1

2

%

A

I

A

I

A

I

A

I

A

I

A

I

A

I

A

I

A

I

/

A

I

歸剛點評|這份報告的價值不在『證明 AI 不搶工作』,而在戳破兩派口號——數字可能只是『會成長的公司剛好也愛用 AI』的因果倒置。提醒台灣勞工雇主:AI 衝擊高度取決於你的產業職能,別被任一邊的標語綁架,看自己的位置才實際。
來源:TechCrunch
工程

OpenAI 靠大規模 core dump 分析,揪出潛藏 18 年的老 bug

OpenAI 工程團隊用大規模 core dump 分析,追查罕見的基礎設施崩潰,最後同時挖出一個硬體故障與一個埋了 18 年的軟體 bug。

OpenAI 靠大規模 core dump 分析,揪出潛藏 18 年的老 bug

O

p

e

n

A

I

c

o

r

e

d

u

m

p

1

8

b

u

g

b

u

g

A

I

d

e

b

u

g

O

p

e

n

A

I

c

o

r

e

d

u

m

p

A

I

d

e

b

u

g

1

8

b

u

g

歸剛點評|超大規模叢集上,崩潰是百萬分之一機率、無法複現,傳統 debug 失效。OpenAI 改用『流行病學』式統計診斷揪出 18 年老 bug,是 AI 時代可靠度工程的範式轉移。對台灣後端與 SRE 工程師,這套巨量規模統計除錯法值得學起來。
來源:OpenAI
產業

Wix 旗下 vibe-coding 平台 Base44 自研模型,新創開始找自己的護城河

Wix 旗下的 vibe-coding 平台 Base44 開始推出自家 AI 模型,期望最終能超越前沿模型。這反映 AI 新創在套殼之外,開始尋找自己的防禦縱深。

Wix 旗下 vibe-coding 平台 Base44 自研模型,新創開始找自己的護城河

W

i

x

v

i

b

e

-

c

o

d

i

n

g

B

a

s

e

4

4

A

I

沿

v

i

b

e

-

c

o

d

i

n

g

A

I

B

a

s

e

4

4

A

I

A

I

O

p

e

n

A

I

A

n

t

h

r

o

p

i

c

沿

B

a

s

e

4

4

v

i

b

e

-

c

o

d

i

n

g

A

I

歸剛點評|套殼門檻低、命脈被模型商捏住,這是所有 AI 新創的共同焦慮。Base44 自研是想把命脈拿回手上,但從頭訓練燒錢且難贏大廠。對台灣 AI 新創,真正務實的常是中間路線:做垂直場景夠用、成本自控的專用模型,而非追全世界最強。
來源:TechCrunch
加密

加密交易所 OKX 想讓 AI agent 互相雇用、互相付錢

OKX 打造一個給 AI agent 的市場,把支付、身分與信譽整合在一起,讓 agent 之間可以彼此雇用與付款,押注一個由機器自主交易的經濟雛形。

加密交易所 OKX 想讓 AI agent 互相雇用、互相付錢

O

K

X

A

I

a

g

e

n

t

a

g

e

n

t

A

I

A

I

a

g

e

n

t

O

K

X

a

g

e

n

t

a

g

e

n

t

A

I

a

g

e

n

t

a

g

e

n

t

A

I

2

+

2

=

5

a

g

e

n

t

歸剛點評|agent 互相付錢需要支付、身分、信譽三塊拼圖,加密天生適合機器結算。但無人類即時把關的自動轉帳網路風險巨大——呼應今天 AI 瀏覽器被『2+2=5』哄騙那條,被攻陷的 agent 可能在你反應前就把錢轉走。趨勢是真的,謹慎更重要。
來源:TechCrunch
產品

Google NotebookLM 新功能:把你的筆記變成 TikTok 風格短影音

NotebookLM 新增功能,能根據你上傳的資料生成 60 秒直式 AI 短影音,走 TikTok 風格,先對 Google AI Ultra 與 Pro 訂戶開放。

Google NotebookLM 新功能:把你的筆記變成 TikTok 風格短影音

G

o

o

g

l

e

N

o

t

e

b

o

o

k

L

M

6

0

A

I

T

i

k

T

o

k

G

o

o

g

l

e

A

I

U

l

t

r

a

P

r

o

G

o

o

g

l

e

N

o

t

e

b

o

o

k

L

M

A

I

p

o

d

c

a

s

t

T

i

k

T

o

k

西

6

0

6

0

西

歸剛點評|NotebookLM 從 podcast 對談走到 TikTok 短影音,核心都是降低資訊消化門檻。對台灣知識工作者與創作者是省力助力,但零成本量產 60 秒爽片也會加速內容淺薄化——工具能幫你做得快,前提是你得先有值得做的東西。
來源:The Verge
開源

開源 agent 程式 OpenClaw 終於登上 Android 與 iOS

免費開源的 agentic 程式 OpenClaw 終於推出 Android 與 iOS 版本,把自主 agent 的能力帶進手機。

開源 agent 程式 OpenClaw 終於登上 Android 與 iOS

a

g

e

n

t

i

c

O

p

e

n

C

l

a

w

A

n

d

r

o

i

d

i

O

S

T

e

c

h

C

r

u

n

c

h

a

g

e

n

t

A

I

a

g

e

n

t

O

p

e

n

C

l

a

w

a

g

e

n

t

a

g

e

n

t

使

a

g

e

n

t

便

a

g

e

n

t

滿

A

I

a

g

e

n

t

A

I

O

p

e

n

C

l

a

w

使

歸剛點評|OpenClaw 開源、可自架可改的特性對重隱私的進階用戶很香,但 agent 上手機讓風險更貼身。呼應今天 AI 瀏覽器被哄、agent 自動轉帳——同個主題反覆出現:AI 從回答問題升級到自己動手,交出的權限越大,安全把關越不能馬虎。
來源:TechCrunch
倫理

Netflix 在《威利旺卡》實境秀用 AI 合成已故 Gene Wilder 配音

Netflix 確認實境秀《Wonka: The Golden Ticket》9 月 23 日上線,旁白採用 AI 生成的已故演員 Gene Wilder 聲音,再度踩上用 AI 重現逝者的爭議線。

Netflix 在《威利旺卡》實境秀用 AI 合成已故 Gene Wilder 配音

N

e

t

f

l

i

x

W

o

n

k

a

:

T

h

e

G

o

l

d

e

n

T

i

c

k

e

t

9

2

3

A

I

G

e

n

e

W

i

l

d

e

r

1

9

7

1

A

I

A

I

A

I

A

I

歸剛點評|AI 復活逝者聲音是娛樂圈最敏感的灰色地帶——聲音是表演者最具人格辨識度的資產,能被任意重建商用,整個產業對『同意』的定義都得重寫。對台灣配音與影視從業者是必須正視的訊號:該怎麼用合約保護在世與身後的聲音權利。
來源:The Verge
政策

川普要 AI 重新設計每個 .gov 網站,結果做出一堆『恐怖屋』

川普政府推動用 AI 重新設計所有 .gov 政府網站,但成果被形容為災難;負責的 National Design Studio 在一年後延後更新政府網站標準的計畫。

川普要 AI 重新設計每個 .gov 網站,結果做出一堆『恐怖屋』

A

I

.

g

o

v

A

r

s

T

e

c

h

n

i

c

a

A

I

N

a

t

i

o

n

a

l

D

e

s

i

g

n

S

t

u

d

i

o

A

I

便

A

I

A

I

A

I

使

貿

N

a

t

i

o

n

a

l

D

e

s

i

g

n

S

t

u

d

i

o

A

I

歸剛點評|政府網站承載繳稅、查法規、申福利等剛性功能,無障礙與正確性容錯率極低,無腦套 AI 大批量生成只會放大災情、最坑弱勢族群。對台灣公部門數位轉型是現成負面教材:AI 可加速流程,但對全民負責的公共服務不能整包交給它自動生成。
來源:Ars Technica
政策

Google 發布英國經濟影響報告,喊話打造『全民 AI 開拓者』國家

Google UK 發布最新經濟影響報告,主張透過普及 AI 技能與工具,讓更多英國人享受 AI 帶來的生產力紅利,推動國家進入下一個生產力時代。

Google 發布英國經濟影響報告,喊話打造『全民 AI 開拓者』國家

G

o

o

g

l

e

A

I

A

I

A

I

A

I

A

I

G

o

o

g

l

e

A

I

調

使

A

I

A

I

A

I

A

I

A

I

歸剛點評|巨頭出『國家經濟報告』本質是政策遊說,Google 把『多用 AI』描繪成國家進步必經之路,看時要清醒。但『AI 技能普及』這命題對台灣真有借鏡:紅利若只集中在會用的人手上,差距只會拉大,怎麼讓中小企業與一般勞工用得起用得會才是關鍵。
來源:Google
產品

Acti 把 AI agent 直接塞進手機鍵盤,賭下一個入口是輸入法

新創 Acti 推出 iOS 與 Android 鍵盤,把 AI 助理嵌進輸入法,能跨 App 運作,並讓使用者用自然語言自建 AI 捷徑,押注鍵盤是 AI 助理的下一個落腳處。

Acti 把 AI agent 直接塞進手機鍵盤,賭下一個入口是輸入法

A

c

t

i

A

I

i

O

S

A

n

d

r

o

i

d

A

I

A

p

p

使

A

I

A

p

p

A

I

A

p

p

A

I

A

p

p

A

I

A

p

p

A

c

t

i

A

I

A

I

使

A

I

便

便

歸剛點評|鍵盤是手機上唯一無所不在的介面,把 AI 嵌進去能跨 App 隨叫隨到,這是專屬 AI App 給不了的優勢。但輸入法看得到你打的每個字——密碼、私訊、財務。對台灣使用者,第三方 AI 鍵盤方便歸方便,裝之前先搞清楚它把你的字送去哪、誰看得到。
來源:TechCrunch

今日快訊