歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

第 23 期2026-07-02(台北時間)

七月第二天,AI 的兩條主線同時拉滿。一條是大廠把戰場推進垂直科學——Anthropic 正式推出串接 60 多個資料庫的 Claude Science,直接把大模型搬進藥廠實驗室,Google 與 OpenAI 在同一賽道緊追。另一條是『規則與閘門』的角力全面浮上檯面:美方鬆綁出口管制讓 Fable 5 全球回歸、Anthropic 聯手三巨頭提越獄評分框架,Cloudflare 則畫下 9/15 大限逼 AI 為爬取內容付費。與此同時,Meta 想賣過剩算力、SpaceX 傳做 AI 手機、Venice AI 靠隱私路線成獨角獸,資金正從『拚模型』往『拚算力與能源』下沉。學界這頭,agent 的程序記憶、技能演化與多輪協作成了共同關鍵字。就在這一天,網際網路之父 Vint Cerf 退休——開放網路的世代交棒給一個到處重新豎閘門的 AI 時代。

產品

Anthropic 正式推出 Claude Science:把大模型搬進藥廠實驗室,鎖定新藥研發

A

n

t

h

r

o

p

i

c

7

1

C

l

a

u

d

e

S

c

i

e

n

c

e

A

I

調

C

l

a

u

d

e

S

c

i

e

n

c

e

6

0

A

n

t

h

r

o

p

i

c

b

e

t

a

3

使

7

1

5

7

3

1

9

1

1

2

1

C

l

a

u

d

e

A

n

t

h

r

o

p

i

c

I

P

O

G

o

o

g

l

e

O

p

e

n

A

I

O

p

e

n

A

I

G

P

T

-

R

o

s

a

l

i

n

d

A

I

歸剛點評|AI 大廠的戰線正式從『通用聊天』打進『垂直科學研發』。Anthropic 用免費額度綁住頂尖實驗室的工作流,是為 IPO 鋪高毛利營收;對台灣生技學研圈,這是同行武器升級的訊號,該開始想怎麼把這類工具接進自己的研究管線。
政策

美方鬆綁出口管制,Anthropic 讓 Fable 5 全球回歸,並提議跨廠越獄評分框架

美國商務部撤下對 Anthropic Fable 5 與 Mythos 5 的出口管制,Fable 5 於 7 月 1 日在 Claude 全平台全球恢復。Anthropic 同時聯手 Amazon、微軟、Google 提出替越獄危害打分的產業框架。

6

1

2

A

n

t

h

r

o

p

i

c

使

F

a

b

l

e

5

M

y

t

h

o

s

5

A

n

t

h

r

o

p

i

c

A

m

a

z

o

n

F

a

b

l

e

5

6

3

0

F

a

b

l

e

5

7

1

C

l

a

u

d

e

.

a

i

C

l

a

u

d

e

P

l

a

t

f

o

r

m

C

l

a

u

d

e

C

o

d

e

C

l

a

u

d

e

C

o

w

o

r

k

A

n

t

h

r

o

p

i

c

9

9

%

M

y

t

h

o

s

5

6

2

6

A

n

t

h

r

o

p

i

c

A

m

a

z

o

n

G

o

o

g

l

e

F

a

b

l

e

5

沿

歸剛點評|這件事把一個殘酷現實攤開:前沿模型的生死不在技術,而在監管紅線。Anthropic 從被迫全球斷線到主動提出評分框架,是想把規則制定權握在自己手上。台灣團隊選 API 時要把『政策風險』也列入評估,別把某個模型的可用性當理所當然。
來源:Anthropic · The Verge · Ars Technica · The Hacker News
產業

Cloudflare 出招逼 AI 付費:9/15 起,混用型爬蟲預設被擋在有廣告的頁面外

Cloudflare 給 AI 公司到 9 月 15 日的期限,把搜尋用爬蟲跟訓練/agent 用爬蟲分開,否則在許多刊物網站上被預設封鎖。Pay Per Crawl 進化成 Pay Per Use,讓內容方按價值收費。

C

l

o

u

d

f

l

a

r

e

9

1

5

a

g

e

n

t

P

a

y

P

e

r

C

r

a

w

l

P

a

y

P

e

r

U

s

e

A

I

A

I

C

l

o

u

d

f

l

a

r

e

M

e

r

c

h

a

n

t

o

f

R

e

c

o

r

d

C

l

o

u

d

f

l

a

r

e

A

I

a

g

e

n

t

A

I

C

D

N

M

a

x

A

I

A

I

9

1

5

歸剛點評|守在全網流量咽喉的 CDN 終於對 AI 白嫖出手,內容方第一次握有『收過路費』的實權。這會直接改變 AI 公司的訓練資料成本結構,也逼每個內容網站主做選擇。經營內容站的人現在就該想清楚 9/15 之後的立場。
來源:TechCrunch · Cloudflare Blog
模型

Gemma 4 上 Cerebras 衝到每秒 1800 token,讓即時語音 AI 真的能用

Hugging Face 與 Cerebras 把 Google DeepMind 的 Gemma 4 帶進即時語音場景。Gemma 4 31B 在 Cerebras 上跑超過每秒 1800 token、首字延遲 1.5 秒,多模態含音訊,Apache 2 授權。

G

o

o

g

l

e

D

e

e

p

M

i

n

d

G

e

m

m

a

4

C

e

r

e

b

r

a

s

G

e

m

m

a

4

E

2

B

E

4

B

3

1

B

2

6

B

-

A

4

B

M

o

E

A

p

a

c

h

e

2

E

2

B

E

4

B

1

2

B

a

g

e

n

t

G

e

m

m

a

4

3

1

B

C

e

r

e

b

r

a

s

I

n

f

e

r

e

n

c

e

1

8

0

0

t

o

k

e

n

t

o

k

e

n

1

.

5

C

e

r

e

b

r

a

s

G

e

m

m

a

4

6

2

9

G

e

m

m

a

4

3

1

B

C

e

r

e

b

r

a

s

I

n

f

e

r

e

n

c

e

C

l

o

u

d

A

I

a

g

e

n

t

A

p

a

c

h

e

2

M

a

c

O

l

l

a

m

a

歸剛點評|即時語音 AI 卡了很久的『延遲』問題被硬體端解掉了一大半。開源多模態+每秒 1800 token 的組合,把語音助理、即時口譯這類應用的門檻拉低。想做語音產品的台灣團隊,現在有了不必自建旗艦模型的可行路徑。
來源:Hugging Face · Cerebras · Hugging Face Blog
資金

隱私優先的 Venice AI 成獨角獸:6500 萬美元 A 輪、估值 10 億,年化營收破 7000 萬

主打不記錄對話的 Venice AI 完成 6500 萬美元 A 輪、估值 10 億美元,這是它首次對外募資。公司已獲利,年化營收超過 7000 萬美元,逾 300 萬用戶、每月處理 1.3 兆 token。

E

r

i

k

V

o

o

r

h

e

e

s

V

e

n

i

c

e

A

I

6

5

0

0

A

1

0

7

0

0

0

2

0

2

6

D

r

a

g

o

n

f

l

y

C

o

i

n

b

a

s

e

V

e

n

t

u

r

e

s

N

o

r

t

h

I

s

l

a

n

d

V

e

n

t

u

r

e

s

V

e

n

i

c

e

使

使

3

0

0

使

1

.

3

t

o

k

e

n

1

7

0

A

P

I

8

%

V

e

n

i

c

e

A

I

歸剛點評|『隱私優先』被證明是能賺錢、還能養成獨角獸的路線,而不是空口號。募資前就獲利、年化營收 7000 萬,含金量很高。給台灣產品人的啟示是:差異化未必要拚模型強度,把主流忽略的價值做到極致同樣能成事。
來源:TechCrunch · GeekWire
產業

Meta 也想把過剩 AI 算力變現,傳籌建雲端業務叫板 AWS、Google Cloud

據報 Meta 正籌建雲端業務,把過剩的 AI 運算能力賣給外部客戶。內部代號 Meta Compute,考慮兩條路:直接賣裸算力,或讓開發者存取託管在 Meta 基礎設施上的 AI 模型。消息傳出股價一度漲 9%。

B

l

o

o

m

b

e

r

g

M

e

t

a

A

I

M

e

t

a

C

o

m

p

u

t

e

S

a

n

t

o

s

h

J

a

n

a

r

d

h

a

n

M

e

t

a

D

a

n

i

e

l

G

r

o

s

s

D

i

n

a

P

o

w

e

l

l

M

c

C

o

r

m

i

c

k

M

e

t

a

9

%

C

o

r

e

W

e

a

v

e

n

e

o

c

l

o

u

d

M

e

t

a

A

I

A

m

a

z

o

n

B

e

d

r

o

c

k

M

e

t

a

M

e

t

a

A

I

M

e

t

a

S

p

a

c

e

X

A

I

G

P

U

歸剛點評|當蓋資料中心的錢多到還不完,巨頭就開始把自用剩下的算力拿出來賣。Meta 下場等於雲端市場又多一個重量級供給者,長期對租 GPU 的中小團隊是利多——選擇變多、議價空間變大。這是 AI 投資週期進入『要回本』階段的明確訊號。
來源:TechCrunch · CNBC
產品

Google 的 agent 助理 Gemini Spark 登陸 Mac,能整理 Downloads、操作 Workspace

Google 把 24/7 的 agent 助理 Gemini Spark 帶到 Mac(beta),限美國 Google AI Ultra 訂戶。能把 Downloads 裡的 PDF 分類歸檔、操作 Workspace、用本機檔案建試算表,並整合 Canva、Dropbox、Zillow 等第三方 app。

G

o

o

g

l

e

a

g

e

n

t

G

e

m

i

n

i

S

p

a

r

k

M

a

c

G

e

m

i

n

i

a

p

p

b

e

t

a

G

o

o

g

l

e

A

I

U

l

t

r

a

S

p

a

r

k

M

a

c

D

o

w

n

l

o

a

d

s

P

D

F

W

o

r

k

s

p

a

c

e

a

p

p

C

a

n

v

a

D

r

o

p

b

o

x

I

n

s

t

a

c

a

r

t

O

p

e

n

T

a

b

l

e

Z

i

l

l

o

w

R

e

n

t

a

l

s

a

g

e

n

t

G

o

o

g

l

e

S

p

a

r

k

a

g

e

n

t

M

a

c

I

/

O

2

0

2

6

m

a

c

O

S

a

g

e

n

t

a

p

p

A

I

G

e

m

i

n

i

S

p

a

r

k

D

o

w

n

l

o

a

d

s

a

p

p

M

a

x

M

a

c

m

i

n

i

A

I

a

g

e

n

t

歸剛點評|桌面 agent 正從『會聊天』走向『會替你操作電腦』,這正是 Max 工作流裡想外包的那類確定性苦力(整理下載、分類檔案、生報表)。值得實測能接手多少;同時也提醒,把檔案與帳號權限交給會自己動手的 agent,安全邊界要先想清楚。
來源:TechCrunch · Engadget
硬體

SpaceX 傳有 AI 裝置原型,外形『很像手機』,疑為進軍無線通訊鋪路

據報 SpaceX 在上市前向投資人展示一款『類似手機』的 AI 裝置原型。搭配它把過剩算力變現的動作,被解讀為想把觸角伸進無線通訊市場的又一個訊號。

S

p

a

c

e

X

A

I

S

p

a

c

e

X

S

t

a

r

l

i

n

k

A

I

S

p

a

c

e

X

M

e

t

a

西

S

p

a

c

e

X

A

I

歸剛點評|火箭公司想做手機,背後是『衛星網路+AI 終端+算力服務』被同一批玩家整合的大方向。真要量產,通訊晶片、天線、代工需求多半會繞回台灣供應鏈。原型不等於產品,現在當早期訊號追蹤,別被標題帶著跑。
來源:TechCrunch
資金

自駕新星 Wayve 開 8500 萬美元員工老股收購,估值站上 85 億

自駕公司 Wayve 推出 8500 萬美元的員工股權出售(tender offer),估值達 85 億美元。用員工老股收購當留才與攬才工具,正成為 AI 新創的一股趨勢。

W

a

y

v

e

8

5

0

0

e

m

p

l

o

y

e

e

t

e

n

d

e

r

o

f

f

e

r

8

5

A

I

A

I

t

e

n

d

e

r

o

f

f

e

r

A

I

I

P

O

A

I

W

a

y

v

e

歸剛點評|AI 人才貴到公司得主動造『中途變現』出口才留得住人,苦等 IPO 已經不夠看。這是 AI 人才市場過熱的溫度計。台灣新創在員工股權流動性上一向偏弱,這道題遲早要面對,Wayve 提供了可研究的範本。
來源:TechCrunch
資金

Ashton Kutcher 離開 Sound Ventures,攜 Morgan Beller 另創新基金押 AI 底層

演員兼投資人 Ashton Kutcher 離開一手打造的 Sound Ventures,與 Morgan Beller 合創新創投。Sound 過去以重壓頂尖 AI 實驗室聞名,新基金看來要押的是這些公司底下的基礎設施與能源層。

A

s

h

t

o

n

K

u

t

c

h

e

r

S

o

u

n

d

V

e

n

t

u

r

e

s

M

o

r

g

a

n

B

e

l

l

e

r

S

o

u

n

d

V

e

n

t

u

r

e

s

A

I

K

u

t

c

h

e

r

A

I

A

I

M

o

r

g

a

n

B

e

l

l

e

r

歸剛點評|聰明錢開始從『模型明星公司』往下游的算力、資料中心、電力移動,賭的是不管誰勝出、底層需求都少不了。這條『賣鏟子』的投資線,正好對上台灣在半導體、散熱、電源的既有優勢,值得產業圈順著想接單機會。
來源:TechCrunch
研究

問 AI『1 到 10 挑個數字』幾乎都回 7?新創想把模型從群體思考裡拉出來

多數大模型面對開放式問題會收斂到高度雷同的答案,問『1 到 10 選一個數』幾乎都回 7。澳洲新創 Springboards 用一款叫 Flint 的模型訓練出更多樣的回應,試圖解決『AI 群體思考』的老問題。

C

l

a

u

d

e

C

h

a

t

G

P

T

G

e

m

i

n

i

1

1

0

7

3

4

8

9

穿

M

I

T

T

e

c

h

n

o

l

o

g

y

R

e

v

i

e

w

1

1

A

r

t

i

f

i

c

i

a

l

H

i

v

e

m

i

n

d

L

L

M

A

I

S

p

r

i

n

g

b

o

a

r

d

s

F

l

i

n

t

A

I

M

a

x

A

I

歸剛點評|『AI 產出愈來愈像』不一定是你提示詞的錯,而是模型骨子裡就會往平均值收斂。對靠 AI 大量產內容、發想點子的人是實用提醒:評模型別只比誰更準,也要看誰更不一樣;產出變千篇一律時,換模型或加大隨機性會有效。
人物

『網際網路之父』Vint Cerf 退休,卸下 Google 首席網路傳道者

共同設計網際網路底層協定的 Vint Cerf,將於下週卸下 Google 首席網路傳道者一職、正式退休。他與 Bob Kahn 共同發明的 TCP/IP,是今天整個網路運轉的基礎。

V

i

n

t

C

e

r

f

G

o

o

g

l

e

c

h

i

e

f

i

n

t

e

r

n

e

t

e

v

a

n

g

e

l

i

s

t

退

B

o

b

K

a

h

n

T

C

P

/

I

P

C

e

r

f

G

o

o

g

l

e

退

退

A

I

a

g

e

n

t

A

I

C

e

r

f

退

A

I

A

I

C

l

o

u

d

f

l

a

r

e

F

a

b

l

e

5

歸剛點評|打造開放網路的世代正在交棒,接手的是一個到處重新豎閘門的 AI 時代——內容要付費才給爬、模型要審查才能出口。把 Cerf 退休跟今天的 Cloudflare、Fable 5 新聞並讀,正好照見網路精神的世代轉折,值得記一筆。
來源:TechCrunch
產品

Google 做出好硬體,但 Gemini 還撐不起這台智慧音箱

The Verge 評測 Google 新智慧音箱:硬體做得不錯,但搭載的 Gemini 還沒準備好。智慧音箱多年來苦尋『音樂、計時、控燈之外』的第二幕,AI 本被寄望改寫,實測卻仍差一截。

T

h

e

V

e

r

g

e

G

o

o

g

l

e

G

e

m

i

n

i

A

I

A

m

a

z

o

n

A

l

e

x

a

G

e

m

i

n

i

A

I

A

I

使

G

e

m

m

a

4

C

e

r

e

b

r

a

s

1

.

5

A

I

歸剛點評|把大模型塞進裝置不等於體驗變好——AI 硬體最常見的病就是『身體準備好、腦子沒跟上』。對照今天 Gemma 4 把語音延遲壓到 1.5 秒,答案很清楚:音箱要成,缺的不是會不會講話,是夠不夠快、準、懂你。做 AI 硬體的人該記住這一哩。
來源:The Verge
研究

AFTER 基準:用 382 個真實企業任務,測 AI agent 的『程序記憶』到底行不行

一篇論文提出 AFTER 基準,用 382 個貼近真實的企業任務、涵蓋六種職業角色與 22 種程序技能,檢驗 LLM agent 的程序記憶能否產出可重複利用的技能,並探討如何控制、調適與評估這種記憶。

p

r

o

c

e

d

u

r

a

l

m

e

m

o

r

y

L

L

M

a

g

e

n

t

A

F

T

E

R

3

8

2

2

2

a

g

e

n

t

a

g

e

n

t

調

調

A

F

T

E

R

調

a

g

e

n

t

M

a

x

A

I

a

g

e

n

t

a

g

e

n

t

歸剛點評|程序記憶研究要解的,正是 Max 五機工作流天天在做的事:讓 AI 把重複苦力沉澱成能穩定重現的固定程序。AFTER 用 382 個真實企業任務量化『控制、調適、評估』三難題,能幫判斷哪些重複任務交給有記憶的 agent 靠得住、哪些還得人盯。
研究

SkillHone:讓 agent 靠『保留決策歷史』持續進化技能,而不是每次砍掉重練

論文提出 SkillHone 框架,針對 agent 技能所面對的任務與環境會不斷變化的問題。現有方法只在有限回合內改進技能、且只留下最終成品,丟掉了後來的 agent 其實需要的決策歷史。SkillHone 想把這段歷史持久保留下來。

A

g

e

n

t

a

g

e

n

t

s

k

i

l

l

s

a

g

e

n

t

a

g

e

n

t

S

k

i

l

l

H

o

n

e

a

g

e

n

t

a

g

e

n

t

a

g

e

n

t

M

a

x

A

I

S

k

i

l

l

H

o

n

e

A

I

歸剛點評|別只存結果,也要存『當時怎麼想的』——SkillHone 點出 agent 進化的關鍵在保留決策歷史,而非每次砍掉重練。這跟 Max 每天跑的日報排程完全呼應:把選題與改流程的判斷留成養分,系統才會愈跑愈聰明,這是設計長期自動化流程的架構觀。
研究

機器人學會動手後,還記得常識嗎?新研究量測 VLA 模型的知識流失

視覺-語言-動作(VLA)模型多半是拿強大的 VLM 用機器人資料微調而來,但微調後它到底還保留多少常識與事實知識,一直不清楚。這篇論文專門量測 VLA 在適應機器人任務後的知識保留程度。

V

L

A

-

-

-

調

V

L

A

A

I

A

I

退

h

f

a

g

e

n

t

A

I

歸剛點評|把通用大模型特化成會動手的機器人,往往要付『通識退化』的隱形學費——看似俐落卻可能違背常識。這篇把『知不知道』和『做不做到』拆開評估,是具身 AI 走向可靠的必要一步,也提醒所有做模型特化的人:別為了新本事掏空舊根基。
研究

SWE-Interact:把寫程式 benchmark 改成『使用者一路來回下指令』的多輪任務

論文提出 SWE-Interact,評估 coding agent 在多輪、互動、使用者驅動的軟體工程任務上的表現。現有前沿 SWE benchmark 多半一開始就給完整需求、再看 agent 自主完成;SWE-Interact 則把使用者放回迴圈裡。

c

o

d

i

n

g

a

g

e

n

t

a

g

e

n

t

調

S

W

E

-

I

n

t

e

r

a

c

t

c

o

d

i

n

g

a

g

e

n

t

使

使

a

g

e

n

t

A

I

S

W

E

-

I

n

t

e

r

a

c

t

a

g

e

n

t

A

I

M

a

x

A

I

a

g

e

n

t

c

o

d

i

n

g

歸剛點評|真實開發是邊做邊講清楚需求,不是一次把規格丟給 AI 讓它自己跑完。SWE-Interact 把評測拉到『多輪協作』這個更貼近日常的維度。對每天靠 AI 寫程式、修腳本的人,選工具該看的是它聽不聽得懂你半路改的需求,而不只是能不能通關乾淨題目。
研究

TRIAGE:替 agent 的每個動作『按角色分功過』,改進代理式強化學習

代理式強化學習要替搜尋、點擊、編輯、導航等面向環境的動作分配功過。標準 GRPO 用最終驗證結果對所有動作 token 給一致的優勢值。TRIAGE 提出依動作角色分型的信用分配,讓不同類型的動作得到更貼切的獎勵訊號。

A

I

a

g

e

n

t

G

R

P

O

t

o

k

e

n

T

R

I

A

G

E

a

g

e

n

t

a

g

e

n

t

a

g

e

n

t

T

R

I

A

G

E

使

A

I

a

g

e

n

t

a

g

e

n

t

歸剛點評|agent 要更會辦事,底層得先把『哪一步該記功、哪一步該記過』算準。TRIAGE 把 GRPO 那種整組一致的粗獎勵,改成按動作角色論功行賞。這類訓練訊號的細活,決定了明年你用到的 AI agent 會不會更少犯蠢——是拉開各家差距的關鍵苦工。

今日快訊