歸剛誒AI

歸剛欸，AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁　·　回第 23 期（2026-07-02）

研究・2026-07-02

機器人學會動手後，還記得常識嗎？新研究量測 VLA 模型的知識流失

具

身

智

慧

的

V

L

A

（

視

覺

-

語

言

-

動

作

）

模

型

，

通

常

是

拿

一

個

本

來

很

強

的

視

覺

-

語

言

模

型

，

再

用

機

器

人

資

料

去

微

調

而

成

。

問

題

來

了

：

經

過

這

番

改

造

、

學

會

了

控

制

手

臂

與

感

知

環

境

之

後

，

它

原

本

那

套

常

識

與

事

實

知

識

還

剩

多

少

？

沒

人

說

得

準

。

而

且

當

模

型

在

需

要

知

識

的

任

務

上

失

手

時

，

往

往

分

不

清

是

它

根

本

不

知

道

，

還

是

知

道

卻

沒

能

力

執

行

—

—

兩

種

失

敗

混

在

一

起

，

很

難

診

斷

。

這

篇

論

文

正

面

處

理

這

個

模

糊

地

帶

，

設

計

方

法

去

量

測

V

L

A

模

型

在

適

應

機

器

人

任

務

後

的

常

識

與

世

界

知

識

到

底

保

留

了

多

少

。

之

所

以

重

要

，

是

因

為

一

個

會

動

手

的

機

器

人

若

在

過

程

中

悄

悄

流

失

了

對

世

界

的

基

本

理

解

，

它

做

出

來

的

動

作

就

可

能

看

似

俐

落

、

實

則

違

背

常

識

—

—

好

比

會

精

準

抓

取

，

卻

搞

不

清

該

不

該

抓

、

抓

了

會

怎

樣

。

把

『

知

不

知

道

』

和

『

做

不

做

得

到

』

拆

開

來

評

估

，

是

讓

具

身

A

I

變

可

靠

的

必

要

一

步

。

對

關

注

機

器

人

與

具

身

A

I

的

人

，

這

提

醒

了

一

個

容

易

被

忽

略

的

代

價

：

把

通

用

大

模

型

特

化

成

專

用

執

行

者

，

往

往

要

付

出

通

識

退

化

的

隱

形

學

費

。

今

天

另

一

篇

h

f

論

文

談

a

g

e

n

t

的

程

序

記

憶

、

談

怎

麼

讓

技

能

累

積

不

流

失

，

這

篇

則

從

反

方

向

敲

警

鐘

—

—

特

化

的

同

時

別

把

根

基

掏

空

。

兩

者

合

起

來

看

，

指

向

同

一

個

核

心

命

題

：

A

I

要

真

的

好

用

，

得

同

時

管

好

『

學

到

新

本

事

』

與

『

別

忘

了

舊

常

識

』

這

兩

件

事

。

歸剛點評｜把通用大模型特化成會動手的機器人，往往要付『通識退化』的隱形學費——看似俐落卻可能違背常識。這篇把『知不知道』和『做不做到』拆開評估，是具身 AI 走向可靠的必要一步，也提醒所有做模型特化的人：別為了新本事掏空舊根基。

來源：Hugging Face Papers

同期其他文章

Anthropic 正式推出 Claude Science：把大模型搬進藥廠實驗室，鎖定新藥研發美方鬆綁出口管制，Anthropic 讓 Fable 5 全球回歸，並提議跨廠越獄評分框架 Cloudflare 出招逼 AI 付費：9/15 起，混用型爬蟲預設被擋在有廣告的頁面外 Gemma 4 上 Cerebras 衝到每秒 1800 token，讓即時語音 AI 真的能用隱私優先的 Venice AI 成獨角獸：6500 萬美元 A 輪、估值 10 億，年化營收破 7000 萬 Meta 也想把過剩 AI 算力變現，傳籌建雲端業務叫板 AWS、Google Cloud Google 的 agent 助理 Gemini Spark 登陸 Mac，能整理 Downloads、操作 Workspace SpaceX 傳有 AI 裝置原型，外形『很像手機』，疑為進軍無線通訊鋪路