機器人學會動手後,還記得常識嗎?新研究量測 VLA 模型的知識流失
具
身
智
慧
的
V
L
A
(
視
覺
-
語
言
-
動
作
)
模
型
,
通
常
是
拿
一
個
本
來
很
強
的
視
覺
-
語
言
模
型
,
再
用
機
器
人
資
料
去
微
調
而
成
。
問
題
來
了
:
經
過
這
番
改
造
、
學
會
了
控
制
手
臂
與
感
知
環
境
之
後
,
它
原
本
那
套
常
識
與
事
實
知
識
還
剩
多
少
?
沒
人
說
得
準
。
而
且
當
模
型
在
需
要
知
識
的
任
務
上
失
手
時
,
往
往
分
不
清
是
它
根
本
不
知
道
,
還
是
知
道
卻
沒
能
力
執
行
—
—
兩
種
失
敗
混
在
一
起
,
很
難
診
斷
。
這
篇
論
文
正
面
處
理
這
個
模
糊
地
帶
,
設
計
方
法
去
量
測
V
L
A
模
型
在
適
應
機
器
人
任
務
後
的
常
識
與
世
界
知
識
到
底
保
留
了
多
少
。
之
所
以
重
要
,
是
因
為
一
個
會
動
手
的
機
器
人
若
在
過
程
中
悄
悄
流
失
了
對
世
界
的
基
本
理
解
,
它
做
出
來
的
動
作
就
可
能
看
似
俐
落
、
實
則
違
背
常
識
—
—
好
比
會
精
準
抓
取
,
卻
搞
不
清
該
不
該
抓
、
抓
了
會
怎
樣
。
把
『
知
不
知
道
』
和
『
做
不
做
得
到
』
拆
開
來
評
估
,
是
讓
具
身
A
I
變
可
靠
的
必
要
一
步
。
對
關
注
機
器
人
與
具
身
A
I
的
人
,
這
提
醒
了
一
個
容
易
被
忽
略
的
代
價
:
把
通
用
大
模
型
特
化
成
專
用
執
行
者
,
往
往
要
付
出
通
識
退
化
的
隱
形
學
費
。
今
天
另
一
篇
h
f
論
文
談
a
g
e
n
t
的
程
序
記
憶
、
談
怎
麼
讓
技
能
累
積
不
流
失
,
這
篇
則
從
反
方
向
敲
警
鐘
—
—
特
化
的
同
時
別
把
根
基
掏
空
。
兩
者
合
起
來
看
,
指
向
同
一
個
核
心
命
題
:
A
I
要
真
的
好
用
,
得
同
時
管
好
『
學
到
新
本
事
』
與
『
別
忘
了
舊
常
識
』
這
兩
件
事
。
歸剛點評|把通用大模型特化成會動手的機器人,往往要付『通識退化』的隱形學費——看似俐落卻可能違背常識。這篇把『知不知道』和『做不做到』拆開評估,是具身 AI 走向可靠的必要一步,也提醒所有做模型特化的人:別為了新本事掏空舊根基。