SkillHone:讓 agent 靠『保留決策歷史』持續進化技能,而不是每次砍掉重練
A
g
e
n
t
技
能
(
a
g
e
n
t
s
k
i
l
l
s
)
是
替
語
言
模
型
a
g
e
n
t
加
上
特
定
任
務
的
程
序
、
腳
本
與
參
考
資
料
,
讓
它
更
會
做
某
類
事
。
但
這
些
技
能
要
對
付
的
任
務
和
環
境
會
一
直
變
,
昨
天
管
用
的
做
法
今
天
可
能
就
不
適
用
。
問
題
是
,
現
有
的
方
法
多
半
只
在
有
限
的
執
行
回
合
裡
改
進
技
能
,
而
且
只
保
留
最
後
那
個
成
品
,
把
過
程
中
累
積
的
決
策
歷
史
全
丟
了
—
—
偏
偏
那
段
歷
史
,
正
是
之
後
接
手
的
a
g
e
n
t
最
需
要
的
線
索
。
S
k
i
l
l
H
o
n
e
這
篇
論
文
要
補
的
就
是
這
個
洞
。
它
主
張
把
a
g
e
n
t
做
決
策
的
歷
史
持
久
地
保
存
下
來
,
讓
技
能
能
靠
著
這
份
不
斷
累
積
的
『
為
什
麼
當
時
這
樣
選
』
的
紀
錄
持
續
演
化
,
而
不
是
每
換
一
批
任
務
就
從
頭
再
來
。
這
等
於
把
a
g
e
n
t
的
成
長
從
『
一
次
性
優
化
』
改
成
『
可
累
積
、
可
承
接
』
的
長
期
過
程
,
讓
後
來
的
a
g
e
n
t
站
在
前
人
踩
過
的
坑
上
前
進
。
這
個
思
路
跟
M
a
x
手
上
『
歸
剛
誒
A
I
』
這
類
每
天
跑
的
排
程
其
實
很
呼
應
。
每
一
期
日
報
、
每
一
次
抓
取
與
部
署
,
背
後
都
有
一
堆
『
這
次
為
什
麼
這
樣
選
題
、
這
樣
改
流
程
』
的
判
斷
,
如
果
每
天
做
完
就
丟
、
只
留
最
終
成
品
,
累
積
的
經
驗
就
浪
費
了
。
S
k
i
l
l
H
o
n
e
提
醒
的
是
,
把
決
策
歷
史
留
下
來
當
養
分
,
A
I
系
統
才
會
愈
跑
愈
聰
明
,
而
不
是
原
地
打
轉
。
對
設
計
長
期
運
轉
的
自
動
化
流
程
的
人
,
這
是
值
得
借
鏡
的
架
構
觀
—
—
別
只
存
結
果
,
也
要
存
下
『
當
時
怎
麼
想
的
』
。
歸剛點評|別只存結果,也要存『當時怎麼想的』——SkillHone 點出 agent 進化的關鍵在保留決策歷史,而非每次砍掉重練。這跟 Max 每天跑的日報排程完全呼應:把選題與改流程的判斷留成養分,系統才會愈跑愈聰明,這是設計長期自動化流程的架構觀。