歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 25 期(2026-07-04)
工程・2026-07-04

一線團隊實測潑冷水:讓 agent 記住舊對話紀錄,對寫程式毫無幫助

一線團隊實測潑冷水:讓 agent 記住舊對話紀錄,對寫程式毫無幫助

工程師 theahura 發表了一個讓自己難堪的實測結論:只要 agent 已有其他形式的上下文,再給它搜尋過往 session 逐字稿的能力,在軟體工程任務上的效益是零;想自動爬逐字稿來改善 agent 上下文,只要沒有人類把關,同樣看不到什麼好處,數月的對照測試甚至顯示可能讓模型表現更差。

難堪之處在於他的公司就是圍繞這個概念建產品的,他曾經到處宣講「session 逐字稿是新石油」、比程式碼本身更值錢。業界同路人不少,常見架構是把全組織的逐字稿存進資料庫,前面架向量、全文或 SQL 檢索,野心大的三種全上再加知識圖譜,最後用 MCP 或 CLI 暴露給 agent——他的結論是這一整套在他們手上沒有產生差異。

他給的解釋是團隊真正在乎的是「工件」:程式碼、決策文件、可執行的產出,而逐字稿裡大量是探索過程的草稿與碎念,訊噪比太低。他的陰性結果恰好跟本期 HuggingFace 熱門論文 AutoMem 形成對話:後者主張記憶管理是需要訓練的技能,記什麼、何時取、怎麼組織都得學,而非把東西堆進資料庫就叫記憶。做 agent 記憶層的新創該把這兩篇並排讀。

歸剛點評|第一手陰性結果比十篇看多論文都珍貴,尤其出自一家押注在相反假設上的公司。給所有做「AI 記憶」的團隊一句話:存工件、別存過程。也提醒採購方:聽到「組織知識全部餵給 AI」的簡報,先問有沒有對照組。

同期其他文章