工程・2026-07-04

一線團隊實測潑冷水：讓 agent 記住舊對話紀錄，對寫程式毫無幫助

工程師 theahura 發表了一個讓自己難堪的實測結論：只要 agent 已有其他形式的上下文，再給它搜尋過往 session 逐字稿的能力，在軟體工程任務上的效益是零；想自動爬逐字稿來改善 agent 上下文，只要沒有人類把關，同樣看不到什麼好處，數月的對照測試甚至顯示可能讓模型表現更差。

難堪之處在於他的公司就是圍繞這個概念建產品的，他曾經到處宣講「session 逐字稿是新石油」、比程式碼本身更值錢。業界同路人不少，常見架構是把全組織的逐字稿存進資料庫，前面架向量、全文或 SQL 檢索，野心大的三種全上再加知識圖譜，最後用 MCP 或 CLI 暴露給 agent——他的結論是這一整套在他們手上沒有產生差異。

他給的解釋是團隊真正在乎的是「工件」：程式碼、決策文件、可執行的產出，而逐字稿裡大量是探索過程的草稿與碎念，訊噪比太低。他的陰性結果恰好跟本期 HuggingFace 熱門論文 AutoMem 形成對話：後者主張記憶管理是需要訓練的技能，記什麼、何時取、怎麼組織都得學，而非把東西堆進資料庫就叫記憶。做 agent 記憶層的新創該把這兩篇並排讀。

歸剛點評｜第一手陰性結果比十篇看多論文都珍貴，尤其出自一家押注在相反假設上的公司。給所有做「AI 記憶」的團隊一句話：存工件、別存過程。也提醒採購方：聽到「組織知識全部餵給 AI」的簡報，先問有沒有對照組。

來源：12 Grams of Carbon

歸剛誒AI

一線團隊實測潑冷水：讓 agent 記住舊對話紀錄，對寫程式毫無幫助

同期其他文章