兩篇 RAG 新論文同場較勁:用樹狀搜尋與主題羅盤,治長文件檢索的老毛病
檢索增強生成(RAG)——讓模型回答前先去資料庫撈相關片段——的成敗,很大程度卡在一個樸素問題:文件到底要怎麼切塊、怎麼找。切太細,檢索精準但搜尋空間爆炸、又慢又貴;切太粗,省事卻容易撈回一堆不相干的內容。Hugging Face 上兩篇新論文同場處理這道老難題:SproutRAG 與 MCompassRAG,各出一招。
SproutRAG 的做法是把長文件當成一棵樹,用注意力導引的樹狀搜尋搭配漸進式嵌入,在「檢索的細緻度」與「上下文的連貫性」之間找平衡,專治長文件容易顧此失彼的問題。MCompassRAG 則換個角度,把每段的主題中繼資料(topic metadata)當成一具「語意羅盤」,先用主題定向再做段落級檢索,目標是在不犧牲精準度的前提下,把搜尋的成本與延遲壓下來。一個從結構下手、一個從語意標籤下手,殊途同歸。
對台灣正在做企業內部知識庫、客服機器人、文件問答的團隊,這兩篇很接地氣。大家踩過的坑幾乎一模一樣:上傳一堆 PDF 與長文件後,RAG 不是答非所問就是慢到沒人想用,根子常常就在切塊與檢索策略沒做好。這兩篇論文未必能直接搬來用,但它們把問題拆解得很清楚,對自建 RAG 系統的工程師是很好的思路補帖——先把「怎麼切、怎麼找」想透,往往比換更大的模型更有效。
歸剛點評|RAG 是企業導入 AI 最常用、也最容易做壞的架構;這兩篇論文直指「切塊與檢索」這個最常見的失敗點,對所有自建知識庫與文件問答系統的團隊都有實用參考價值。
來源:SproutRAG · MCompassRAG