研究・2026-06-23

兩篇 RAG 新論文同場較勁：用樹狀搜尋與主題羅盤，治長文件檢索的老毛病

檢索增強生成（RAG）——讓模型回答前先去資料庫撈相關片段——的成敗，很大程度卡在一個樸素問題：文件到底要怎麼切塊、怎麼找。切太細，檢索精準但搜尋空間爆炸、又慢又貴；切太粗，省事卻容易撈回一堆不相干的內容。Hugging Face 上兩篇新論文同場處理這道老難題：SproutRAG 與 MCompassRAG，各出一招。

SproutRAG 的做法是把長文件當成一棵樹，用注意力導引的樹狀搜尋搭配漸進式嵌入，在「檢索的細緻度」與「上下文的連貫性」之間找平衡，專治長文件容易顧此失彼的問題。MCompassRAG 則換個角度，把每段的主題中繼資料（topic metadata）當成一具「語意羅盤」，先用主題定向再做段落級檢索，目標是在不犧牲精準度的前提下，把搜尋的成本與延遲壓下來。一個從結構下手、一個從語意標籤下手，殊途同歸。

對台灣正在做企業內部知識庫、客服機器人、文件問答的團隊，這兩篇很接地氣。大家踩過的坑幾乎一模一樣：上傳一堆 PDF 與長文件後，RAG 不是答非所問就是慢到沒人想用，根子常常就在切塊與檢索策略沒做好。這兩篇論文未必能直接搬來用，但它們把問題拆解得很清楚，對自建 RAG 系統的工程師是很好的思路補帖——先把「怎麼切、怎麼找」想透，往往比換更大的模型更有效。

歸剛點評｜RAG 是企業導入 AI 最常用、也最容易做壞的架構；這兩篇論文直指「切塊與檢索」這個最常見的失敗點，對所有自建知識庫與文件問答系統的團隊都有實用參考價值。

來源：SproutRAG　·　MCompassRAG

歸剛誒AI

兩篇 RAG 新論文同場較勁：用樹狀搜尋與主題羅盤，治長文件檢索的老毛病

同期其他文章