LOCUS 把美國地方法規搬上機器可讀:補回法律 AI 一直缺席的市鎮這一層
法律 AI 的進展越來越依賴一件事:能不能大規模取得權威的法律文本。研究者點出一個長期被忽略的缺口——美國法律裡最貼近日常生活的一層,也就是市鎮級的地方法規(local ordinances),幾乎沒有以機器可讀的形式被收進現有語料。新提出的 LOCUS 就是針對這塊空白,建立一個涵蓋全美地方法規的語料庫。
別小看這層法律。地方法規管的是分區、住房、營業執照、公共衛生這些直接影響每個人生活的事,對一般民眾的實際約束力往往比聯邦大法更近。可是它分散在成千上萬個市鎮、格式雜亂、許多還埋在 PDF 或紙本裡,難以彙整。正因為蒐集成本高,過去的法律語料多半繞過它,導致法律 AI 在面對「我家這條街能不能開店」這種問題時,根本沒有可靠的資料底子。
把這層法律數位化、結構化,意義在於替後續所有研究與應用打開一塊地基。有了乾淨的地方法規語料,模型才談得上回答在地化的法律問題、做合規檢查或輔助查詢;少了它,再大的模型也只能在缺料的情況下硬猜。開放這類權威語料,本身就是讓法律 AI 從「看起來會」走向「真的查得到」的關鍵一步。
對台灣的法律科技團隊,LOCUS 是一個方法論上的提醒:與其追逐更會聊天的助理,不如先把在地、零散卻關鍵的法源整理成可用資料。在法律這種領域,資料的齊全與權威,往往比模型本身更決定成敗。
歸剛點評|地方法規對一般人的約束力其實最近,卻一直缺機器可讀版本。把這塊補上,法律 AI 才從『看起來會』走向『真的查得到』。資料齊不齊,在法律領域比模型大不大更關鍵。
來源:LOCUS 論文