歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 11 期(2026-06-20)
產業・2026-06-20

Subquadratic 端出證據:宣稱解開卡了 LLM 近十年的數學瓶頸,從質疑聲中開始補上實測

Subquadratic 端出證據:宣稱解開卡了 LLM 近十年的數學瓶頸,從質疑聲中開始補上實測

總部在邁阿密的 AI 新創 Subquadratic 上個月才走出隱身狀態,開口就是一句大話:它解決了一個困住大型語言模型將近十年的數學瓶頸。所謂瓶頸,指的是主流 Transformer 架構處理長文本時,運算量會隨著序列長度呈平方成長,文本一長、運算與記憶體成本就暴衝,這也是長上下文又貴又慢的根本原因。公司名字裡的 Subquadratic(次平方)擺明了就是衝著這件事來的。

問題是,剛出場時它幾乎只有口號、沒有細節,學界與業界看過太多自稱顛覆架構、最後不了了之的案例,反應普遍冷淡甚至直接看衰。要把注意力的平方成本壓到次平方,過去十年線性注意力、狀態空間模型等路線都試過,效果與品質總是難兩全,外界的懷疑並非沒有道理。

這次的轉折在於 Subquadratic 開始拿出實測來回應。據 MIT 科技評論報導,公司陸續分享數據,想證明自己的方法在真實負載下站得住腳,而不只是紙上談兵。能不能複現、品質有沒有縮水、能不能撐到大模型規模,仍要等更多第三方驗證,但至少討論從「你在吹牛」進到「給我看數字」。

對使用端來說,長上下文的成本一直是 AI 落地的硬牆,從整本文件問答到長對話記憶都卡在這。若真有架構能把這道平方牆拆掉,受惠的會是整個產業而非單一公司。在被證實之前,保持期待也保持懷疑,是面對這類大宣稱最健康的姿態。

歸剛點評|長上下文的平方成本是 AI 變貴變慢的根因,任何能真正壓低它的架構都會牽動所有人的帳單。但歷史上這類大宣稱十之八九雷聲大雨點小,得等獨立複現才算數。

同期其他文章