歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 25 期(2026-07-04)
工具・2026-07-04

pxpipe:把上下文轉成圖片餵模型,token 帳單現砍六成

pxpipe:把上下文轉成圖片餵模型,token 帳單現砍六成

GitHub 專案 pxpipe 登上 Hacker News 熱榜,標題就是賣點:把程式碼轉成圖片讓模型自己 OCR,Fable 成本現砍六成。原理是圖片的 token 費用由像素尺寸決定,跟裡面塞了多少文字無關;實測在真實 Claude Code 流量上,程式碼、JSON 與工具輸出這類密集內容,每個圖片 token 可以裝下約三點一個字元,純文字則大約一個 token 一個字元,中間就是套利空間。

pxpipe 的形態是本機代理:請求離開你的機器之前,把其中肥大的部分——系統提示、工具文件、較舊的對話歷史——改寫成緊湊的 PNG 圖片。作者給的實例是約兩萬五千個文字 token 的內容,渲染成圖片後只剩約兩千七百個圖片 token,每個請求都對照 count_tokens 的反事實基準來計算省了多少。作者也強調省幅取決於工作負載,密集內容賺最多,稀疏或小型請求會原樣放行。

本站第 24 期才報過靠精簡輸出省下六成五 token 的「穴居人」skill,省 token 儼然成為 Fable 漲價前的全民運動。套利招式的風險同樣明顯:模型讀圖的理解品質是否與讀文字完全等價、計價規則哪天改成看圖片內容而非像素,套利空間都可能一夜蒸發。短期真香,長期別把架構押在計價漏洞上。

歸剛點評|用多模態計價規則反過來壓成本,是很漂亮的駭客思維,也反映 Fable 級模型的單價已經高到值得這樣折騰。可以拿去試,但要有隨時失效的心理準備;真正的長期解還是模型商把上下文計價做合理。

同期其他文章