歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 14 期(2026-06-23)
工具・2026-06-23

PP-OCRv6 開源:撐 50 種語言、最小只要 150 萬參數的 OCR

PaddlePaddle 在 Hugging Face 上釋出新一代開源文字辨識模型 PP-OCRv6,一口氣支援 50 種語言,模型大小從最小 150 萬參數到最大 3,450 萬參數分級提供。重點在「小」——最輕的版本參數量只有現在動輒上百億參數大模型的零頭,卻能做到多語文字辨識,意味著它能直接塞進手機、攝影機、掃描裝置這類算力有限的邊緣端跑。

OCR(光學字元辨識)是個聽起來老派、實際上撐起大量數位流程的基礎能力:發票辨識、文件數位化、車牌與招牌讀取、把紙本資料餵進系統,全靠它。過去要兼顧「多語言」和「輕量」很難兩全,大模型準但跑不動,小模型快但語言少。PP-OCRv6 把參數壓到百萬等級還顧到 50 種語言,等於把高品質 OCR 的部署成本往下砍一大截,也讓不想把資料上傳雲端、要求在本機處理的場景更可行。

對台灣的開發者與中小企業,這類開源輕量模型的價值很務實。繁體中文 OCR、混合中英數的單據辨識一直是在地剛需,一個免費、可自部署、跑得動在便宜硬體上的選項,能讓自動化財報、倉儲盤點、客服文件處理這些苦工的門檻再降一層。模型可商用與否要看授權細節,但方向很清楚:AI 的能力正在從「越大越強」往「夠小夠省也夠用」的另一端同時長出來。

歸剛點評|輕量、多語、開源的 OCR 是把 AI 塞進真實業務流程最實用的零件之一;PP-OCRv6 把部署門檻壓低,對需要在本機處理中英文單據的台灣中小企業特別有用。
來源:Hugging Face

同期其他文章