工具・2026-06-23

PP-OCRv6 開源：撐 50 種語言、最小只要 150 萬參數的 OCR

PaddlePaddle 在 Hugging Face 上釋出新一代開源文字辨識模型 PP-OCRv6，一口氣支援 50 種語言，模型大小從最小 150 萬參數到最大 3,450 萬參數分級提供。重點在「小」——最輕的版本參數量只有現在動輒上百億參數大模型的零頭，卻能做到多語文字辨識，意味著它能直接塞進手機、攝影機、掃描裝置這類算力有限的邊緣端跑。

OCR（光學字元辨識）是個聽起來老派、實際上撐起大量數位流程的基礎能力：發票辨識、文件數位化、車牌與招牌讀取、把紙本資料餵進系統，全靠它。過去要兼顧「多語言」和「輕量」很難兩全，大模型準但跑不動，小模型快但語言少。PP-OCRv6 把參數壓到百萬等級還顧到 50 種語言，等於把高品質 OCR 的部署成本往下砍一大截，也讓不想把資料上傳雲端、要求在本機處理的場景更可行。

對台灣的開發者與中小企業，這類開源輕量模型的價值很務實。繁體中文 OCR、混合中英數的單據辨識一直是在地剛需，一個免費、可自部署、跑得動在便宜硬體上的選項，能讓自動化財報、倉儲盤點、客服文件處理這些苦工的門檻再降一層。模型可商用與否要看授權細節，但方向很清楚：AI 的能力正在從「越大越強」往「夠小夠省也夠用」的另一端同時長出來。

歸剛點評｜輕量、多語、開源的 OCR 是把 AI 塞進真實業務流程最實用的零件之一；PP-OCRv6 把部署門檻壓低，對需要在本機處理中英文單據的台灣中小企業特別有用。

來源：Hugging Face

歸剛誒AI

PP-OCRv6 開源：撐 50 種語言、最小只要 150 萬參數的 OCR

同期其他文章