放射科報告草擬改用「擴散式」語言模型:雙向塗改比逐字生成更合醫師工作流
擴散語言模型的生成方式跟主流的自迴歸模型完全不同:後者從左到右逐字吐出,前者則像在一張 token 畫布上雙向去噪,整段文字同時成形、可以就地塗改。HuggingFace 熱門論文指出,這條路線在通用領域已經追上自迴歸生成的競爭力,但醫療基礎模型至今幾乎全數停留在自迴歸架構,於是他們把一個混合專家的離散擴散模型改造到放射科場景。
選放射科報告當戰場很有道理:報告撰寫天然是互動式、反覆修訂的流程,醫師常常先有幾個確定的發現,再回頭補充措辭、修改結論。自迴歸模型改一處就得從那裡往後全部重生,擴散模型的畫布式生成則可以固定醫師已確認的片段、只重寫需要調整的區塊,跟臨床工作流的貼合度高出一截。
放射科是醫療 AI 滲透最深的科別,報告生成工具的競爭已經從「寫得出來」進入「改得順手」的階段。架構層的這一步棋提醒大家:自迴歸不是語言生成的唯一解,在需要局部編輯、結構約束的專業文件場景,擴散式生成的工程優勢正在浮現,法律與金融文件大概是下一批試驗田。
歸剛點評|「可以就地改」對專業文件是殺手級特性,醫師不想要重寫全文的助手,想要聽話的橡皮擦加鋼筆。台灣的醫療報告 AI 若還在純自迴歸架構上疊 prompt,值得把這條技術路線放進雷達。