應用AI人工智慧自動判讀起訴書類先導研究-以施用毒品罪為例

研究與服務方案
2022-05-23 14:15:07

顧以謙, 張道行, 許福元, 吳瑜, 林俐如, 宋曜廷, 李思賢;Yi-Chien Ku, TaoHsing Chang, Fu-Yuan Hsu, Yu Wu, Li-Ru Lin, Yao-Ting Sung, Tony Szu-Hsien Lee(2021年12月)。應用AI人工智慧自動判讀起訴書類先導研究-以施用毒品罪為例;A Pilot Study on the Application of Natural Language Analysis to Indictments for Drug Use Offenses。刑事政策與犯罪防治研究專刊,2021(30), 93 - 140。

摘要

有鑑於檢察書類文本蘊含豐富的研究資訊,如運用妥當,不但可協助犯罪防治與法實證研究回答關鍵研究問題,更可以作為政府推動以實證為基礎之刑事司法政策。但過去針對法律文本之研究,往往都係以人工逐一編碼之方式進行轉譯與分析,常耗費可觀之人力及時間成本。因此,本研究認以建置檢察機關書類自動判讀、辨識與編碼的人工智慧演算模型,對提升檢察實務與犯罪研究之效能,咸屬卓要。本先導研究以文本結構相對穩定、詞彙訊息量複雜度相對低的施用毒品罪起訴書類為基礎資料,進行透過人工智慧之自然語言分析,探索檢察機關起訴書類之文字自動化判讀與擷取編碼之可行性並嘗試建構斷詞與標記模型。本研究完成三項具體成果:1.建立適用毒品案件起訴書類之中文斷詞模型。2.開發起訴書類詞彙特徵之機器自動標記工具。3.設計毒品案件起訴書類之人工標記與檢視介面工具。此外,研究成果亦指出訓練人工智慧自動解構與解譯起訴書類內容之可行性相當高,若以可被歸責不一致率低於10%為標準門檻,則機器標記的達標率為85.2%、人工達標率則為70.4%,顯示機器標記之表現優於人工標記。在標記耗時上,計入人工進行機器訓練與測試時數後,機器標記較採人工標記之所耗時間約可縮減50%。因此預期,未來如持續累積、擴充資料性,機器自動化標記發展將可再大幅度縮減特徵標記時間,提升機器標記一致性。本研究建議持續挹注資源佈建與規劃,進行透過AI人工智慧自動判讀各項刑事犯罪案件起訴書類並進行標記之研究,以期在科技日益發展的未來,檢察機關可以運用AI人工智慧自動判讀技術,大量節省檢察書類之人工閱讀與編碼成本,幫助研究單位積累犯罪大數據、增進犯罪數據精緻性與擴充性,提升預測犯罪型態與刑事政策建議之效能。