當前位置:首頁 > 科技創(chuàng)新 > 創(chuàng)新動態(tài)




近日,國務院國資委集中發(fā)布了首批10余個行業(yè)30項央企人工智能行業(yè)高質量數(shù)據(jù)集優(yōu)秀建設成果,中國電科司法領域高質量數(shù)據(jù)集成功入選。
中國電科在國務院國資委的指導下,以央企“AI+”專項行動為契機,以司法領域高質量數(shù)據(jù)集為抓手,全面推進人工智能科技創(chuàng)新、產業(yè)發(fā)展和賦能應用,已形成一批標志性成果,并賦能行業(yè)高質量發(fā)展。
最高人民法院聯(lián)合中國電科組建的中國司法大數(shù)據(jù)研究院是我國公共數(shù)據(jù)資源授權運營的先行先試單位,自成立以來便在司法領域高質量數(shù)據(jù)集建設方面積極探索。組建數(shù)據(jù)標注團隊,構建基于法律知識體系指引的數(shù)據(jù)標注系統(tǒng),通過“人機協(xié)同”方式,長期開展專業(yè)領域數(shù)據(jù)標注。以積累的“法律法規(guī)、司法解釋、指導案例、裁判文書”等作為基礎數(shù)據(jù)源,歸納形成包括“法律問答、法條推薦、案件認知”等在內的27類司法語料庫,共計550萬對精調語料,精心打造數(shù)億條知識條目,形成一套專業(yè)的法律大模型語料和知識庫。結合法律實務,發(fā)布法律大模型測試數(shù)據(jù)集,可在問題記憶、問題理解、邏輯推理、結論生成和內容安全方面對法律大模型進行全面的質量評估。
后續(xù),中國電科將聯(lián)合重點行業(yè)主管部門與產業(yè)鏈相關企業(yè),加快匯聚行業(yè)內跨區(qū)域、跨層級的通識類和專識類數(shù)據(jù)集,牽引帶動產業(yè)各方深化數(shù)據(jù)要素協(xié)同共享、優(yōu)化數(shù)據(jù)資源高效安全開發(fā)利用,加快推進高質量數(shù)據(jù)集落地驗證與迭代優(yōu)化,營造更加繁榮活躍的數(shù)據(jù)產業(yè)生態(tài)。