中國人工智能發展獲助力:公共數據可用於標註 | 南華早報
Mia Nulimaimaiti
中國首次發佈方案允許公共數據標註使用,旨在增強快速發展的數字經濟實力,並在國際競爭加劇背景下促進人工智能發展。
根據四部委週一聯合發佈的13點通知,我國將推進公共數據系統化標註利用,同時滿足農業、製造業、信息技術等重點領域的數據需求。
通知指出:"(政府應)支持公共數據跨部門、跨地區、跨層級使用;鼓勵政企合作開展面向政務領域的大模型數據標註訓練;推動將數據標註服務納入政府採購"。該文件由國家發改委、國家統計局、財政部及人社部聯合印發。
通知強調,公共數據標註工作應當依法有序開展。
數據標註——即對文本、音頻、圖像、視頻等不同數據類型進行分類標記的過程——通常被視為確保AI系統產出準確可靠結果的基礎。高質量數據短缺一直是開發大語言模型面臨的挑戰之一。
2023年,數據標註行業估值達到800億元人民幣(約合109.1億美元),該技術廣泛應用於推動自動駕駛、低空經濟、智能製造和智能醫療等前沿領域發展。
根據指導意見,中國承諾到2027年將數據標註產業的複合年增長率提升至20%。