蔣國飛:高質量數據集應成為AI應用發展的重要支點
【環球網財經綜合報道】“目前在各行業領域,數據普遍存在分散化、碎片化、數量不足、質量參差不齊等問題,制約了人工智能技術在行業領域的深度應用與落地。”4月9日,在第十三屆中國電子信息博覽會上,中國電子信息產業集團首席科學家蔣國飛表示,隨着芯片供給、模型開源,各方優勢逐漸拉平,數據已成為人工智能競爭的核心戰場,以及推動人工智能發展的核心驅動力。
據悉,此次中國電子信息博覽會從智能終端、智慧家庭到低空經濟、特種電子,以及近期大火的機器人,近1200家企業展出的智能時代電子信息技術產品吸引了超8萬名專業觀眾的目光,也再次引發業界對人工智能和數據應用的密切關注。
近兩年,國家高度重視數據流通基礎設施建設,提出了數場、數聯網、數據元件、數據空間、隱私計算和區塊鏈六條技術路線,指導推動形成橫向聯通、縱向貫通、協調有力的國家數據基礎設施基本格局,打通數據流通動脈,暢通數據資源循環,賦能人工智能創新與數據價值深度挖掘,加速產業智能化升級與數字化轉型。
蔣國飛還認為,數據流通基礎設施可加速數據開放共享,而高質量數據集也應成為AI應用發展的重要支點。
“建設高質量數據集旨在將分散、雜亂、碎片化的原始數據,通過歸集清洗、加工標註、質量測評和語料管理等環節,加工成高價值、高密度、標準化的數據。”蔣國飛介紹,當前,高質量數據集建設正從勞動密集型轉向知識密集型,需依託三大技術路徑:智能標註提升效率與精度、數據合成解決稀缺性問題、質量評測保障數據可靠性。
談到高質量數據在高端智能產業的應用,蔣國飛表示,高質量數據集結合大模型與智能體開發框架可快速構建各類行業應用,賦能各行業數智化轉型。“目前中國電子高質量數據集方案已在交通、建築、農業等多個行業實現規模化落地,支撐客户訓練行業模型,構建智能問答、供需匹配、數字化決策等垂直領域AI應用。”蔣國飛還表示,未來,中國電子願與合作伙伴攜手,共同推進人工智能在各行業的蓬勃發展。