我國推出新入門測試工具 助企業更安全部署生成式AI應用 | 聯合早報
zaobao
業界在部署生成式人工智能應用時,固然可以大幅提升工作效率,但若沒有發現一些重大風險,可能使用户信任、企業聲譽受損,甚至引發法律問題。我國發布全新生成式人工智能入門測試工具,在人工智能快速發展的大環境下,幫助企業更有信心、更負責任地部署大型語言模型的相關應用。
數碼發展及新聞部兼衞生部高級政務部長陳杰豪星期四(5月29日)在新加坡亞洲科技會展(Asia Tech x SG)的亞洲科技峯會(ATxSummit)上發表開幕主旨演講時,正式發佈生成式人工智能(GenAI)應用入門測試工具。
根據資訊通信媒體發展局的文告,工具由資媒局參考人工智能驗證基金會(AI Verify Foundation)與超過30家企業在全球AI安全保障試點計劃中的實地測試經驗,以及最新的研究成果整合而成。它為業界提供一套自願採納的測試指導方針,幫助開發者識別、解決生成式AI在實際應用中常見的四大主要風險:
1)模型生成不實、缺乏依據或不完整內容的幻覺現象(hallucination);
2)輸出對個人、社羣或公共利益造成傷害的信息等不當內容;
延伸閲讀
[社服機構推AI志願服務平台 為用户更精準匹配合適項目
](https://www.bdggg.com/2025/zaobao/news_2025_05_29_835734)
[能説多語懂方言查健康 升級版AI模型貼心看護年長者
](https://www.bdggg.com/2025/zaobao/news_2025_05_29_835649)
3)無意間泄漏個人或機構的敏感資料;
4)接到惡意指令(adversarial prompts)時,生成危險內容 。
“登月計劃”推進AI安全測試 我國邁向可持續AI生態
除了測試指導方針,工具也將配有多項可直接部署的測試工具,並逐步通過“登月計劃”(Project Moonshot)平台上線。現階段已有七項基礎測試可供使用,未來將根據公眾反饋持續增補。這份文件星期四起至6月25日,展開公眾諮詢,並將不斷完善更新。公眾可上資媒局網站查閲。
“登月計劃”是我國去年在亞洲科技峯會上推出的全球首個大型語言模型測試和評估工具之一,它不僅能在人機對話中識別含有暴力、煽動仇恨等不良的本土化內容,也體現我國在生成式AI領域前沿探索未知、拓寬邊界的勇氣和決心。
陳杰豪指出,人工智能發展雖帶來巨大潛能,但也引發對工作、經濟及社會影響的深層憂慮。因此,必須在信任的基礎上,發展可持續的AI生態系統。
陳杰豪説:“要充分發揮人工智能的效益,我們同樣須要賦能於人——無論是與AI互動的日常使用者、與它並肩工作的員工,還是能決策應用方式的領導者。”
他也宣佈,新加坡全國人工智能核心計劃(AI Singapore,簡稱AISG)與聯合國開發計劃署(UNDP)簽署諒解備忘錄,合作將“AI向善”計劃推廣至東南亞、加勒比海及太平洋島國等發展中地區。這一計劃原先於2024年在本地啓動,目標是提升全民AI素養,尤其惠及邊緣羣體與教育界。“人工智能不能只是強加在人們身上的技術,而應是他們能塑造、理解,也能從中受惠的工具。”
陳杰豪也提到,在全球AI安全保障試點告一段落之際,當局已整理出一份報告,總結企業與測試專家在實踐中的關鍵經驗。