我國推出全新入門測試工具 助企業更安全部署生成式AI應用 | 聯合早報
zaobao
我國發布全新生成式人工智能的入門測試工具,在人工智能快速發展的大環境下,幫助企業更有信心、更負責任地部署大型語言模型的相關應用。
數碼發展及新聞部兼衞生部高級政務部長陳杰豪星期四(5月29日)在新加坡亞洲科技會展(Asia Tech x SG)的亞洲科技峯會(ATxSummit)上發表開幕主旨演講時,正式發佈生成式人工智能(AI)應用入門測試工具(Testing Starter Kit for GenAI Applications)。
根據資訊通信媒體發展局的文告,工具由資媒局參考人工智能驗證基金會(AI Verify Foundation)與超過30家企業在全球AI安全保障試點中的實地測試經驗,以及最新的研究成果整合而成。
工具旨在為業界提供一套自願採納的測試指導方針,幫助開發者識別、解決生成式AI在實際應用中常見的四大主要風險:
一、模型生成不實、缺乏依據或不完整的內容的幻覺現象(hallucination);
延伸閲讀
[本地自主研發醫療AI模型 白內障手術審核加快90%
](https://www.bdggg.com/2025/zaobao/news_2025_05_29_835645)
[升級版大語言模型MERaLiON 2.0 日後可用方言與年長者對話
](https://www.bdggg.com/2025/zaobao/news_2025_05_28_835507)
二、輸出對個人、社羣或公共利益造成傷害的信息等不當內容;
三、無意間泄露個人或機構的敏感資料;
四、接到惡意指令(adversarial prompts)時,生成危險內容的風險 。
除了測試指導方針,工具也將配有多項可直接部署的測試工具,並逐步通過“登月計劃”(Project Moonshot)平台上線。現階段已有七項基礎測試可供使用,未來將根據公眾反饋持續增補 。
“登月計劃”是我國去年在亞洲科技峯會上推出的全球首個大型語言模型測試工具之一。它不僅能在人機對話中識別含有暴力、煽動仇恨等不良的本土化內容,也體現我國在生成式人工智能領域前沿探索未知、拓寬邊界的勇氣和決心。
生成式AI應用入門測試工具,星期四起展開為期四周的公眾諮詢,並將不斷完善更新。
陳杰豪指出,人工智能發展雖帶來巨大潛能,但也引發對工作、經濟及社會影響的深層憂慮。因此,必須在信任的基礎上,發展可持續的AI生態系統。
他也宣佈,新加坡全國人工智能核心計劃(AI Singapore,簡稱AISG)與聯合國開發計劃署(UNDP)簽署諒解備忘錄,合作將“AI向善”計劃推廣至東南亞、加勒比海及太平洋島國等發展中地區。這一計劃原先於2024年在本地啓動,目標是提升全民AI素養,尤其惠及邊緣羣體與教育界。