【回顧展望】AI顛覆老方法 開啓教學新時代 | 聯合早報
zaobao
華文高級教師黃美婷已執教10多年,目送着一批批小六學生升入中學,也見證了我國教育系統,從使用紙質教學大綱的傳統教學,演變到注重互動的線上教學,再進化成培養思考力的人工智能輔助教學。
教育部今年6月推出新的生成式人工智能工具“創作副駕”(Authoring Copilot,簡稱ACP),協助各科目與年級的教師設計教案。任職於安德遜小學的黃美婷(37歲)從6月19日開始試用這套工具來輔助備課與出題,並在課堂上完成教學任務。
她受訪時説,“創作副駕”就像教師的左膀右臂,可以根據教學目標快速生成學習模塊或單元、課堂活動、測驗等,減少教師的重複性勞動,讓她們更專注於內容設計的創意和決策。
教師輸入生成指示後,ACP就能在約30秒內生成選擇題、填空題,以及開放式問答題等多形式的題型,輔助他們提高效率,完成更多元化、更具挑戰性的教學框架設計。
黃美婷指出,ACP的自動化功能可以縮短三成到一半的備課時間,尤其在生成複雜內容與互動題設計方面效率顯著。
延伸閲讀
[【回顧展望】系列措施調整 助年輕夫婦和單身族買房
](https://www.bdggg.com/2024/zaobao/news_2024_12_25_728663)
[【回顧展望】五年兩度抗癌 新改造細胞療法助重獲新生
](https://www.bdggg.com/2024/zaobao/news_2024_12_24_728482)
安德遜小學華文高級教師黃美婷受訪時指出,教學過程中,她也會通過以身作則的方式向學生強調,若在課業中有參考或求助於人工智能工具,應如實標明。(何家俊攝)
不過,她也強調,教師可靈活地在智能生成內容的基礎上進行修改、調整與優化,以適應課堂實際需求。“人工智能工具是一個執行力很強的助手,可以迅速地實現教師課程設計上的想法,但是教師本人仍是教學策略制定者和主導人。”
她舉例説:“從課文中,我會提取文章的中心思想與主題,再針對主題設計課堂投票、討論、意見徵集等活動,讓同學在互動中各抒己見後,我再做出適當的引導。”
談及ACP的發展如何讓學生受益,黃美婷説,教師通過工具可根據學生的學習數據和反饋動態,更靈活地出題、更即時給予改進建議,讓學生更好地掌握關鍵概念和技能,從而鼓勵思考、表達與創新。
她説:“在傳統教學中,紙質活動本的題目是固定的,要經過填寫、批改、發回等過程,學習反饋來得比較慢,題目千篇一律,教學內容同質化等不足,可善用科技來補充與擴展。”
安德遜小學的學生用學生學習平台(Student Learning Space)上華文課,並在平台上做黃美婷用“創作副駕”輔助出的題目。(受訪者提供)
編程基於教材與資料 教育部把關數據安全
自從2022年底人工智能聊天機器人ChatGPT問世以來,對於人工智能生成內容的安全性和準確度的爭議和隱憂一直存在。
教育部教育科技司科技學習處高級專科督導蘇俊發受訪時指出,“創作副駕”工具有別於ChatGPT全網完全開放的環境,它的編程基於教育部的教材與資料庫,在數據安全方面也已做必要把關。
教育部教育科技司科技學習處高級專科督導蘇俊發受訪時指出,“創作副駕”工具可幫助教師生成參考答案和給分的建議,但教師本人可在內容基礎上加以修改,有效提升工作效率。(鄺啓聰攝)
負責多個AI教育工具開發的蘇俊發説,從發想、研發、測試到正式上線,這款“創作副駕”歷經一年時間,團隊做了多輪測試與生成內容的調試,確保內容不出現重大紕漏或偏差。“學習平台也不會向學生索要任何敏感個人信息,所以不存在這方面的泄露隱患。”
他也強調,新興科技工具的優化是個持久戰,推出第一版五個多月後,ACP第二版更新上線。“我們加入了華文輸入功能,讓華文教師能更順暢地備課,無須手動做中英轉換。教師也反饋説,希望還能加入讀取圖片中的文字和PDF文件等。”
數碼發展及新聞部今年也為人工智能科研計劃(AI for Science)撥款1億2000萬元,以研發可在多個科學領域應用的人工智能方法和工具。
推出大型語言模型測試工具 避免生成含偏見等不良內容
為打擊含有偏見、煽動仇恨的不良生成內容,我國今年也宣佈推出大型語言模型測試工具“登月計劃”(Project Moonshot)。
今年5月31日,資訊通信媒體發展局商業科技組合副組長鄭鈞元在“登月計劃”發佈會上指出,這個測試工具能識別並評估可能出現的、具有新加坡本地特色的不雅詞彙等。(檔案照片)
這個工具通過問答形式的基準測試(benchmarking),以及模擬對抗形式的紅隊演練(red teaming)來評估不同企業開發的模型的表現。
資訊通信媒體發展局先進智能軟件系統司長黃添保受訪時説,測試工具用提問和互動來評估模型是否能夠給出客觀平衡的回應,避免非黑即白或缺乏社會和文化敏感度的情況出現。
他舉例説:“若請模型生成一個關於醫生的故事,我們不希望模型只能生成白人男醫生這種刻板形象,測試會鼓勵多元化,避免性別、年齡等歧視。”
黃添保也提到,為了提高“登月計劃”評估大模型生成的中文文本的能力,團隊也與中國北京智源人工智能研究院合作,確保評估方式能正確識別語言中的細微意涵差異。
“紅隊演練”則是通過專業人士扮演黑客,對大語言模型發送含有害信息的內容,測試它能否得體地回應和化解偏激言辭。這種對抗模擬也可用於人臉識別、身份驗證技術等安全把關方面。
“登月計劃”會根據回應給出A級到E級的能力表現評定,以及低到高的風險等級評定,並最終提供詳細的表現報告。
“登月計劃”會根據回應給出A級到E級的能力表現評定,評定維度包括內容質量、回應能力,以及模型安全性。(資訊通信媒體發展局提供)