陳根:模仿人類學習的機器學習,正融入人們的生活_風聞
陈根-知名科技作家为你解读科技与生活的方方面面。2021-07-19 09:57
文/陳根
機器學習是催生了近年來人工智能發展熱潮的最重要技術。作為人工智能的一個分支,機器學習也是人工智能的一種實現方法。
從廣義上來説,機器學習是一種能夠賦予機器學習的能力以此讓它完成直接編程無法完成的功能的方法。但從實踐的意義上來説,機器學習是一種通過利用數據,訓練出模型,然後使用模型預測的一種方法。
**早在1950年,**圖靈在關於圖靈測試的文章中就已提及機器學習的概念。
1952年,IBM的亞瑟·塞繆爾(Arthur Samuel,被譽為“機器學習之父”)設計了一款可以學習的西洋跳棋程序。它能夠通過觀察棋子的走位來構建新的模型,用來提高自己的下棋技巧。塞繆爾和這個程序進行多場對弈後發現,隨着時間的推移,程序的棋藝變得越來越好。
塞繆爾用這個程序推翻了以往**“機器無法超越人類,不能像人一樣寫代碼和學習”****這一傳統認識。**並在 1956年正式提出了“機器學習”這一概念。亞瑟·塞繆爾認為:“機器學習是在不直接針對問題進行編程的情況下,賦予計算機學習能力的一個研究領域”。
而有着“全球機器學習教父”之稱的湯姆·米切爾(Tom Mitchell)則將機器學習定義為:對於某類任務T和性能度量P,如果計算機程序在 T上以P衡量的性能隨着經驗E 而自我完善,就稱這個計算機程序從經驗E學習。
**如今,****隨着時間的變遷,機器學習的內涵和外延在不斷的變化。**普遍認為,機器學習的處理系統和算法是主要通過找出數據裏隱藏的模式進而做出預測的識別模式,是人工智能的一個重要子領域。同時,機器學習也是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。
機器學習****專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。機器學習從樣本數據中學習得到知識和規律,然後用於實際的推斷和決策。其和普通程序的一個顯著區別就是需要樣本數據,是一種數據驅動的方法。
機器學習與人類基於經驗的成長有異曲同工之妙。我們知道,人類絕大部分智能獲得也是需要通過後天的訓練與學習,而不是天生具有。在沒有認知能力的嬰幼兒時期,在成長的過程中嬰孩從外界環境不斷得到信息,對大腦形成刺激,從而建立起認知的能力。
要給孩子建立“蘋果”、“香蕉”這樣的抽象概念,需要反覆地提及這樣的詞彙並將實物與之對應。經過長期訓練之後,孩子的大腦中才能夠形成“蘋果”、“香蕉”這些抽象概念和知識,並將這些概念運用於眼睛看到的世界。
人類在成長、生活過程中積累了很多的歷史與經驗。人類定期地對這些經驗進行**“歸納”,獲得了生活的“規律”**。當人類遇到未知的問題或者需要對未來進行“推測”的時候,人類使用這些“規律”,對未知問題與未來進行“推測”,從而指導自己的生活和工作。
**機器學習就採用了類似的思路。**比如,要讓人工智能程序具有識別圖像的能力,首先就要收集大量的樣本圖像,並標明這些圖像的類別,是香蕉、蘋果,或者其他物體。然後送給算法進行學習(訓練),訓練完成之後得到一個模型,這個模型是從這些樣本中總結歸納得到的知識。隨後,就可以用這個模型來對新的圖像進行識別。
機器學習中的**“訓練”與“預測”過程可以對應到人類的“歸納”和“推測”****過程。**由此可見,機器學習的思想並不複雜,其原理僅是對人類在生活中學習成長的一個模擬。由於機器學習不是基於編程形成的結果,因此它的處理過程不是因果的邏輯,而是通過歸納思想得出的相關性結論。