祝恆書:智能招聘,用AI遇見最AI的你_風聞
青贝克智慧工场-2021-07-07 10:55
編者按:6月25日,數字時代的招聘進化峯會在北京香格里拉飯店成功舉辦。本次峯會由中國人力資源開發研究會指導,中國人力資源開發研究會智能分會主辦。百度人才智庫(TIC)主任、中國人力資源開發研究會智能分會常務理事祝恆書博士以《用AI遇見最AI的你:百度智能招聘技術與應用實踐》為題做了主旨發言,現場400餘人參加了會議,座無虛席、氣氛熱烈,同時有1萬餘人通過在線直播觀看了會議。以下為演講實錄:
祝恆書:非常感謝中人會智能分會舉辦的“數字時代的招聘進化峯會”,能夠讓我和大家分享一下百度過去幾年在智能招聘上積累的一些應用和實踐。
我今天的演講主題是《用AI遇見最AI的你》,事實上這是百度在2018年智慧校招項目上的一個宣傳標語,我們希望能夠通過用AI技術來幫助百度招到AI領域最優秀的人才。
百度為什麼會成為一家人工智能企業?
首先和大家再重新介紹一下百度,大家可能都知道百度是一家搜索引擎公司,或是一家移動互聯網企業,但事實上,今年3月百度在港股二次上市的招股書上,百度被正式定義為一家擁有強大互聯網基礎的領先AI公司。為什麼這麼説?
首先百度擁有大量用户粘性非常強的移動互聯網產品,比如百度地圖、百度APP、百度貼吧、百度網盤以及一些其他生態的產品,像愛奇藝等等。這些產品幫助百度積累了大量的用户和數據基礎,比如説百度APP的日活用户超過了2.3億,百度搜索每天響應來自於全球的數十億次搜索請求,百度地圖每天響應超過了1200億次的位置服務請求。基於這些強大的互聯網基礎,百度從很早就開始佈局AI業務,也非常榮幸的在2019年入選了由《哈佛商業評論》評選的全球AI 公司5強榜單,評委將百度稱為是一家全球領先的人工智能平台型公司,也是AI領域投入最早、技術最強、佈局最完整的企業。
AI是如何賦能企業智能化轉型的?
説到百度AI就不得不提到百度大腦,百度大腦是百度人工智能的一個集大成者。百度大腦是百度面向其生態合作伙伴,以及全球開發者提供的一個開放的AI雲平台。百度大腦目前包括了基礎層、感知層、認知層、應用層和平台層等不同層面的能力,貫穿其中的是百度的AI安全能力。
以基礎層為例,百度大腦覆蓋了我們經常説的AI時代的三大驅動力,簡稱ABC,A就是算法,B是大數據,C是算力。
具體來説,在AI算法領域,百度積累了大量人工智能的算法,包括自然語言處理、語音識別、知識圖譜、數據挖掘等,有了這些算法基礎、數據基礎和算力基礎後,百度就可以向生態合作伙伴以及全球的開發者提供各種各樣的開放AI能力。
目前從最底層的開源深度學習平台飛槳,到各種場景化的定製服務等等,百度已經向生態合作伙伴開放了數百種AI能力,開發者們可以基於百度的AI開放能力進行快速的產品開發,從而賦能其商業發展和企業數智化轉型。
去年,我們正式發佈了百度大腦智能招聘解決方案,這也是全球第一個真正的智能招聘綜合AI解決方案。目前該解決方案集成了簡歷篩選、人才評估、人崗匹配等一系列開放智能招聘AI能力。
為什麼百度要做智能招聘這個方向呢?事實上,這與百度自身的人才價值觀是一脈相承的。百度一直強調“招最好的人,讓優秀的人脱穎而出”。因此,百度希望用一些領先的技術手段去找到那些最適合百度的優秀人才。
從市場的角度來看,隨着大數據、人工智能時代的到來,出現了非常多像百度一樣的輕資產型公司,對於這樣的公司來説,人才就是其最核心的競爭力和最寶貴的財富,但對於優秀人才的招募也是非常困難的。
從供給側來看,整個就業市場是非常巨大的。根據官方數據顯示,全國就業人口大概有7.7億人,其中超過七成會在三年內更換工作,而七成中又有超過三成會在一年內更換工作,但即便有如此巨大的就業市場,招聘工作仍然非常費時費力。為什麼這麼説?
大家都知道招聘中一個詞叫招聘漏斗,從一開始的尋找(sourcing) 、篩選(screening)到最後發offer階段,其過程是一個漏斗結構。從數據來看,高科技企業的招聘漏斗比例通常是超過100:1,什麼意思?也就是説要招聘一個崗位,可能要篩掉超過100份簡歷,最終才發出一個offer,而且還有可能被候選人拒絕。所以這是非常費時費力的工作。但傳統的招聘手段又非常依賴於招聘專員和用人經理本身的專業能力,所以也存在着很多弊端,包括主觀經驗導向等等,這會讓很多優秀的人才成為滄海遺珠。
百度作為一家AI企業,希望通過技術的手段去賦能傳統的招聘,實現大數據、智能化的轉型,實現客觀、科學的人才招聘方式。
在招智能招聘方向上,百度最早從2015年開始佈局相關的技術積累。依託於百度自身強大的自然語言處理、機器學習等算法基礎,我們開發了一系列面向智能招聘的核心AI能力,包括崗位預測、技能抽取、簡歷解析,甚至是智能JD生成技術。同時還開發了簡歷畫像、人才搜索、人崗匹配等場景化的定製AI能力。
祝恆書
智能招聘的三類應用場景
目前,百度的智能招聘可以服務於企業招聘、獵頭招聘、校園招聘等不同的應用場景。接下來還將結合具體的三類招聘應用場景,講一下百度智能招聘的相關技術。
首先第一個場景是智能化的簡歷評估與篩選,這是招聘漏斗中從尋找(sourcing) 到篩選(screening)的第一個階段,此階段往往是招聘篩選比例最高的一個階段,也是最耗時耗力的一個階段。
在此階段,我們要如何快速的從大量的簡歷中篩選出優秀的候選人呢?
隨着現代信息化技術的不斷發展,以及大數據、人工智能的時代到來,崗位的專業技能會越來越細分、越來越專精,比如AI就可能細分成自然語言處理、數據挖掘、機器學習等不同的領域,這對於招聘專員本身的專業能力要求會非常高。因此整個簡歷篩選過程就變得非常費時費力,而傳統的招聘專員該如何來做?恐怕通常只能用一些硬性的規則去篩選。
比如校招,要看候選人的畢業學校是不是985、211?候選人的GPA(Grade Point Average,學習成績)怎麼樣?如果是社招,要看候選人是否來自大企業?這樣的形式從大概率來講是沒有問題的,但會埋沒許多優秀的人才,同時也不符合我們常説的“不拘一格降人才”的價值觀。
那百度想做的是什麼?即便這是大海撈針的工作,百度也希望做到大規模精細化的人才招聘,避免在人才的大海中出現滄海遺珠。因此,百度想通過技術的手段來幫助招聘專員進行快速的、智能的、精確的簡歷篩選。
為此,百度構建了全球最大的中文招聘類知識圖譜,這是幹什麼用的?核心是幫助企業在招聘工作中去構建不同的職位、不同的技能、不同的角色、不同崗位間的關聯性。
我們基於百度自身的豐富互聯網數據以及招聘數據,構建出了具有豐富實體和關係的招聘知識圖譜,包括崗位、領域、資格、技能、薪酬等實體,以及像同義詞、上下位、屬於等實體關係。
在構建知識圖譜的過程中,存在着非常多的技術挑戰。舉例來説,因為知識圖譜的構建是一個大規模的工作,且存在大量噪聲數據。因此我們也設計了許多人工智能算法來解決這些問題,比如我們最近提出了一種基於深度學習的實體關係補全模型,從而實現了招聘實體關係的精準預測,相關的成果也發表在了AI領域的頂級學術會議和期刊上。
基於這個招聘知識圖譜,我們下一步就可以構建一個智能化的簡歷畫像模型,去幫助企業進行快速的人才篩選。那該怎麼做呢?
有了知識圖譜以後,就可以對簡歷中的關鍵信息、多維度信息進行快速的、精準的、有效的抽取,然後再通過企業招聘工作中積累的歷史評測結果,就可以構建一個有監督機器學習模型對每一份簡歷進行打分,根據打分結果,對簡歷進行快速的篩選。
智能化的簡歷篩選模型,最後會取得什麼樣的效果?我們在百度內部做過一個測試,針對一批崗位通過AI算法推薦了100份簡歷,最終有81份簡歷發送了offer,效果非常好。相比於傳統招聘,智能簡歷篩選的效率超過了40倍。
第二個應用場景是如何通過智能方法進行有效的簡歷分發和崗位推薦。用專業名詞來説就是智能化的人崗匹配。具體來説,當有通過第一步的簡歷篩選後,我們積累了很多優秀的簡歷,以及成千上萬的崗位信息,我們希望進行多對多的、精準的人崗匹配,實現智能化的給人推崗和給崗推人。
舉個例子,比如我們要招一位數據挖掘方向的人才,但在招聘要求中或許只寫了精通數據挖掘這一個寬泛的要求。事實上,在候選人的簡歷中,通常不會直接寫精通數據挖掘,所以直接的關鍵詞匹配很難做到精準。因為真正懂數據挖掘的人可能會寫在一些大數據分析領域有過競賽、有過得獎,或者發表過相關論文,參與過相關項目。這些內容實際上就是與數據挖掘在語義層面構建了匹配。因此百度提出的全球首創的基於深度學習的人崗匹配模型,可以實現對招聘要求和候選人經歷進行語義層面的深度匹配。這個模型也發表在學界的頂級會議和期刊上,目前已經成為了學界和業界在智能招聘領域的標誌性模型。
我們把提出的深度學習模型在許多真實招聘數據集上進行了測試,均取得了遠超於經典機器學習算法的效果。同時深度學習模型還可以提供可解釋性的人崗匹配,比如可以告訴你在招聘過程中中最需要關注、最重要的崗位要求是什麼?以及候選人簡歷上的工作經驗中哪些能力、哪些經驗和相關的工作與崗位要求存在語義匹配。這樣就可以幫助招聘專員進行非常有效的高可解釋性的匹配。
相關的人崗匹配模型也在百度大腦的智能招聘平台上線,可以實現一對多和多對多的匹配,同時人崗匹配的算法也在百度內部和外部的招聘場景中得到廣泛的應用。
比如百度的內推系統和百度招聘平台,都用到了相關算法。不管是社招還是校招,只要候選人上傳了自己的簡歷,就會從百度發佈的上千個崗位中推薦出最合適的三個崗位,通過歷史數據回測來看,通過機器推薦的三個崗位進行投遞的候選人,入職率要遠高於自主投遞。
第三個場景是百度智能化的筆試和麪試評估場景。大家都知道在進入Gate階段的時候,需要對候選人進行能力評估和評測。而對候選人評估最有效的方法就是筆試和麪試,筆試多在校招場景下。但傳統的筆試和麪試都存在弊端,為什麼這麼説?
筆試是針對大規模候選人場景設置的,因此通常只能針對某一類特定的崗位進行通用化設置。比如説企業今年要校招,有幾十萬候選人,通常只能做到算法類是一套題目,運維類是一套題目,軟件工程師的題目可能稍微再細分一下,比如Java是一類,前端是一類等等。即便這樣依然不能做到真正精細化的評測。
隨着信息化時代的到來,招聘對於人才技能的要求越來越專精,例如數據挖掘可能細分到關聯規則分析、預測建模、機器學習等,其中機器學習有會包括有監督學習和非監督學習,還有深度學習等等不同的細分能力。同時,即便是同樣做人工智能算法,你用的是TensorFlow,我用的是PaddlePaddle(飛槳),每個人在技術上不盡相同。我們希望能夠對候選人進行個性化評測,實現千人千面、萬人萬面但又不失公平的一種筆試評測。
同樣,面試場景又非常依賴於面試官本身的專業素質,不同的面試官可能對候選人的關注點也是不同的,有的面試官可能重點考察候選人的崗位要求,有的面試官可能更關注候選人本身的項目經歷,而我們更希望能夠通過智能化的方法給面試官一些參考性的意見或決策支持。
我們希望實現真正的智能化、個性化、千人千面、萬人萬面的候選人評估和評測。基於此背景,百度構建了全新的、個性化的面試筆試問題推薦算法,其中推薦算法依賴於百度自己積累的評測結果及海量的互聯網大數據。本質上我們是構建了一個用於智能面試、筆試評測的技能知識圖譜,它會告訴我們在這次面試中最需要評估的技能是什麼,以及他們的重要性是什麼?
有了這樣的知識圖譜,再結合智能化的推薦系統算法,就可以實現個性化的面試、筆試評測的問題推薦。
相關的算法已經在百度的智慧校招項目中得到了廣泛的應用。從2018年開始,百度面向校園候選人提供了智能筆試龍虎榜這一產品。也就是在正式招聘筆試開始前,百度校招官網給候選人提供了一個智能筆試的機會。學生可以先上傳一份自己的簡歷,然後根據推薦的崗位進行投遞,這時算法會自動化生成10道個性化的筆試題目,每個人的問題都不一樣。當候選人完成試卷以後,得分能夠排在周榜前三名或總榜前50名就可以直通面試免筆試。通過歷史回測數據來看,通過智能筆試入選的候選人,在後續的offer轉化率、面試官評價等方面都取得了比傳統筆試要好的效果。
同時經過面試官的反饋,通過智能化、個性化的筆試使得候選人很難再進行簡歷造假。為什麼?因為一旦候選人在簡歷中寫了他不擅長的內容,那麼AI就會考察其相關的能力,這樣就會得到比較低的評分。如果候選人在簡歷中寫的比較寬泛,那麼考察就會非常寬泛,同樣候選人也不佔優勢。因此這個智能評測平台會幫助招聘官進行更有效的人才評估。
AI可能會取代你現有的工作
但也會給你推薦最合適的工作
基於剛才介紹的不同場景化技術,百度提供了許多智能招聘的產品,除了百度大腦的智能招聘解決方案,還開發了百度雲智學院才智中心,這也是全球第一個集AI+招聘+評測為一體的智能雲服務平台,希望通過這個平台去賦能企業人才招聘全面智能化。同時我們還打造了百度百聘的智能機器人——求職精靈,這個主要是面向C端藍領的招聘產品,通過算法給不同的藍領候選人推薦合適崗位。
智能招聘技術除了在招聘場景本身得到應用外,還可以把相關的技術延伸到其他領域進行人才評估,比如説對優秀的學術型人才進行評估。今年百度人才智庫(TIC)聯合百度學術、天津大學、中科大發布了全球AI華人新星百強榜,榜單是從全球範圍內篩選畢業時間不早於2020年的優秀華人學者,設置了自然語言處理、數據挖掘、機器學習和計算機視覺四大方向,每個方向選出最優秀的25名候選人。榜單的主要評測標準是基於我們開發的學術水平、學術影響力、學術潛力等智能評測技術。
百度智能招聘技術得到了國內外許多主流媒體的廣泛報道。其中一個國外媒體報道稱:“AI Could Take Your Job, But Baidu’s Newest AI Can Also Help Your Find One”。什麼意思呢?翻譯成中文就是現在大家現在都在鼓吹AI威脅論,説AI會取代大家的工作,但百度的AI技術可以幫助大家找到最合適的工作。我認為這是非常好的AI技術實踐理念,也非常符合百度作為一個高科技企業的企業社會責任。
謝謝大家。
(請關注青貝克公號:kingmaker798)