美網 × IBM:體育大數據的「次世代」範本_風聞
体育产业生态圈-体育产业生态圈-商业改变体育,体育改变生活2021-09-14 03:26

今年的美網女單決賽,上演了一組「00後」之間的青春對話。華裔英國18歲小將拉杜卡努(Emma Raducanu)以6比4、6比3直落兩盤,擊敗了加拿大19歲新秀費南德茲(Leylah Fernandez),成為了自2004年莎拉波娃在温網封后以來,最年輕的大滿貫賽冠軍得主。
而與女子網壇一同進入「次世代」的,還有美網的數字化進程——在上一篇專欄《進軍NFT,美網也開始做數字周邊了》中,作者介紹了美網在NFT上的勇敢嘗試。在本篇文章中,作者將藉助美網✖️IBM合作的案例,更加詳細地闡釋美網如何用大數據,為賽事帶來了全新的觀賽體驗。
特約作者:陳天皓
在推出了賽事歷史上第一個NFT項目之外,2021年,也是美網和IBM一起合作的第30個年頭。
作為美網的官方雲服務和人工智能(AI)合作伙伴,IBM一直和美國網協(USTA)緊密合作,為全球超過1000萬網球迷開發和提供世界一流的數字體驗。這些體驗通過美網的官方應用程序和網站來提供給受眾,並通過IBM的混合雲技術進行支持,同時還融入了IBM Watson的洞察力。

在今年,IBM也在美網推出了一系列的新功能,其中包括世界上第一個基於人工智能的網球運動員排名——IBM Power Rankings。而IBM Watson則產生了一系列帶有預測性的比賽洞察,來幫助球迷將注意力集中在整個美網賽事最有趣的比賽上,並識別出潛在的冷門以及具有明顯上升勢頭的球員。
那麼下面就讓我們一起來看看,IBM都為球迷們提供了哪些全新的數字化體驗。
01
IBM Power Rankings
IBM Power Rankings,是一個由AI生成的球員每日走勢排名,可以幫助預測美網每場單打比賽球員獲勝的概率。
這個排名的算法,將球員最近的比賽得分和全面的數據統計分析,與IBM Watson Discovery的自然語言處理(NPL)能力相結合,來了解媒體對球員表現的評價,把球迷的注意力引導到最引人注目的比賽上。
該排名每天更新一次。在整體的頁面上,你可以看到每位球員的Power Ranking、單打世界排名、姓名以及國家/地區。

當點擊右側的下拉箭頭時,你可以看到每位球員更為詳細的信息。以下圖的新科奧運會冠軍小茲維列夫的數據為例:

在Power Ranking的詳細信息中,我們可以看到:
· 他在下一輪的對手將會是哈里斯(UPCOMING vs L. Harris)
· 在Power Ranking的決定性因素中,他在「最近比賽中的表現(Recent Performance)」和「媒體上的聲量(Media Volume)」這兩項都幾乎完全拉滿
· 媒體上對他的評價,處於一箇中立但略微偏負面的狀態
在界面右側,則顯示了小茲維列夫的Power Ranking隨時間變化的情況——他的Power Ranking從未跌落到第4位以下。同時,我們還可以看到他在8月31日、9月2日、9月4日和9月6日分別贏下了4場比賽。
而在Power Ranking中排名第7位的加拿大選手阿里亞西姆,呈現出的則是不一樣的信息:

· 他在「最近比賽中的表現」略差於小茲維列夫
· 在「媒體聲量」方面,他的影響力大概只有小茲維列夫的35%左右
· 媒體上對他的評價要比小茲維列夫正面很多
· 他的Power Ranking隨着時間不斷上升,從17位逐漸上升到第7位
如果球員尚未被淘汰,你可以在該球員的Power Ranking詳細信息頁面中點擊「Match Insights(比賽洞察)」來了解由IBM Watson提供的關於該球員即將進行的比賽的預先分析。
下面來詳細介紹一下「Match Insights with Watson」
02
來自沃森的比賽洞察
Match Insights with Watson
「來自沃森的比賽洞察」是通過人工智能技術生成的比賽指南,可以幫助球迷在美網的每場單打比賽前快速瞭解比賽對陣雙方的情況。
美網通過企業級的人工智能和IBM雲,來挖掘最新的球員數據統計和媒體評論,以獲得比賽洞察,其中包括了最新的IBM Power Rankings、來自各種媒體渠道的相關引述以及通過自然語言處理技術完成的關鍵致勝指標。
讓我們繼續以小茲維列夫為例,來了解一下比賽洞察的具體內容。

在前四輪比賽獲勝後,他在2021年9月7日的男單1/4決賽中面對南非選手哈里斯。基於Watson 的賽前分析,小茲維列夫有64%的概率會在這場比賽中獲勝。他的IBM Power排名是第1位,而對手哈里斯的排名是第6位。兩人的單打世界排名分別是第4和第46位。
在隨後的「In the Media(媒體評論)」板塊,呈現了媒體對兩位球員各3條的引述。這些引述是IBM利用其Watson Discovery平台,基於AI 的智能搜索和文本分析得到的。

接下來的「By the Numbers(關鍵數字)」,則是基於兩位選手在美網比賽中的詳細數據統計所得出的洞察。

其中,小茲維列夫的5個關鍵數字是:
· 截至第4輪,小茲維列夫在發球時的得分率是76%,在所有128名選手中排名第一
· 他的一發平均時速為127英里/小時(204公里/小時),是所有選手中發球時速最快的
· 在他的制勝分中,有41%來自於反手
· 小茲維列夫的二發得分率是60%,而哈里斯只有44%
· 他的反手製勝分得分佔到了總得分的4%,而哈里斯只有2%
而哈里斯的5個關鍵數字是:
· 截至第4輪,他的一發得分率是83%,在所有128名選手中排名第二
· 他在發球時的得分率是71%,在所有選手中排名第八
· 在哈里斯的制勝分中,有78%來自於正手
· 他的正手製勝分得分佔到了總得分的7%,而小茲維列夫只有6%
· 哈里斯的反手失誤佔到了總得分的4%,而小茲維列夫則佔到了5%
除了上面數字外,在不同選手間的比賽洞察中,還有諸如:Ace球佔比、平均一發時速、接發球得分率、破發成功率、上網次數佔比等眾多不同的數據。這些數據可以讓評論員和觀眾進一步瞭解選手的表現,增加他們對選手特點的認知。
同時,這些數據也會隨着選手的不斷晉級在每一輪後更新。因此每位選手在每場比賽中的洞察都會有所不同。
而所有這些數據和排名的基礎,都來源於IBM在每場比賽的現場專門安排的數據統計人員,通過專用的數據統計軟件來人工逐分錄入的數據。而IBM則通過專門開發的SlamTracker比分應用程序,來呈現這些比分和數據。
03
IBM SlamTracker
在2011年, IBM和美網共同開發了一款名為「PointStream」的應用程序,通過對數據進行可視化來呈現比分和數據統計。經過不斷地更新迭代,PointStream成為了現在的SlamTracker,而它的功能也一直在不斷地變化。
根據美網官方網站的描述:「IBM SlamTracker是美國網球公開賽首屈一指的比分應用程序。它提供了每場比賽的實時比分、數據統計以及逐分的深入分析」。

在SlamTracker上,我們可以看到對陣雙方選手的頭像、名字、比分以及這場比賽的項目、輪次、場地、比賽用時等基礎信息。
而除此之外,SlamTracker的下方共有四個部分來幫助球迷了解一場比賽的情況,分別是:比賽概況(Overview)、態勢分析(Momentum)、數據統計(Stats)和比賽洞察(Insights)。
a.比賽概況(Overview)
「比賽概況」的內容其實就是之前「來自沃森的比賽洞察」頁面中第一部分的內容。其中顯示了基於IBM Watson在賽前分析所得出的雙方選手勝率、IBM Power Ranking和選手的單打世界排名。而雙打比賽的「比賽概況」呈現的是對陣雙方球員的基礎個人資料。

b.態勢分析(Momentum)
「態勢分析」應該説是整個SlamTracker中,對數據進行可視化的應用典範。它顯示了隨着比賽不斷進行,球員得分勝負變化態勢的情況。
根據美網的描述,「這一功能可以直觀地描繪出比賽得分的態勢變化,讓你可以一眼看出哪方選手的態勢更好,以及整場比賽中態勢是如何變化的。」
通過觀察,筆者發現:代表雙方表現的態勢線條會從中間向贏得一分的選手一側繪製。而一方選手連續贏得的分數越多,態勢線條就越會向該方增長。
在「態勢分析」中,球迷可以通過縮放功能從三個不同的量級來了解得分的變化趨勢。
線條的顏色代表了這一分的得分方,藍色代表着左側的球員得到了這一分,而黃色代表着右側的球員得分
如上圖所示,最左側的圖只能看出最基礎的得分走勢;中間的圖則提供了更多細節,可以讓球迷得知一分是否為Ace球(A)、雙誤(D)、制勝分(W)、非受迫性失誤(U)和破發點(B)。
而最右側的圖,則提供了更多細節——當點開一分後,你會看到該分的開始時間,以及球員是如何贏下/丟掉這一分的。例如:小茲維列夫由於雙誤丟掉該分(A. Zverev loses the point with a double fault);小茲維列夫通過Ace球贏得該局(A. Zverev wins the game with an ace)。
當出現破發點時,「態勢分析」中還會給出「破發機會(BREAK POINT OPPORTUNITY)」的提示,來告訴你現在是哪方選手有機會破掉對手的發球局。
如果你點擊右上角的小齒輪,你還可以根據自己的需求,決定是否在主界面中顯示不同的關鍵分註釋,如下圖所示。

在比賽進行的過程中,「態勢分析」還會根據選手在剛結束一分中的發揮給出與該分相關的雙方數據對比。
例如在下圖中,我們可以看到,截止到第3盤比賽第8局比分為40:40時,小茲維列夫和哈里斯的制勝分分別為38和32個。而當你滑動下方的圓點時,數據會告訴你:小茲維列夫45%(17/38)的制勝分是Ace球,而哈里斯41%(13/32)的制勝分是Ace球。

通過這張圖,我們則可以看到:小茲維列夫的平均發球時速為193公里/小時而哈里斯的平均發球時速只有178公里/小時。小茲維列夫的最快發球時速是220公里/小時,最近一次發球的時速是207公里/小時,而哈里斯的最快發球時速是207公里/小時,最近一次發球的時速是183公里/小時。

除此之外,「態勢分析」還會展示球員在比賽中的移動數據對比。
例如下圖:截止到第3盤比賽第9局比分為30:15時,小茲維列夫的總跑動距離是4506.47米,平均每分跑動25.18米,而哈里斯的總跑動距離是4467.13米,平均每分跑動24.96米。和種子球員以及所有其他球員相比,兩人的跑動距離都略低於平均值。

所有這些額外的數據對比,都是IBM Watson根據比賽進程來自動實時計算並推送的。可以看出,儘管只是比分應用程序中的一部分,美網依然進行了很細緻和全面的工作,來為受眾提供更多信息。
c.數據統計(Stats)
在「數據統計」部分,提供了網球比賽常見的統計數據,包括了:Ace球、雙誤、一發得分率、二發得分率、破發成功率、制勝分、非受迫性失誤等等。
而點擊下方的「Full Stats」(全部數據統計),你可以看到更多更全面的與比賽密切相關的數據信息,一共分為五個部分:
· 總體數據(Overall Stats)
· 發球數據(Serve Stats)
· 接發球數據(Return Stats)
· 擊球數據(Rally Stats)
· 發球方向數據(Dir. Serve Stats)

總體數據中展示的,就是常見的網球數據統計。只不過在這裏,數據可以按照全場比賽和各盤來分別進行查看。
在發球數據的部分,可以看到雙方在發球方面的表現情況,其中包括了:Ace球、發球制勝分、雙誤、發球次數、發球得分、發球局數、平均發球時速以及最快發球時速。所有數據都按照一發(1st Serve)、二發(2nd Serve)和總計(Total)分別進行彙總。

接發球數據的部分也是類似,其中包括了雙方的:接發球制勝分(俗稱「Return Ace」)、接發球非受迫性失誤、接發球次數和接發球得分。這些數據也都按照一發、二發和總計分別進行了彙總。

而擊球數據的部分,則顯示了雙方選手在不同擊球類型下,正手(FH)和反手(BH)的制勝分、受迫性失誤和非受迫性失誤數量。這七種不同的擊球類型分別是:
· 隨上擊球(Approach Shots)
· 放小球(Drop Shots)
· 普通擊球(Ground Strokes)
· 挑高球(Lobs)
· 過頂球(Overhead Strokes)
· 穿越球(Passing Shots)
· 截擊球(Volleys)

如之前所述,在每場比賽中,IBM的數據統計人員都會在現場通過專用的數據統計軟件來人工逐分錄入比賽數據。而在每個對打回閤中,最後一拍的擊球類型和得分種類都是他們需要去進行統計的數據。
除此之外,數據統計人員還會通過雷達系統,捕捉球員的發球時速信息並記錄他們的發球方向——這也是「發球方向數據」的來源所在。
在發球方向數據的部分,我們可以看到兩位球員在最快發球時速、平均發球時速、發球得分、發球界內和Ace球的這5項數據與發球方向之間的關係。
這些數據會根據球員在平分區(DEUCE)和佔先區(ADVANTAGE)發出的是外角球(左)、追身球(中)和內角球(右)的不同來進行彙總。

通過這些數據,我們可以發現一些比較有意思的洞察,例如:小茲維列夫在這場比賽中的二發只發向了中路和內角,而他發出的內角Ace球數量要多於外角Ace球的數量。如果沒有SlamTracker的可視化呈現,普通球迷可能很難能夠通過這個視角來了解比賽。
d.比賽洞察(Insights)
SlamTracker在這裏也展示了與上文中「來自沃森的比賽洞察」一樣的內容,讓球迷可以在不需要切換頁面的情況下就能看到一場比賽的洞察內容,並且把其中的關鍵數字和球員在比賽中的表現進行比較。
04
總結
可以看到,在IBM的技術支持下,美國網球公開賽為全世界的球迷帶來了與眾不同的數字化體驗。而除Power Rankings、Match Insights和SlamTracker外,IBM還為美網提供了混合雲平台,並使用複雜的分析和機器學習能力來幫助識別和解決對美網數字平台的潛在威脅。
正如美國網協一樣,在很多其他行業大大小小的組織裏,人們也都在利用同樣的技術來進行數字化轉型,加速它們的創新步伐。
從網球(tennis)到電信(telco)、從硬地(hardcourt)到醫療(healthcare)、從正手(forehands)到金融服務(financial services),這些技術不僅改變了美網的觀賽體驗,也改變了世界。