在騰訊做只有10萬人用的產品,這羣工程師竟然還很高興_風聞
量子位-量子位官方账号-2022-01-15 13:49
魚羊 明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
用眼睛打字是一種怎樣的體驗?
用眼睛按順序盯一下鍵盤上的“a”、“l”、“g”,就能順利打出“奧利給”這個詞:

眼神示意鍵盤打出“我要”,輸入法立馬開始揣摩心意,推薦後文,同樣只要給到一個眼神,就能完成輸入。

這不是科幻片,也不是尚在實驗室裏的技術,而是已經有人實實在在使用的產品。

或許你會問,這不就是如今鍵盤打字的常規操作嗎?
但實際上,對於不能方便地使用普通鍵盤的人羣而言,這份我們習以為常的體驗卻已經等待了許久。
不動手,如何絲滑打字?
如果一個人口不能言,手不能動,那麼他該如何與外界交流?
近十年來技術的進步為這個看似不可能的問題提供了多個解決路徑——眼控設備目前是其中比較“平民”的一種。
簡單來説,眼控儀基於眼球追蹤技術,如瞳孔角膜反射技術(PCCR),能夠根據光源在眼睛中產生的反射圖像,通過角膜與瞳孔反射之間的角度來計算出眼動的向量,並由此判斷視線的方向。

**△**圖源:Tobii Dynavox
配合上虛擬鍵盤,眼球控制方案便提供了一種解決輸入問題的技術路徑。
但輸入的效率又該如何解決?舉個例子,要依靠眼控打出“涼爽(liangshuang)”這樣一個簡單的詞,就得盯着鍵盤完成11次點擊操作,這還只是沒有任何“誤看”的條件下,其效率可想而知。
具體操作感受如何,不妨盯着下面這個鍵盤直接感受一下:

不過,得益於技術的進步,目前眼動儀在輸入效率上已經有了很大的提升。
在硬件設備方面,以國際知名眼控儀廠商Tobii Dynavox的產品為例,他們對傳統PCCR遙測式眼動追蹤技術進行了改良——利用近紅外光源在用户眼睛的角膜和瞳孔上產生反射圖像,然後使用2個圖像傳感器採集眼睛和反射圖像位置,結合圖像處理算法和三維眼球模型,就能更加精確地計算出眼睛在空間中的位置和視線位置。
如此一來,對於一個熟悉眼控操作的用户而言,這樣的眼控儀支持最低0.1秒的注視時間設置。
最快只要盯住按鍵0.1秒,就能完成1次點擊操作。
解決了硬件的問題,想要進一步提升效率,減少操作步驟便成了最好的選擇,而這隻能從軟件側發力。
説起來技術方案很清晰:通過支持縮寫打字、智能聯想等等功能,提供更準確的候選詞彙,在減少輸入操作的同時,提升輸入的準確率。
事實卻並非如此,雖然市面上面向普通人的輸入法的技術方案已經非常成熟,但是想要在眼動輸入上覆制這些能力,依然存在不少障礙。
最主要的難點在於用户使用習慣的差異,對輸入法背後的語言模型、語料庫都提出了全新的要求。
再直白一點説,就是不僅算法模型得重新調參,語料庫往往也需要重新篩選整理。
以糾錯算法為例,對於普通的鍵盤輸入而言,由於打字通常比較連貫、速度較快,算法通常是聚焦於音節層來實現糾錯。
但對於眼動輸入這樣逐字符點擊的輸入方式,更多時候,錯誤會出現在字符層上。需要通過定位按鍵位置、聯繫上下文等方式,讓語言模型對錯誤輸入進行重新計算。
“把應該做的事情做了”
不難看出,想要做成眼動輸入這麼一件更多面向少數羣體的“小事”,並不是那麼容易。
作為科技觀察者,我們也不由好奇,研發團隊為何會關注到這樣“小眾”的需求?這並不符合商業邏輯,因為與投入相比收益幾乎可以忽略不計。
可真當我們聯繫上了背後輸入法方案的提供方——騰訊旗下的搜狗輸入法團隊,卻發現,站在他們自身的角度,這件事順理成章得有些不值一提。
總結起來就簡簡單單一句話,“把應該做的事做了”。
搜狗輸入法無障礙產品專家趙義濤解釋,一開始,他只是偶然看到了公司內網的一個帖子,內容涉及Tobii Dynavox正在尋求的輸入法技術助力:
搜狗輸入法有眼控儀版本嗎?
趙義濤當即產生了興趣。此前,他的團隊曾負責開發搜狗輸入法中點點輸入的功能——僅靠鼠標點擊就能實現高效打字,這同樣是一個面向特殊人羣開發的輸入方式。

****△點點輸入
Tobii是眼動控制領域的專家,他們缺少的是輸入法專家的幫助。搜狗做了15年輸入法,我覺得特別適合參與到這個項目當中。
雖然,按照互聯網的既有思考模式,“眼動輸入”這樣一個項目,無疑級別很低——相較於用户數量超過4.5億的搜狗輸入法本體,大多數無障礙輸入法服務的用户量級,可能也不過在十萬左右。
但趙義濤的想法,卻很快被推動着成為了現實。
甚至連一次程序員和產品經理之間的辦公室“battle”都沒有發生。
沒太考慮過有沒有搞頭的事情。覺得這是個好事,大家就非常快地投入進去了。
趙義濤的技術同事邵亞飛還透露,眼動輸入的需求過來的時候,他自身的工作排期其實已經比較滿了。
但這個事情本身很有意義嘛,就覺得自己總能抽出時間,把活兒扛下來。
無關於KPI,也無關於自上而下的壓力,這支團隊透露出的訊息,更多就是“這件事需要有人去做,我們又具備能力去做,於是自然而然就做了”。
甚至是這樣一種心態:
對的事我們看到了,就要去做,不能指望別人來做!
用科技的温度讓每個人發聲
正是抱有這種心態,在無障礙輸入方面,搜狗輸入法不僅做了眼動輸入,還推出了點點輸入、視障輸入、長輩輸入等一系列無障礙輸入功能。
與諸多動輒上億用户的應用相比,這些產品的DAU顯得有些微不足道——以上線2年為例的點點輸入為例,用户日均活躍度僅在10萬左右。
但就是10萬日活這麼一個並不亮眼的數字,讓趙義濤和他的同事們感到震驚。
因為,這個數字意味着,每天都有約10萬個人只能用自己有限的肢體能力一點點拖動鼠標、敲擊下自己心中的字符,才能與外界搭建起溝通的橋樑。
或許這還只是特殊人羣的冰山一角。
據統計,我國有超過8500萬特殊羣體,相當於德國全體公民的數量。其中有超過1700萬視障人士、超過600萬腦癱患者,且每年新增患兒達4.6萬。

在如此現實下,僅憑一個產品、團隊、公司“單打獨鬥”,多少有些勢單力薄,無法滿足整個社會的公益需求。唯有聯動更多方的力量,才能將這塊公益蛋糕做得更大。
搜狗輸入法及其背後的騰訊,作為率先在國內信息無障礙領域邁出一步的科技力量,顯然也想到了這條路。
最近,在中國殘疾人聯合會下屬中國殘疾人輔助器具中心的指導下,搜狗輸入法聯合深圳市信息無障礙研究會、全國殘疾人用品開發供應總站共同發起“眾聲無障礙輸入公益計劃”。
計劃包括兩部分內容。
一方面,將由中國殘疾人輔助器具中心和深圳市信息無障礙研究會專家、搜狗輸入法產品專家、各合作企業產品專家及各特殊羣體用户代表組成聯合調研專家組,針對特殊人羣生活交流需求進行深入調研,並形成公開報告,為行業內各類產品的無障礙優化適配提供參考,幫助產品更快速研發、更新、迭代。
另一方面,通過搭建無障礙輸入開放平台,向行業免費開放包括視障輸入、長輩模式輸入以及OCR讀圖、AI手語翻譯在內的技術方案,以降低行業重複“造輪子”的成本。
之所以大舉開放技術,原因只有一個:獨木不成林。
這也是此次騰訊發佈該公益計劃的最主要目的,就是期待發動行業內的力量,將搜狗輸入法在無障礙輸入上的經驗模式延續到更多被忽視的社會角落中去,讓更多特殊羣體能夠被社會看到、發出自己的聲音。
每個人都可能是“少數派”
倉廩實而知禮節。放眼當下我們不難發現,利用最前沿科技提高少數羣體生活質量,已經成為科技圈內的一種趨勢。
去年5月,腦機接口幫助截癱患者用“意念”打字曾登上頂級學術期刊《Nature》封面。
在這項研究中,一位已經喪失上肢能力十餘年的70歲癱瘓患者,在斯坦福大學腦機接口團隊的幫助下,可以用“意念”以0.5秒一個字母的速度輸出文字,正確率高達99.1%。
表面看,這一切聚焦的羣體並不“主流”,生活中並不常見。
但背後更深層次需要思考的問題是,在這個科技日新月異的時代裏,我們每個人都有可能成為“少數派”。
而這也是為何類似搜狗輸入法程序員這樣的舉動,會如此令人感慨。
因為當技術的目光聚焦向少數人後,其意義將不再侷限於一次產品開發、改善某個羣體的生活質量那樣單薄,而是透露出用技術填補社會差異鴻溝、讓人人都不被忽略的希望。
科技浪潮奔騰翻滾,希望再小眾的少數派,都不會被遺落在社會的角落裏。