特斯聯公佈多項計算機視覺領域科研突破:含圖像識別和數據標註等
【環球網科技綜合報道】5月9日消息,近期,作為成渝地區東數西算的深度參與者,特斯聯對外公佈了其計算機視覺(CV)領域的多個科研突破,並有8篇論文被CVPR、TPAMI等頂級國際學術會議和期刊收錄。
此次,特斯聯在 CV 領域的科研突破涵蓋了語義分割、圖像增強、顯著物體識別、遷移學習、行為識別等方面。其中不少創新技術打破了現有技術上限,亦開發了數個性能更優、識別更快、效率更高的模型,這些技術研究的應用與推廣將會成為特斯聯賦能城市數字化、智能化的有力保障。
據介紹,特斯聯集團首席科學家兼特斯聯國際總裁邵嶺及其團隊在該領域中提出的圖像和視頻的識別和學習各算法,縮短了訓練和推理時間,從圖像識別提升、識別效率提升以及解決數據標註瓶頸三個方面,提升了整體視覺應用效果。
在圖像識別方面,團隊的技術突破主要集中在算法層面,囊括背景消除模塊、圖像特徵突出等。這些可以從圖像本質入手,豐富圖像本身信息,去除多餘噪點,為後續圖像識別提供高清的圖像數據,是高效率識別的基礎。更有技術突破採用創新的手法,如加上聲音信息來協助識別,提高信息準確度。
比如,在被收錄於CVPR的《Learning Non-target Knowledge for Few-shot Semantic Segmentation》(《學習用於小樣本語義分割的非目標知識》)研究中,團隊從挖掘和排除非目標區域的新角度重新思考了少樣本語義分割,繼而提出了一個新穎的非目標區域消除(Non-target Region Eliminating)框架,以確保模型免受背景和分散注意力目標的干擾進而獲得準確的目標分割結果。不僅如此,該研究還提出一個原型對比學習算法,通過精煉原型的嵌入特徵以便更好的將目標對象與分散注意力的對象區分開來。
另外,特斯聯方面指出,數據標註是一個重要的過程,傳統人工數據標註費時費力。為此,上述團隊提出了一種新技術以更高效地解決背後的問題。該研究被收錄於今年的CVPR中,標題為《Category Contrast for Unsupervised Domain Adaptation in Visual Tasks》(《視覺任務中無監督域適應的類別對比》)。
具體來看,團隊提出了一種新的類別對比技術(CaCo),該技術在無監督域適應(UDA)任務的實例判別之上引入了語義先驗,可以有效地用於各種視覺UDA任務。該技術構建了一個具有語義感知的字典,其中包含來自源域和目標域的樣本,每個目標樣本根據源域樣本的類別先驗分配到一個(偽)類別標籤,以便學習與UDA目標完全匹配的類別區分但域不變的表徵。與當下最先進的方法對比,簡單的CaCo技術可以實現更優越的性能表現,也可以成為現有UDA方法的補充,推廣到其他機器學習方法中去,如無監督模型適應,開放/部分集適應等。該技術解決了傳統監督學習需要大量人工標註的問題,比現有技術擁有更高的效率。