捷通華聲發佈靈雲離線式語音識別技術
10月18日,捷通華聲宣佈正式推出靈雲離線式語音識別(ASR)技術,該技術能力已在靈雲智能人機交互能力開放平台(簡稱靈雲平台)正式上線,用户可以到靈雲平台(www.hcicloud.com)下載、體驗、使用最新靈雲離線式語音識別技術。
靈雲離線式語音識別技術將包括詞表識別、語法識別、“自由説”識別三個部分,由於採用了最新算法、引擎設計,識別率取得突破性提升,其中詞表識別和語法識別離線語音識別率已提高到97%以上。同時,在即時率、加載時間和資源佔用率等技術性能均得到大幅優化,能夠很好滿足目前各種移動終端的應用需求。靈雲離線式語音識別技術主要應用於各種移動終端,保證用户在無網絡環境下依然可以應用語音識別技術,應用語音流暢地與各種數字設備進行溝通交流。
語音識別技術由於運算量大,目前應用語音識別技術各種智能移動終端與應用多采用“雲“端語音識別技術服務。由於現實生活工作中,網絡並不能覆蓋所有環境,同時很多用户也擔心流量增加導致使用費用的增長,因此完全依賴“雲”端語音識別技術造成了用户的很大的不便。靈雲離線式語音識別技術,是靈雲平台“雲”端語音識別技術的延伸,該項技術的推出,將有效幫助用户擺脱應用語音識別對“雲”端的完全依賴,滿足用户在沒有網絡的環境下,仍然能夠方便使用語音識別技術能力。全新的靈雲離線語音識別通過在智能移動終端中加載離線語音識別引擎、離線語音包,對語音進行本地化聲學模型、語言模型的處理,從而使各種智能移動設備實現本地化應用和語音識別技術的需求。此次採用全新引擎的靈雲離線式語音識別技術,具有識別率高、識別速度快、低運算資源佔用、低內存消耗的特性,能夠滿足更多終端設備的使用,保證用户更好的在無網絡狀態下應用語音識別技術的體驗與感受。
靈雲--全方位智能人機交互(HCI)能力開放平台是捷通華聲全力打造的HCI技術雲服務平台。靈雲是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數字設備的網絡雲服務,其目標是讓人機交互像人與人溝通一樣的簡單自然。靈雲目前以“雲 + 端”方式,為用户提供語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)和自然語言理解(NLU)五項核心技術能力,是目前中國、乃至世界第一個也是最大最全的HCI技術雲服務平台。靈雲平台致力於面向中國,未來能夠向國際市場提供一個全方位HCI技術能力提供、HCI技術服務、HCI產業交流的平台。
面對移動互聯網產業的高速發展,為全面滿足用户需求,捷通華聲靈雲平台面向開發者提供包含“雲 + 端”語音識別與“雲 + 端”語音合成一體化智能語音解決方案,不僅能夠全面系統地滿足企業與設備開發商的需求,也同時能夠更好地為用户提供個性化的服務,滿足用户使用不同設備、在不同應用場景下,享受智能語音交互技術帶來的方便與快捷。
目前,包含靈雲離線式語音識別在內的靈雲智能語音解決方案,已經為百度地圖、導航犬、搜狗語音助手、嘀嘀打車、搖搖招車、快説語音助手等深受億萬大眾歡迎的眾多應用提供智能語音能力支持服務。為更廣泛應用智能語音技術,靈雲平台同時為智能家電、車聯網、可穿戴式設備等領域的用户提供定製智能解決方案。相信此次靈雲離線式語音識別技術的推出,必將更進一步為企業、社會大眾提供更為豐富、更為全面的智能語音技術服務。
更多詳情請登陸,靈雲智能人機交互能力開放平台:http://www.hcicloud.com(記者 凡易)