當前,人工智能正以前所未有的速度引領科技浪潮。除了顛覆行業,已經有越來越多的產品結合人工智能,集成了機器學習、計算機視覺、自然語言、語音識別等前沿科技??拼笥嶏w作為首批國家四大人工智能創新平臺之一,不斷賦能行業同時逐步走向消費者。技術頂天,掌握源頭核心技術并處于全球領先;應用落地,讓技術轉化為大眾切實可感受的產品。這是訊飛的價值觀堅守。如今,其AI核心技術開始深入各產業路徑,向核心節點邁進。
科大訊飛準備如何跟消費者走得更近呢?11月15日,科技部公布了首批國家人工智能開放創新平臺名單,科大訊飛與BAT一同成為AI四支“國家隊”,再一次確認了其在語音人工智能平臺上的霸主地位;11月22日早盤,科大訊飛市值突破千億大關。這似乎達成了科大訊飛的小目標。
作為“BATI”一個層級的企業以及看漲的股價,都讓訊飛從幕后走向了輿論的聚光燈下。不可避免的,科大訊飛受到輿論的關注和壓力。在一些人看來,與高市值相比,科大訊飛強于技術、規模夠大,但速度太慢。訊飛也注意到了這個問題,但訊飛的看法是,如果要做出改變,不是要離錢更近,而是要離消費者更近,要通過科技創新成為行業生態的核心節點。今年胡郁代表訊飛在外多次分享,除了介紹訊飛在人工智能上的思考以外,發言重點繞不開兩個關鍵詞——科技創新,消費者業務。
關于商業模式上的思考,胡郁在今年的一次公開演講里說了這么一番話,很耐人尋味,他說,“一個公司能夠賺到多少錢,跟你的努力程度有關系,但跟你公司在整個商業系統中的位置有絕對的關系。只有成為商業生態系統中的核心節點 (Keystone),整合各種資源并帶動整個系統的發展,實現共贏,才能夠成為真正偉大而有影響力的公司?!?/p>
在這一場呈現加速發展的人工智能浪潮中,聚焦點落在個體,關注到消費者,說明胡郁正在考慮如何優化訊飛的商業結構,特別是打通通向最終消費群體這條通路。而這條路,是一個科技創新型企業的必經之路。
看看幾十年前的英特爾和微軟,最初都只是圍繞為IBM提供技術的幕后角色。但真正成就兩家公司的,則是它們積極的推廣普通消費者可以認知并感受到的業務后,也就是我們熟悉的intel inside和Win95。
這對今天的中國科技企業同樣具有啟發,在中國大市場環境里,想做一個永遠在幕后、純而又純、美而又美的科技創新性企業(就像訊飛)實在是太難了。因為有時候你要開拓的市場里你就是絕對的前沿,只有你自己才能理解如何把科技創新變成商業價值。
再看看蘋谷微,目前至少在中文語音的人工智能技術上,這三家都不如科大訊飛,這是業內公認的。但不同的是,它們業務都離消費者更近,也有強大的賺錢能力和品牌號召力。訊飛的強勢在哪?行業應用上的不斷拓展,在前沿探索方面屢獲佳績。我們今天在中國使用的幾乎所有語音技術也基于訊飛的賦能,比如國家教育系統里的語音評測,幾乎陪伴每個人的高德地圖里明星語音導航也源于訊飛的語音合成技術。這就是訊飛的底氣,但現在的訊飛顯然意識到僅僅靠技術支持來開展業務還是不夠的,它要離消費者更近,要自己或通過行業賦能,直接地為消費者輸出價值。
眾所周知,訊飛已經是語音識別和人工智能方面的老大,但要進軍消費級市場就一定能成功?不妨看看剛剛成立一年的訊飛消費者事業群。
2016年底,訊飛面向消費者推出了訊飛曉譯翻譯機,訊飛萬物互聯輸入法,訊飛家庭智能盒子超腦魔盒、訊飛飛魚助理等一系列產品。到了2017年,消費者事業群進行了更深層次的商業邏輯梳理,用“四大場景”的說法,升級了以前的單品策略。
“未來是屬于會主動思考從而更懂每個用戶的終端產品”,胡郁最近在世界互聯網大會上說到。而這一切需要基于一個核心的人機交互系統——AIUI。雖然還不是一個響當當的名字,但已經在基礎語音語種識別基礎上支持主動式對話、語種自適應、多模態交互、個性化識別等進階能力,這些能力決定了當消費者與機器對話時,你的體驗能夠有多好,也將賦能翻譯、移動、車載、家庭四大場景。
京東上,訊飛曉譯翻譯機產品的評價數已超過6300條,滿意度98%,遠超過其他產品。在今年11月剛推出了曉譯翻譯機1.0+的升級版。很多人都覺得奇怪,為什么用智能手機可以實現的功能,要單做一個產品。其實,這就是典型的消費電子的產品邏輯,在面對典型、剛性的需求上,只要用戶體驗夠好,專用產品比通用產品能夠更深地切入市場,也能更快地進行針對性的迭代。
與智能音箱類產品不同,翻譯產品需要解決的是能否快速翻譯?翻譯效果是否準確?翻譯后的語句朗讀是否足夠本地化?這更偏向于智能語音綜合能力的集成創新,對源頭語音的識別和理解,乃至合成語音的專業考驗。而從2011年開始,第一個將神經網絡技術應用于智能語音領域、積累智能語音的有效大數據的訊飛而言,顯然是有備而來。除了做到利用源頭創新技術實現多場景識別,1.0+的訊飛曉譯翻譯機實現了離線翻譯、多語言、一鍵求助,滿足用戶在網絡不佳、場景變化下的個性化需求。一鍵求助能夠在3秒內和緊密聯系人或訊飛客服中心相連接,從而獲得幫助。
又比如移動場景,市面上幾乎所有支持中文語音輸入的輸入法,后臺上基本都是訊飛技術支持。目前訊飛輸入法已經擁有5億用戶,1.2億月活,98%通用場景準確率。但有一個問題,就是在中文語音輸入肯定會面對“同音字”的問題,加上一些標點符號或特殊字詞的問題,我們常常要手動去編輯語音輸入的詞句,大大降低了語音輸入的效率。這也成了訊飛的產品經理聚焦用戶體驗后發現的又一個突破口。于是訊飛輸入法誕生了一種叫『語音智適應』的黑科技,它基于用戶對識別結果的修正,即時優化用戶個性化語言模型,一次修改后,輸入法就能記住你的輸入習慣,進行自動矯正。
還有車載場景和家庭場景。目前幾乎是所有推出了語音識別的智能互聯車型中,都搭載了訊飛的飛魚系統,裝機量千萬,在線用戶量超300萬,語音月活90%以上。有一位資深的汽車行業人士告訴筆者,目前很多國際品牌的汽車在中國推出搭載智能系統的車型時,幾乎100%都要提到訊飛,因為它們在國際上找不到第二個供應商能提供這么完善的解決方案。特別值得一提的是,對于很多非飛魚系統的汽車,訊飛還推出了一個叫小飛魚的外設,可以輕松地賦能給原本不夠智能的汽車。
而在智能家居場景中,訊飛推出了魔飛麥克風系統,該開發套件采用立體構型、分布式拾音,并提供極簡開發以及更強的交互效果,還支持聲紋識別、手勢控制以及語音購物。當然,由于智能家居這個領域的玩家很多,解決方案和路徑又天差地別,所以訊飛還沒有做到一家獨大,但就技術層面來看,訊飛提供的賦能方案是最接近于自然應用體驗的。
從推出單品到場景化,我們看到的不僅是訊飛在消費者業務上逐漸有了一條清晰的思路,更重要的是,我們看到了『技術的訊飛』之中,崛起了一個『產品的訊飛』或者說是『消費者的訊飛』。
給整個訊飛消費者事業群提供有力支撐的,是訊飛在上下游的布局,尤其是以訊飛超腦誕生為時間標志的訊飛AI路線,其中的核心是從感知向認知的混合式躍進。那另一個問題是,技術和錢,對于訊飛究竟是什么樣的關系?
胡郁對此的闡釋是,“靠賣技術發展的科技創新型的公司,一開始離錢是非常遠的,只有兩種辦法才能改變自己的命運。第一,是從一個技術公司慢慢變成產品公司,產品公司慢慢變成品牌公司;第二,是發明一種可以顛覆原來產業的技術,產生一個新的生態,但這是可遇而不可求的事?!?所以,上游技術、中游產品,下游賦能,再從中再造生態,是訊飛消費者業務的邏輯鏈路。
從上游來看,整個訊飛都在探索未來的AI發展路徑。目前,正在從感知智能向認知智能飛躍的過程之中。而胡郁強調,語言是認知智能中最核心的東西,語音交互將繼續是訊飛的切口,下一步的突破,就必須是感知智能和認知智能組合的突破。
去年,在美國的CHiME Challenge英文識別大賽上,訊飛在三個比賽中全部取得了第一名;在今年的國際語音合成大賽上,科大訊飛再次獲得第一名;在TAC Knowledge Base Population知識推理大賽中,訊飛也取得了第一名的好成績……諸多的第一已經足夠證明訊飛的AI實力。
中游做產品。訊飛如果要做大消費者業務,并不能僅僅依靠事業群去直接驅動產品研發,即使有了一些突破,它的更大作用也不是現金收益,而是示范訊飛的技術應用和解決方案。真正要與訊飛強大、深厚的技術所匹配的消費級產品研發能力的培養,一定要建生態來解決??拼笥嶏w首屆全球開發者節,科大訊飛總裁劉慶峰站上舞臺,向臺下集結的程序員致意;我們還看到,訊飛將投入10.24億基金扶持平臺上的開發者,支持1024個項目來開放式探索人工智能教育,發布涉及人工智能生態、教育、公益三方面的1024計劃。據統計,目前AIUI平臺上的開發者團隊已經達到46萬個,日均交互次數達到40億,累計終端數達到12億。也就是說,如果有一天我們真正看到訊飛能夠在廣泛的消費場景中被應用,一定不是它自己的產品實現了全局覆蓋,一定是它和它的合作者和開發者團隊一起發力的結果。于是我們就會看到,無數的創業者會爭著和訊飛握手。對技術服務的增值充滿信心,大概是為何訊飛對于百度宣告基礎服務免費這樣的文字游戲表示從容的原因。
從某種意義上來講,訊飛未來消費者事業的發展需要摸索出一條全新的路徑,不僅僅是越來越多的智能產品打上訊飛商標,而是每一種智能設備都必須打上『訊飛 inside』的LOGO才能獲得消費者的認可的時候,才算是真正意義上的成功。
廣州財富論壇后,劉慶峰在朋友圈說了一段意味深長的話,“人工智能+時代,不僅是屬于科大訊飛的時代,更是屬于人工智能領域萬千開發者和科學家的新時代。這里空間廣闊,完全容納得下千帆競發的產業生態?!?/p>