More  

小編的世界 優質文選 家居

智能家居的突圍:什麼樣的NLP數據讓語音交互更智慧


2020年8月10日 - 家居小編 互聯網周刊 
   

互聯網周刊官方帳號

一方面,AI技術與家居生活應用的進一步結合,更催化了眾多行業標杆企業的飛速發展,諸如小米、百度等公司;另一方面,從嚴格意義上智能家居產品分類涵蓋了家電、娛樂、能源供暖、廚房用品、安全健康等,中國作為全球智能家居市場的發展重心,人們對於生活品質與家居產品體驗的追求也將不斷增加。由於智能家居多以房屋、住宅、社區為載體,應用場景相對更具集中性和確定性。例如小愛音箱一類的智能音箱產品,用戶可以與之進行多輪對話,同時可以對其發出語音指令控制,從而實現點歌、查天氣等操作。

某智能家居企業營銷策略總監表示,語音是最自然的人機接口,它可執行觸控及手勢做不到的免持操作,因此成為控制智能家居裝置的理想方式。除此之外,與繁忙的辦公室或嘈雜的街道相比,家庭是一個相當私人、安靜而封閉的場所,因而也較適合語音控制的使用環境,因此在家庭中采用語音控制可以說是順理成章。

這不得不提智能音箱背後的支撐——NLP(自然語言處理)技術。作為人工智能的一個分支,狹義的NLP(自然語言處理)是至使用計算機來完成以自然語言為載體的非結構化信息為對象的各類信息處理任務,比如文本的理解、分類、摘要、信息抽取、知識問答、生成等的技術。簡單來說NLP實際上就是人類語言和機器語言之間順暢溝通的橋梁。

場景化AI數據成NLP技術落地核心需求

應用於智能家居場景的NLP技術的兩大關鍵分別是算法和數據,算法往往是公開的,差異化更多地來自於場景化的高質量訓練數據,AI大牛沈向洋在演講中也強調:“在任何時候,構建AI都離不開數據,如何設計和構建負責任的AI,數據的來源至關重要”,可見AI訓練數據對技術落地的重要性。

事實上,越來越多的智能家居企業已經意識到了高質量NLP數據的重要性,並對AI技術和NLP數據提出了更高的要求。雲測數據總經理賈宇航在接受采訪時曾表示“圖像采標有很強的規則性,按照規範化的指導文檔工作即可,但NLP數據對應的是語言的豐富性,需要結合上下文等背景去理解和處理。”在高位提升這件事上,NLP數據更難。

尤其是智能家居頭部企業,為了保持自身的競爭優勢,就必須追求更高質量的、符合業務需求的NLP數據。因此,在AI產業蓬勃發展、市場競爭愈發激烈的倒逼下,符合企業需求的高標准NLP數據服務已成為行業頭部企業的剛需。

以智能家居領域頭部AI數據服務商雲測數據的“場景化”服務模式為例,其專精於場景化、高質量數據服務模式,正契合當下智能家居“大規模、小場景”的落地趨勢。

“大規模” 是指隨著B端和C端功能應用、渠道開拓、項目落地與場景應用逐步成熟,智能家居正步入大範圍爆發期;“小場景”是指體驗場景愈加聚焦。

具體到NLP,雲測數據的數據采集核心能力包括喚醒詞采集、控制詞采集、指定語料采集、人臉采集、情緒類型采集、中英文、國內各地方言、東南亞及歐洲、非洲小語種等采集類型,支持智能音箱、智能電視、智能掃地機器人等場景數據采集;數據標注核心能力包括人物語音轉寫、行為意圖、聲紋識別、領域識別、語句泛化、語義分割等標注類型,支持智能音箱、智能電視、智能掃地機器人等場景數據標注。

目前,雲測數據的人工智能數據服務團隊已經形成了一套包含任務分配、需求分析、需求確認、數據清洗、試標確認、進度控制、質量保障等流程的完整作業體系。比如雲測數據在語音、文本、圖片、視頻等類別標注上都設置了底層規則,並設有多次審核機制,再加上專業標注邏輯、思維和思考能力以及相關領域知識,從而高效輸出成一套高質、精准的智能家居數據解決方案。

以智能音箱為例。在雲測數據,以單個場景的意圖標注就分為10-20個大類,上百個子類,根據業務需求可能還會有進一步的標注細分。

除了對NLP數據進行對話意圖、領域、槽位等進行判斷和標注,多角度的泛化也必不可少。也就是說,無論用戶說的是地方話還是普通話,有沒有出現口誤,還是以不同的句子表達同一個意思,AI都能夠讀懂句子並給出正確的回答,這就要求NLP數據標注員對句子進行泛化,以不同的描述方式重組或擴充句式、標簽等,以提升AI對話的准確度。

除了業務能力的專業能力,雲測數據在軟硬件設施的持續投入、數據安全隱私方面也有自己的原則和技術保障。

強者恒強,頭部更多的選擇與頭部AI數據服務商合作

在雲測數據服務的眾多智能家居相關企業中,頭部企業占比達90%。這表明,在龐大的市場規模和市場需求下,與場景化、更高質量、更高准確度的AI數據服務商合作,已成為頭部智能家居企業推動應用落地的必然趨勢;

另一方面也表明,AI商業化對NLP數據的要求還在繼續提高,無論是在數據采集的樣本多樣性、場景多樣性方面,還是在數據標注的數據精度、領域知識方面,數據服務商都面臨不斷升級的業務難度。所以形成了企業和高質量的數據服務業務粘性來往很高。以雲測數據為例,一個項目在建立合作之後,往往會帶來長達2-3年的持續合作,這就產生了馬太效應,強者恒強。

如今,智能家居產業在政策紅利和藍海市場的雙重利好中迎來快速發展。咨詢公司A T Kearney的一項預測顯示,到2022年,亞洲的智能家居市場將增長到260億美元,到2030年將增長到1150億美元,占全球市場的30%以上。中國將成為亞洲增長的關鍵。而就智能家居現階段而言,“人工智能+家居場景”的智能化階段將呈現持續且長期的發展後勁。AI數據助力下,智能家居行業必定迎來強勁的增長,迸發出絢麗的火花。