8月8日,捷通華聲宣布,靈云開發(fā)者社區(qū)(www.hcicloud.com)全面開放語音合成、語音識別、手寫識別、OCR等多項HCI技術能力。
靈云是捷通華聲于2011年推出的國內第一個全方位智能人機交互(HCI)技術云服務平臺。伴隨著移動互聯(lián)網、云計算等產業(yè)的崛起,HCI、大數(shù)據(jù)處理等新興技術日益對各行各業(yè)的創(chuàng)新與發(fā)展起到了重大的推動作用。靈云順應產業(yè)發(fā)展,其架構設計與應用服務目標:用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數(shù)字設備的網絡云服務,讓人機交互像人與人溝通一樣的簡單自然!
無論是企業(yè)開發(fā)者還是個人開發(fā)者,均可以通過注冊進入靈云平臺世界,在靈云社區(qū)內可以自由選擇能力,并下載相應的SDK包,在開發(fā)過程中可通過社區(qū)獲得穩(wěn)定的技術支持。靈云平臺的最大特點之一,同時提供云+端服務,開發(fā)者根據(jù)實際應用需要,選擇云端服務與客戶端應用,極大地方便了企業(yè)與個人開發(fā)者在產品開發(fā)中的發(fā)揮空間。
靈云語音合成(TTS)技術能力中,包括豐富的語音庫,支持普通話、粵語、英文等多鐘語言,并可根據(jù)產品的形態(tài)特點選擇男聲、女聲、童聲庫。靈云還可定制個性化的語音庫,滿足不同地區(qū)不同人群需求,實現(xiàn)從文本到聲音的完美轉變;靈云語音識別(ASR)技術,具有快速且識別率高的語音識別功能,云端支持百萬級詞條識別,采用一流的壓縮方式,節(jié)約開發(fā)者流量;靈云手寫識別(HWR)技術,支持87種國家的語言書寫,流暢的漢字疊寫、行寫識別為捷通華聲擁有的專利技術;靈云光學字符識別(OCR)技術,通過掃描圖片,可以快速將圖片中的文字掃描出來,支持宋體、仿宋、雅黑等常用字體,支持簡繁體同時識別,支持傾斜校正提高文字識別成功率。可應用于辦公文件掃描錄入,可應用于名片、身份證、發(fā)票等常用證件與票務的識別。
捷通華聲十幾年致力于發(fā)展語音等HCI技術,堅持合作共贏的發(fā)展理念;始終堅持只要合作伙伴發(fā)展的產品,捷通華聲就不開發(fā)類似產品,不與合作伙伴競爭的基本原則。有了合作伙伴的支持,捷通華聲專注發(fā)展HCI核心技術,技術水平得到產業(yè)界的肯定與支持,各項HCI技術已廣泛應用于各個行業(yè),并通過廣大合作伙伴的各種服務與產品服務億萬大眾,其中捷通華聲語音合成技術供應國內50%的市場需求。
HCI技術是人機交互技術,簡單說也是讓機器具有人的多項能力,是高新技術但并不神奇,應用于產業(yè)、服務于眾才是真正體現(xiàn)HCI價值的所在。捷通華聲希望通過靈云平臺,能夠結交實實在在做技術、產品設計中敢于創(chuàng)新的企業(yè)開發(fā)者,熱愛人機交互技術的個人開發(fā)者,共同激發(fā)出無限創(chuàng)意,開發(fā)出最具創(chuàng)新力的產品,共同促進HCI技術在中國信息產業(yè)中的廣泛應用,助力企業(yè)提升產品創(chuàng)新能力,在行業(yè)服務中創(chuàng)建新穎、親切的新服務模式,讓億萬大眾通過使用創(chuàng)新產品與體驗服務,增強對HCI技術的了解,實現(xiàn)共同服務億萬大眾新生活的產業(yè)目標。
更多信息請關注捷通華聲靈云網站(www.hcicloud.com),捷通華聲網站(www.sinovoice.com )。