網站首頁 娛樂圈 綠色生活 玩物志 星秀 問答 人文素養
當前位置:時髦風 > 綠色生活 > 家居生活

從優秀到卓越,玩瞳圖像識別算法的現狀與未來

欄目: 家居生活 / 發佈於: / 人氣:1.67W

今年暑假,眾多的兒童機器人給孩子們帶了全新AI繪本輔助閲讀體驗,“這個神奇的功能是怎麼實現的呢?”在整個AI繪本輔助閲讀功能中,圖像識別算法是其中最為關鍵的技術之一。

從優秀到卓越,玩瞳圖像識別算法的現狀與未來

早在去年這個時候,玩瞳VisionTalk的圖像識別算法橫空出世,經過一年的鑽研和發展,到如今已經身經百戰,贏得了眾多客户的信任和良好口碑。

從繪本識別到書本識別——VisionTalk的圖像識別算法

經過一年的打磨和成長,玩瞳的圖像識別算法已在市場上處於領先地位,其特點可以概括為:識別精準,響應快速,容量超大,易於擴展,持續迭代。

今天我們就從更專業的角度來看看玩瞳VisionTalk的AI慧讀平台中的圖像識別算法。

1、識別精準

精準魯棒的識別,支持不同的硬件結構和不同的使用場景。我們模擬用户在各種使用場景對各種主流繪本和K12書籍進行了充分的測試。這些場景包括辦公室,客廳,彩色兒童房,枱燈下,陽台,商場等。

對於玩瞳推薦的硬件結構,識別準確率達到了驚人的99.5%。對於一般性設備,如各式各樣的手機和平板,識別準確率依然高達98%。

2、響應快速

0.2秒的超快速識別速度給用户一種秒翻識別的體驗。為了在整個系統上達到如此快的響應速度,我們主要做了以下三點優化:

a、直接優化雲端算法的識別速度,尤其是在大併發下的識別速度。當前玩瞳的客户眾多,也給我們的識別服務帶來了巨大的壓力,但經過持續不斷的算法速度優化,我們的響應速度依然穩定快速。

b、對待傳輸的圖像進行了極致的壓縮,減小網絡傳輸的數據量。同時優化雲端算法,使其能穩定識別壓縮後較模糊的圖像。

c、大力提高識別算法的魯棒性,使其能穩定識別翻頁過程中的遮擋圖像,從而準確地預測出用户即將翻到的頁面,最終達到翻書後即開始進行語音播放的效果。

3、容量超大

超大容量雲端圖庫,當前已經支持約5萬本繪本,未來很快將超過10萬本。支持更多的繪本看似只需要製作更多的內容,實際上也需要準確快速的圖像識別算法支撐。

當圖像庫變大後,一般來説識別準確率和速度都會受到影響。但從當前我們的模擬測試來看,10萬本的數據量還遠未觸摸到識別算法的瓶頸。

4、易於擴展

玩瞳將整體考慮離線訓練算法和在線識別算法的特點,設計合理的圖像模型結構,不僅支持快速的圖書訓練和增量部署,而且在共享玩瞳公共繪本庫的同時支持用户自定義私有繪本庫。

圖像識別算法的未來發展

現階段,玩瞳的圖像識別算法已經在市場上得到驗證,在業界處於遙遙領先的地位,贏得了眾多客户良好的口碑。在未來的N年裏,玩瞳依然會持續不斷的迭代優化我們的圖像識別算法。

圖像識別算法即將迎來下一個突破:顯著提升以文字為主書籍的識別準確率。該突破帶來的意義將是書籍教輔的準確快速識別。

針對以文字為主的這類書籍圖像,由於不同硬件的光學成像、圖像分辨率限制、以及算法原理本身等各方面的原因,導致了目前市場上翻讀應用中幾乎所有的圖像識別算法失效。玩瞳自主研發的文字圖像識別算法體系,對於最困難的這類圖像的識別現已取得重大突破,已經將競爭對手遠遠的甩在身後。

玩瞳VisionTalk持續致力於AI視覺技術賦能兒童教育,將我們的解決方案應用在更豐富的交互模式上,滿足客户更加個性化的需求,玩瞳的圖像識別算法必將從優秀走向卓越。

深圳市玩瞳科技有限公司VisionTalk成立於2015年,是一家經深圳市政府認證的高新技術企業。公司專注於實體學習桌面的視覺圖像分析,並應用於機器輔助的閲讀、作業和學習。

公司目前擁有數十項各類專利,並擁有全球最大的兒童出版物圖像訓練庫。公司新推出的“智能慧讀平台”賦能產業鏈,低成本、高效率、個性化地幫助企業開發或升級閲讀機器人。已經成功在故事機/機器人、兒童出版、兒童內容等行業得到應用。