從優秀到卓越，玩瞳圖像識別算法的現狀與未來

欄目: 家居生活 / 發佈於: / 人氣:1.67W

今年暑假，眾多的兒童機器人給孩子們帶了全新AI繪本輔助閲讀體驗，“這個神奇的功能是怎麼實現的呢？”在整個AI繪本輔助閲讀功能中，圖像識別算法是其中最為關鍵的技術之一。

早在去年這個時候，玩瞳VisionTalk的圖像識別算法橫空出世，經過一年的鑽研和發展，到如今已經身經百戰，贏得了眾多客户的信任和良好口碑。

從繪本識別到書本識別——VisionTalk的圖像識別算法

經過一年的打磨和成長，玩瞳的圖像識別算法已在市場上處於領先地位，其特點可以概括為：識別精準，響應快速，容量超大，易於擴展，持續迭代。

今天我們就從更專業的角度來看看玩瞳VisionTalk的AI慧讀平台中的圖像識別算法。

1、識別精準

精準魯棒的識別，支持不同的硬件結構和不同的使用場景。我們模擬用户在各種使用場景對各種主流繪本和K12書籍進行了充分的測試。這些場景包括辦公室，客廳，彩色兒童房，枱燈下，陽台，商場等。

對於玩瞳推薦的硬件結構，識別準確率達到了驚人的99.5%。對於一般性設備，如各式各樣的手機和平板，識別準確率依然高達98%。

2、響應快速

0.2秒的超快速識別速度給用户一種秒翻識別的體驗。為了在整個系統上達到如此快的響應速度，我們主要做了以下三點優化：

a、直接優化雲端算法的識別速度，尤其是在大併發下的識別速度。當前玩瞳的客户眾多，也給我們的識別服務帶來了巨大的壓力，但經過持續不斷的算法速度優化，我們的響應速度依然穩定快速。

b、對待傳輸的圖像進行了極致的壓縮，減小網絡傳輸的數據量。同時優化雲端算法，使其能穩定識別壓縮後較模糊的圖像。

c、大力提高識別算法的魯棒性，使其能穩定識別翻頁過程中的遮擋圖像，從而準確地預測出用户即將翻到的頁面，最終達到翻書後即開始進行語音播放的效果。

3、容量超大

超大容量雲端圖庫，當前已經支持約5萬本繪本，未來很快將超過10萬本。支持更多的繪本看似只需要製作更多的內容，實際上也需要準確快速的圖像識別算法支撐。

當圖像庫變大後，一般來説識別準確率和速度都會受到影響。但從當前我們的模擬測試來看，10萬本的數據量還遠未觸摸到識別算法的瓶頸。

4、易於擴展

玩瞳將整體考慮離線訓練算法和在線識別算法的特點，設計合理的圖像模型結構，不僅支持快速的圖書訓練和增量部署，而且在共享玩瞳公共繪本庫的同時支持用户自定義私有繪本庫。

圖像識別算法的未來發展

現階段，玩瞳的圖像識別算法已經在市場上得到驗證，在業界處於遙遙領先的地位，贏得了眾多客户良好的口碑。在未來的N年裏，玩瞳依然會持續不斷的迭代優化我們的圖像識別算法。

圖像識別算法即將迎來下一個突破：顯著提升以文字為主書籍的識別準確率。該突破帶來的意義將是書籍教輔的準確快速識別。

針對以文字為主的這類書籍圖像，由於不同硬件的光學成像、圖像分辨率限制、以及算法原理本身等各方面的原因，導致了目前市場上翻讀應用中幾乎所有的圖像識別算法失效。玩瞳自主研發的文字圖像識別算法體系，對於最困難的這類圖像的識別現已取得重大突破，已經將競爭對手遠遠的甩在身後。

玩瞳VisionTalk持續致力於AI視覺技術賦能兒童教育，將我們的解決方案應用在更豐富的交互模式上，滿足客户更加個性化的需求，玩瞳的圖像識別算法必將從優秀走向卓越。

深圳市玩瞳科技有限公司VisionTalk成立於2015年，是一家經深圳市政府認證的高新技術企業。公司專注於實體學習桌面的視覺圖像分析，並應用於機器輔助的閲讀、作業和學習。

公司目前擁有數十項各類專利，並擁有全球最大的兒童出版物圖像訓練庫。公司新推出的“智能慧讀平台”賦能產業鏈，低成本、高效率、個性化地幫助企業開發或升級閲讀機器人。已經成功在故事機/機器人、兒童出版、兒童內容等行業得到應用。