一波未息一波又起,灵云OCR再掀智能图像热潮

     

 

2014-06-09


   

  2013年炒得最热的不是房地产,而是智能人机交互技术(HCI)在IT圈的极速扩张。国内的互联网大佬代表BAT在搜索、电商、移动等各个领域抢滩攻地,在智能人机交互(HCI)领域炒得更是火爆,从百度首先战略投资国内第一大智能语音技术开发商捷通华声开始,就已打开了智能语音五彩的市场;然而随着2013年沸沸腾腾的语音热潮逐渐退去,2014年图像识别热潮又开始幕天席地而来,其中以OCR技术尤为瞩目。

       OCR(光学字符识别)技术隶属图像识别技术的一支,也是HCI技术领域最早实现商业化的技术,早期多用于办公文档录入与金融、保险等大型企业的票证识别系统,然而近年来随着智能移动端的迅速发展,OCR技术已在潜移默化中从To B端延伸至To C端,被广泛地应用于各个领域、各项软硬件中。

       放眼国外,近日来有iphone6 ios 8系统透露的用户信用卡扫描功能以及微软SkyDrive欲推出的OCR搜索的消息。

而国内BAT三巨头也马不停地相继推出OCR相关服务和产品,例如百度的涂书笔记、腾讯微信智能开放平台开放图像识别端口、阿里提出的深化手机应用概念。

       这是否预示着2014年将是OCR技术重新迸发活力的一年?

 

语音热潮渐消,OCR后浪迭起

       众所周知,2013年是APP全面攻陷国民智能移动端的一年,其中尤以智能语音交互技术炒得轰轰烈烈,在苹果siri引爆语音识别后,国内在这一领域的技术先驱企业捷通华声、讯飞等更是奋力直追,打造出更符合汉语言习惯的智能语音交互技术;而在语音合成(TTS)技术方面,一直作为国内TTS技术领导者的捷通华声更是在2013年因其灵云平台(hcicloud.com)推出十几种国际语言合成技术,满足全球90%地区的语音合成服务而独领风骚。

       然而信息技术瞬息万变,在智能语音刚被推上一个新的关注和应用高度的时候,OCR等智能图像技术又顺势创新应用于各领域,引起业内的广泛关注。

      在国内,OCR技术商品化最早成熟于上世纪90年代,对于行业内人士和金融通信类企业来讲并不陌生,那时多应用于文本自动录入与证件和表格扫描,以便减少人工录入成本。

       然而,现今随着云计算、大数据时代的到来,各行业各领域的单位和开发者对OCR技术的需求也越来越多样化,大至银行海关证照,小到淘宝店主收支票据,而智能移动端的迅速发展正给OCR便捷化、普遍化提供了可能和新的发展机遇。

       OCR再次以其独特的录入方式而成为互联网新的入口,引发了产业界与各大IT大佬的 广泛关注,不断的产品与技术创新比拼,使OCR技术在2014年重又走上了IT舞台的中心,在HCI技术领域,继智能语音之后,一场智能图像领导者的争斗战再次打响。

 

捷通华声“云+端”OCR,满足用户多样化需求

       捷通华声OCR首席技术官李健表示:“在国内,OCR技术已发展了数十年,而我们对该项技术的研究也已积累了数十年的调研数据和实践经验,无论是识别率、识别速度、用户界面的友好性,还是产品的稳定性、易用性及可行性等,都足以与国内外IT巨头抗衡。

       自2011年,捷通华声推出国内外第一个全方位HCI技术云服务平台灵云后,灵云OCR系统发挥灵云“云+端”的优势,可满足用户多样化定制需求,为OCR技术的应用提供了比以往任何时候都宽广的发展空间。传统的OCR软件只是通过单一的终端设备,无法联网,应用、操作较单一;而灵云OCR系统则可通过灵云服务全方位拓展应用领域。如:每年我国有众多数字图书馆建设中的大量纸张数据信息,所有银行、税务局、保险公司的大量票据,公安边防海关等部门的各类证照卡数据信息等等,都需要输入到电脑里并做分析存储,几乎可覆盖到国家及各部委的所有重点行业领域。与此同时,新兴的商业及个人应用与服务市场更是一个巨大的市场空白,捷通华声灵云OCR在这一即将成熟的领域已抢占先机。”

 

捷通华声OCR前景展望

       作为国内高新技术民族企业的代表之一,捷通华声成立伊始就已专注研究智能人机交互技术(ASR、TTS、HWR、OCR等等),在智能图像中另一项代表性技术手写识别的市场已成功占有国内近50%市场份额,尤其是在智能手机端,其应用市场份额更是超过了这一领域的竞争对手。伴随移动互联网、电商等产业发展,OCR在移动端的应用将满足当下日益成熟的终端支付系统对便捷性、安全性的需求。在不断完善OCR多样化应用的同时,捷通华声也正在发力开发更完善的图像识别技术,除了支持票证表格文字的识别,还将实现图片、企业LOGO、人脸实景等更多元化的识别技术。

       2013年,捷通华声与清华大学达成的战略合作,为捷通华声发展OCR等智能图像技术奠定巨大的技术优势。在智能图像研究的学术领域,清华大学一直拥有国内OCR等智能图像技术研究的领导者地位。如今,捷通华声在OCR、手写识别等智能图像领域与清华大学智能图像重点实验室展开合作,双方将充分发挥灵云平台优势,不仅将在证照、表单等传统优势产业应用中推广OCR技术,同时将大力推荐名片识别等产品技术在移动互联网中应用与推广。

 

       相信灵云OCR在清华大学的全力支持下,这场智能图像热潮将更加精彩!

 

       灵云科技、源自清华、服务全球。体验灵云OCR技术请登录灵云官网www.hcicloud.com

获得 Adobe Flash Player