捷通华声灵云OCR 最全面的图像识别工具

         
 

2014-06-12


   

 近两年,随着智能语音市场的火爆,智能人机交互技术(HCI)开始逐渐被大家所知,OCR(光学字符识别)技术作为一项已为大众熟知的HCI技术,在移动互联网时代重又回到产业的聚光灯下。国内主要HCI技术提供商捷通华声顺应移动互联网、云计算产业发展趋势,凭借在智能图像识别、智能语音交互技术研发的优势,强力推出最新成果--灵云OCR,为金融、电信、电商、公共安全等领域及移动互联网领域提供全面智能图像识别技术与服务。

 

            灵云OCR作为灵云平台(hcicloud.com)的核心HCI技术能力,以“云+端”的方式为用户提供服务,具有识别率高、稳定性高、操作系统全适配、资源占用低等特点,是一种能够在任何时间、任何地点,向任何人提供实时、准确的文字识别服务的高效便捷手段,完全符合移动互联网时代信息动态更新和个性化录入的需求。

            灵云OCR支持全部中文字符的识别,并支持常用的宋体、仿宋体、楷体、黑体、雅黑等打印字体和隶书、魏碑等较难识别的字体。创新性的支持中英文混排的识别,以满足实际情况下的中英混编文献的文字识别需要。

            在识别准确率上,灵云OCR对中、英文的识别率处于国内绝对领先水平,识别率可以达到99%。同时,灵云OCR具有强大的图片处理能力,可以在对不同的识别图片进行旋转、倾斜校正、版面分析、版面属性设置等操作,还可以根据实际语境对识别结果进行自动校正。

            随着移动互联网的大规模发展和智能终端的普及,灵云OCR不但可以支持传统的扫描识别,还支持拍照识别,让用户可以随时随地对拍照的图片进行文字提取,实现即拍即识别的文字录入功能,此功能已经在天行输入法中得到成功的应用,受到广大用户的一致好评。

            针对金融,能源,交通,政府,企业等行业客户,灵云OCR还可以支持身份证,驾驶证、增值税发票,银行卡号、名片等各类票据、表单、证件的识别。通过匹配图像中的关键信息来自动确认图像种类,获得识别结果。针对特殊需求,灵云OCR还可以提供定制功能,针对客户的图像种类进行模板定制,实现“一种核心,多类图像”的应用效果,在各大银行,保险公司,电信营业厅,图书馆,档案馆,政府企事业单位中,实现人证统一、票据电子化、无纸化办公等功能,极大节省业务成本,提高办公效率,符合绿色环保的节能趋势。同时,灵云OCR可兼容市场的主流业务系统,在确保原业务系统稳定性和安全性的同时,也可借助自学习功能不断丰富字符/图像特征库,从而提高自身在识别时对图像的适应能力。

            除了日常办公以外,生活的方方面面也因灵云OCR技术的广泛应用而更加的生动有趣。用手机拍摄下纸质资料,利用灵云OCR软件识别转换成可编辑的电子资料。不仅仅是手机,用数码相机或DV拍摄下照片,其中的图像文字也可利用灵云OCR技术进行转换。

            创建于2000年的北京捷通华声语音技术有限公司是国内最早自主研发并提供OCR、手写识别等模式识别技术与产品的企业。2011年,捷通华声开创性的推出了全球第一个最大、最全的智能人机交互技术开放平台 — 灵云(www.hcicloud.com),提供光学字符识别(OCR)、手写识别(HWR)、语音合成(TTS)、语音识别(ASR)等智能人机交互(HCI)技术能力服务,并以“云 + 端”的方式向开发者全面开放与提供HCI技术能力服务。

            捷通华声在发展灵云平台与灵云智能图像等HCI技术与解决方案的过程中,得到了清华大学的鼎力支持。2013年,清华大学产业基金入资捷通华声,确立了捷通华声与清华大学的战略合作关系,并在智能图像、智能语音、语义理解等HCI技术研究领域迅速得到清华大学强大科研力量的支持。目前,捷通华声在OCR、手写识别等智能图像领域与清华大学智能图像重点实验室展开合作,双方将充分发挥灵云平台优势,加大OCR技术的研发力度,在不久的将来,向产业界与社会大众不断推出识别率更高、识别类型更多的各种文件、证照、名片等图像专有识别技术与解决方案,从而共同实现“灵云科技 源自清华 服务全球”的战略发展规划。未来,灵云OCR的表现将更加精彩!

 

更多信息,请浏览灵云开放平台:www.hcicloud.com

获得 Adobe Flash Player