捷通华声

灵云HCI核心技术介绍——光学字符识别(OCR)

2013-10-17 16:21:29   作者:   来源:CTI论坛   评论:0 点击:


  OCR(光学字符识别),是通过图像处理和模式识别技术对光学的字符进行识别的意思,是自动识别技术研究和应用领域中的一个重要方面。现在OCR主要是指文字识别软件,它是一种能够将文字自动识别并录入的软件技术。

  捷通华声OCR核心引擎是针对特定语言的识别软件模块,该软件模块是整个软件的核心模块。核心模块接收其他模块的设置,并根据设置内容对文字图片数据进行识别,并将识别结果列表返回给调用模块。
灵云HCI核心技术介绍——光学字符识别(OCR)

  捷通华声OCR图像识别技术具有以下特点:
  • 支持多国文字识别:支持中文简繁体、纯英文识别,识别率达到99%以上。
  • 支持多种识别方式:支持扫描识别和拍照识别。
  • 支持多图像格式:支持TIFF、BMP、PNG、GIF、JPEG格式图像的读取,支持黑白、灰度、彩色图像的处理;
  • 支持自动版面分析:能自动分析出横排文本、竖排文本、表格和图像等区域,并对文本和表格区域的文字进行识别。针对特殊应用(例如名片识别)有专门优化的版面分析算法;
  • 支持手动版本分析:支持对用户指定区域的文字图像进行识别;
  • 倾斜校正功能:可以对图像由于扫描引起的倾斜进行自动校正;
  • 畸变校正功能:可以对由于非统一照度和近距拍摄造成的灰度畸变和几何畸变进行自动校正;
  • 识别字体多样:支持多语种、多字体、多字号识别;
  • 多种字符集输出:支持GB2312、BIG5、GBK、Unicode、UTF-8等内码的输出;
  • 可获取识别结果详细信息:能够获取识别文字在原文中的信息,包含文字在图像中的坐标、字体、字号、可信度和候选字。 

相关阅读:

分享到: 收藏