Nothing Special   »   [go: up one dir, main page]

CN106682698A - 基于模板匹配的ocr识别方法 - Google Patents

基于模板匹配的ocr识别方法 Download PDF

Info

Publication number
CN106682698A
CN106682698A CN201611250739.3A CN201611250739A CN106682698A CN 106682698 A CN106682698 A CN 106682698A CN 201611250739 A CN201611250739 A CN 201611250739A CN 106682698 A CN106682698 A CN 106682698A
Authority
CN
China
Prior art keywords
pictures
sub
character
picture
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611250739.3A
Other languages
English (en)
Inventor
景亮
康青杨
唐涔轩
刘世林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Business Big Data Technology Co Ltd
Original Assignee
Chengdu Business Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Business Big Data Technology Co Ltd filed Critical Chengdu Business Big Data Technology Co Ltd
Priority to CN201611250739.3A priority Critical patent/CN106682698A/zh
Publication of CN106682698A publication Critical patent/CN106682698A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及图像识别处理领域,特别涉及基于模板匹配的OCR识别方法;将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;根据待识别图像文字选择对应的字体制作特征图片;并对待识别子图片和对应类型的特征图片进行归一化处理。在此基础上,进行特征比对,将待识别的数字、字母和标点符号子图片以及文字字符子图片分别于对应类型的特征模板进行对比计算,在进对比计算时,采用相同像素位置的异或算法,统计误差频次;将误差频次最小的特征图片对应的标注作为识别结果进行输出。本发明方法实现的图像识别,计算过程简单,节省人力和物力,识别效率较高。

Description

基于模板匹配的OCR识别方法
技术领域
本发明图像识别领域,特别涉及基于模板匹配的OCR识别方法。
背景技术
随着社会的发展和科技的进步,人类创造的知识正以指数级的数量增加,在电子书籍出现之前,大部分的知识是以图书的方式进行传承,中华上下五千年,产生了大量优秀书籍,这些书籍在历史的长河中,或多或少都遭到了不同程度的损坏,因此对这些书籍进行数字化存储迫在眉睫;在图书管理领域,书籍内容的快速搜索对于快速定位书籍很有帮助,而由于书籍数量太多,加上早期印刷的图书没有作者的电子文稿,因此纸质书籍的电子化很有必要。
光学字符识别软件就是处理这种纸质图书到电子文档转化的利器,其主要利用大量的字符样本,经过复杂网络的学习,生成相应的模型文件,从而达到识别图片中字符的目的。
光学字符识别软件主要功能是识别拍摄、扫描图片中的字符,现有技术中在进行图像中文字的识别时,首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后使用一定的方法对切分后的文字进行识别。而进行文字切分最常用的方法为投影法,即是将图像文字二值化处理后,通过垂直投影法找到两个文字之间的分界线,根据分界线将文字切分开来。然而当图像中的文字之间具有粘连,且图像中包含左右结构的汉字时,简单的投影方法就很难实现较好的切分效果;正是因为这个原因使得切分一直是OCR识别的难点,切分的质量将直接影响到文字的识别效果。
此外光学字符识别软件主要功能是识别拍摄、扫描图片中的字符,对于一些特殊字体的扫描件,公章,拍照,比如早期印刷的书籍,政府单位制作的证件等,由于历史原因以及保密与安全需要,其字体往往是特制的,现有的光学字符识别软件主要集中于机器学习的方法,模型运算量大,而且由于训练字体样本没有覆盖到特殊字体,导致特殊字体的识别准确率不高,严重影响纸质文档的电子化。
现有技术大多采用神经网络机器学习算法对字符进行识别,需要制作大量的样本,耗费大量的时间进行训练,且生成的模型文件非常庞大,且对于不同字体的字符,识别率不尽相同,对于某些特殊字体字符,识别率比较低,很难满足一些特殊场景下的字符识别。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供基于模板匹配的OCR识别方法,根据待识别图像文字选择对应字体生成对应的特征图片,并在特征模板的基础上,
在对待识别图像文字进行有效切分的基础上,结合针对性的字符特征模板为实现特殊字体OCR识别准备条件。
为了实现上述发明目的,本发明提供了以下技术方案:基于模板匹配的OCR识别方法,包含以下实现步骤:
(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;
(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;
根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;
(3)将特征图片和待识别图片进行归一化处理:
将特征图片和待识别子图片的图片尺寸调整成相同大小,并对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1(将图片中0-255的灰度值,根据设置的阈值,转化为0或1)将转化后的像素值按位置存储于内存中;
(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出。
具体的,所述步骤(4)中,将待识别的数字、字母和标点子图片与数字、字母和标点特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出;
对待识别文字字符子图片与对应的文字特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出。
进一步的,n*h<l<N*h。
进一步的,n≤1/4。
进一步的,文字字符图片的切分包含以下实现过程:
使用投影法找出文字字符图片的初始切分位置,根据初始切分位置将待识别图像片切分成初始子图片序列;
对序列中的初始子图片使用如下规则进行处理:
A、使用投影法待识别图像文字进行切分,切分成子图片序列;将其中的数字、字母和标点符号标记出来;
B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;
对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:
f(x)=g(x)t(x)
重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h;
C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L≤M*h;
如果满足,依序对满足条件的相邻子图片进行合并;
重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L≤M*h;
D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:
f(x)=g(x)t(x)
所确定的切分点进行切分;根据确定的切分点,将中间子图片切分成第一中间子图片和第二中间子图片;
将第一子图片和第一中间子图片合并;
将第二中间子图片和第三子图片合并。
进一步的,0.9≤M≤1.3。
作为一种优选:M=1.2。
与现有技术相比,本发明的有益效果:本发明提供基于模板匹配的OCR识别方法,根据需要识别的图像文字仅需构造少量的特征模板,无反复训练模型;就可以实现各种特殊字体文字图像的较好的识别效果,对于识别任务的图像文字的针对性更强;本发明方法在字体选择的基础上,构造原始特征图片,在原始特征图片的基础上,将图片中的字符分别向不同方向移动设定的距离,制成对应的特征模板;这样制成的特征模板能够更好的适应字符图片切分不完美的情况,因而具有更好的容错性。在特征图片的基础上,用异或算法来识别待识别子图片与特征模板的相似程度,计算过程简单方法,识别效率和可靠性较高。
此外,本发明采用了一套独特的切分方法:使用相应的规则条件,逐级的来判断切分后的子图片的切分质量,并对切分后的子图片进行相应的处理,层层筛选和处理的方式,保证子图片的切分质量;为最终的识别率,进一步准备了条件。此外相比于传统的切分方法,本发明方法在幅值的基础上引入了修正值,将切分位置与字符边缘的距离作为了确定切分点的考虑因素,因此具有更高的准确性,而且当遇到特殊结构字符时出现多个较小值,或者极值点时,通过本公式可以快速的找出最优化的切分点,增加了切分的准确性,提高了切分的效率;对粘连字符的切分效果更好。
附图说明:
图1为本基于模板匹配的OCR识别方法的实现步骤图。
图2为数字模板的制作示意图。
图3为文字模板的制作示意图。
图4粘连文字图像样例图。
图5为图4中字符的幅值分布示意图。
图6为修正值g(x)的分布示意图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
本发明方法提供基于模板匹配的OCR识别方法,包含如图1所示的以下实现步骤:
(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来(本步骤的标记,仅标记子图片的类型,不进行具体的识别)。实现时,对待识别图像文字使用投影法进行切分,切分成子图片序列,将其中的数字、字母和标点符号标记出来;比如说投影的宽度较窄(比如设置为<0.4h),投影的面积较小(0.5h*0.8h),切割后形成的相邻子图片之间的距离明显大于普通字符图片的距离等,利用上述特征,可以首先将属于数字、字母和标点的子图片切分出来。在数字、字母和标点符号子图片已并被标记的基础上,对未标记的子图片(文字字符图片)进行切分,切分成仅包含单个字符的子图片。分步骤进行的子图片切分能够达到更好的切分效果。
(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,如图2所示,并对制成的特征图片进行对应的标注(本次标注是指,将特征图片对应的字符内容标记出来,比如说图2中的9张特征图片均标注为“8”);
根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注(本次标注是指,将特征图片对应的字符内容标记出来,比如说图3中的9张特征图片均标注为:“字”);将模板中的字符分别移动设定的距离,超过子图片框范围的字符部分将被切除,向上述方向移动设局距离后形成的图片和原图片一起构成了同一字符的9张不同切分情形的参考样本图片如图3所示,这与实际操作中字符图片切分可能不规则,不完美的情况相对应,因此基于本方法形成的特征模板来实现的字符识别,具有更好的容错性。
(3)将特征图片和待识别图片进行归一化处理:
将特征图片和待识别子图片的图片尺寸调整成相同大小,并对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1(将图片中0-255的灰度值,根据设置的阈值,转化为0或1)将转化后的像素值按位置存储于内存中;
(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理(如果特征图片和待识别图片对应像素点的值相同,异或计算后的值为0;如果特征图片和待识别图片对应像素点的值不同,异或计算后的值为1),统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出。
具体的,所述步骤(4)中,将待识别的数字、字母和标点子图片与数字、字母和标点特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出;
对待识别文字字符子图片与对应的文字特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出。
本发明方法使用异或算法来识别待识别子图片与特征模板的相似程度,计算过程简单方法,识别效率和可靠性较高。
进一步的,文字字符图片的切分包含以下实现过程:
使用投影法找出文字字符图片的初始切分位置,根据初始切分位置将待识别图像片切分成初始子图片序列;
对序列中的初始子图片使用如下规则进行处理:
A、使用投影法待识别图像文字进行切分,切分成子图片序列;将其中的数字、字母和标点符号标记出来;
B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;
对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:
f(x)=g(x)t(x)
重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h。
式中f(x)为幅值,x为列投影点在行方向上的坐标,h为当前字符的行高,g(x)为修正值,t(x)为行投影值,两者共同决定投影点的幅值,当幅值最小时,即为两个字符之间的切割点;经过g(x)的修正所找到最小幅值点作为切分点,相比于简单的最小行投影值,本方法中所寻找的切分点,引入了切分点位置与字符边缘距离的考量因素,因此具有更高的准确性,而且当遇到特殊结构字符时出现多个较小值,或者极值点时,通过本公式可以快速的找出最优化的切分点,增加了切分的准确性,提高了切分的效率。
C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L≤M*h;
如果满足,依序对满足条件的相邻子图片进行合并;
重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L≤M*h;
D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:
f(x)=g(x)t(x)
所确定的切分点进行切分;根据确定的切分点,将中间子图片切分成第一中间子图片和第二中间子图片;
将第一子图片和第一中间子图片合并;
将第二中间子图片和第三子图片合并。
在某些情况下:连续的两个左右结构的字符图片,中间具有粘连,那么在利用投影法进行切分时,可能将前后字符中间的部首切开,但是对于两个字符之间粘连的部首识别不了,而当成一个字符切分出来的情况;本发明方法对于这种情况有较好的处理效果,对于粘连的中间部分通过上述公式寻找到最佳的切分点,并将切分后的前后字符的部首进行重新的整合,达到了较好的切分效果。
上述规则依序循环使用,经过不断的迭代,最终形成了仅包含单个字符的子图片,良好的切分效果为图像文字识别准备了条件。
进一步的,0.9≤M≤1.3。子图片宽度阈值的设置在本范围内,均能实现较好的切分和识别效果。
作为一种优选:M=1.2。经过实验反复验证,将M设置为1.2时,能够实现较好的切分效果。
实施例1
比如对图像中的文字进行识别时,经过观察,认为该图像中的文字与微软雅黑的字体较为接近,将图像文字进行二值化处理后,经过行投影,将图像中的文字行切分出来,对每一行文字图像进行列投影,找出初始切分点,根据初始切分对文字图片进行初步的切分,形成子图片,使用以下规则将其中的数字、字母和标点字符抽取出来,规则可以选择为:子图片的宽度L<0.4h行高,将数字、字母和标点的子图片判断并标记(本处的标记仅标记子图片的类型,不做具体识别)出来之后,对于同一个数字、字母和标点只选取其中的一张子图片进行模板的制备(图片的选择可以人工进行挑选,数字:0、1、2、3、4、5、6、7、8、9共计:10个,字母大小写共26*2=52个,标点根据识别情况而定;数字、字母和标点的数量相比于庞大的汉字来说很少,少量的人工挑选不会影响识别的效率)。在选择的数字子图片的图片框范围内,将其中的字符向各个方向(比如:向上、下、左、右、左上、左下、右上和右下移)移动设定的像素,制成对应的模板。
在此基础上,对数字、字母和标点以外的文字字符子图片进行判断和处理,判断过程如下:将满足条件:B、对于L>1.2h的子图片,使用以下公式来进行切分点的判断:
f(x)=g(x)t(x)
如图4所示的子图片,经过投影后像素的幅值分布为图5所示,可以发现当x点与行高h相距为0时,其修正值g(x)最小,为0.5,当x与h相距越大,修正越大,由于本文假设字符的宽度与行高相当,因此可以理解为字符投影点越靠近该字符所处的宽度处时,其修正值越小,这样可以避免幅值出现多个极值点。本子图片中字符的幅值在x=19和20处出现极小值,该子图片字符的行高为19,经g(x)的修正,g(x)的值的分布如图6所示,可以得出f(19)=0.5000,f(20)=0.5025;x=19时f(x)的值最小,x=19确定为切分点,并根据该切分点,将子图片字符切分出来。
在上述处理的基础上,对于切分满足规则C的子图片,进行合并。
在上述处理的基础上,对于满足规则D的子图片,根据规则D进行处理。
上述A、B、C、D依序使用,没有子图片能被切分或者合并时,停止切分。
本实施例中采用微软雅黑字体,来生成对应的特征模板,利用3501个常用字符生成汉字图片样本(每个样本按照向上、下、左、右、左上、左下、右上和右下移动1-2个像素,如图所示),制成对应的特征图片;并进行对应的标注。
在此基础上,根据子图片序列顺序,依次将切分好的待识别子图片与对应类型的特征图片进行比对,使用异或算法来计算待识别子图片与相应类型中各特征图片的误差频次,将误差频次最小的特征图片对应的标注作为待识别子图片识别结果。

Claims (7)

1.基于模板匹配的OCR识别方法,其特征在于,包含以下实现步骤:
(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;
(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;
根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;
(3)将特征图片和待识别图片进行归一化处理,并将各图片的像素对应值,按位存储于内存中;
(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次;将误差频次最小的特征图片对应的标注作为识别结果进行输出。
2.如权利要求1所述的方法,其特征在于,n*h<l<N*h。
3.如权利要求2所述的方法,其特征在于,n≤1/4。
4.如权利要求1所述的方法,其特征在于,所述步骤(3)中的归一化处理过程包括:将特征图片和待识别子图片的图片尺寸调整成相同大小;
对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1,将转化后的像素值按位置存储于内存中。
5.如权利要求1至4之一所述的方法,其特征在于,文字字符图片的切分包含以下实现过程:
A、将图片序列中的数字、字母和标点符号标记出来;
B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;
对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:
f(x)=g(x)t(x)
g ( x ) = 1 1 + e - 0.01 | x - h |
重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h;
C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L≤M*h;
如果满足,依序对满足条件的相邻子图片进行合并;
重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L≤M*h;
D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:
f(x)=g(x)t(x)
g ( x ) = 1 1 + e - 0.01 | x - 0.5 h |
所确定的切分点进行切分;根据确定的切分点,将中间子图片切分成第一中间子图片和第二中间子图片;
将第一子图片和第一中间子图片合并;
将第二中间子图片和第三子图片合并。
6.如权利要求5所述的方法,其特征在于,0.9≤M≤1.3。
7.如权利要求6所述的方法,其特征在于,M=1.2。
CN201611250739.3A 2016-12-29 2016-12-29 基于模板匹配的ocr识别方法 Pending CN106682698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611250739.3A CN106682698A (zh) 2016-12-29 2016-12-29 基于模板匹配的ocr识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611250739.3A CN106682698A (zh) 2016-12-29 2016-12-29 基于模板匹配的ocr识别方法

Publications (1)

Publication Number Publication Date
CN106682698A true CN106682698A (zh) 2017-05-17

Family

ID=58873548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611250739.3A Pending CN106682698A (zh) 2016-12-29 2016-12-29 基于模板匹配的ocr识别方法

Country Status (1)

Country Link
CN (1) CN106682698A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682671A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 图像文字识别系统
CN109739233A (zh) * 2018-12-29 2019-05-10 歌尔股份有限公司 Agv小车定位方法、装置及系统
CN109816640A (zh) * 2019-01-08 2019-05-28 南京富士通南大软件技术有限公司 一种基于图片对比的产品校验方法
CN110032401A (zh) * 2018-01-10 2019-07-19 武汉斗鱼网络科技有限公司 一种特殊样式数字的转化方法、存储介质、设备及系统
CN110110788A (zh) * 2019-05-06 2019-08-09 云城(北京)数据科技有限公司 原件和比对件的比对方法及装置
CN110245576A (zh) * 2019-05-21 2019-09-17 深圳壹账通智能科技有限公司 Ocr识别准确率的检测方法、装置、设备及存储介质
CN111161247A (zh) * 2019-12-30 2020-05-15 凌云光技术集团有限责任公司 用于可变码识读字符质量验证的检测方法
CN113760415A (zh) * 2020-06-04 2021-12-07 Oppo广东移动通信有限公司 表盘生成方法、装置、电子设备和计算机可读存储介质
US11995905B2 (en) 2020-02-10 2024-05-28 Beijing Baidu Netcom Science Technology Co., Ltd. Object recognition method and apparatus, and electronic device and storage medium

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890783A (zh) * 2011-07-20 2013-01-23 富士通株式会社 识别图像块中文字的方向的方法和装置
CN102968627A (zh) * 2011-08-31 2013-03-13 上海夏尔软件有限公司 基于区域关键字位置识别的精确图像切分方法
CN104751194A (zh) * 2015-04-27 2015-07-01 陈包容 一种财务费用报销的处理方法及装置
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105320952A (zh) * 2015-10-15 2016-02-10 广东广信通信服务有限公司 一种基于ocr的行驶证信息识别方法
CN105426890A (zh) * 2015-11-09 2016-03-23 成都数之联科技有限公司 一种字符扭曲粘连的图形验证码识别方法
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN106682671A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 图像文字识别系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890783A (zh) * 2011-07-20 2013-01-23 富士通株式会社 识别图像块中文字的方向的方法和装置
CN102968627A (zh) * 2011-08-31 2013-03-13 上海夏尔软件有限公司 基于区域关键字位置识别的精确图像切分方法
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN104751194A (zh) * 2015-04-27 2015-07-01 陈包容 一种财务费用报销的处理方法及装置
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN105320952A (zh) * 2015-10-15 2016-02-10 广东广信通信服务有限公司 一种基于ocr的行驶证信息识别方法
CN105426890A (zh) * 2015-11-09 2016-03-23 成都数之联科技有限公司 一种字符扭曲粘连的图形验证码识别方法
CN106682671A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 图像文字识别系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANIRUDDH PURANIC等: "Vehicle number plate recognition system: a literature review and implementation using template matching", 《INTERNATIONAL JOURNAL OF COMPUTER APPLICATIONS》 *
王江晴等: "基于极小阈值和曲线拟合的垂直投影汉字切分", 《中南民族大学学报:自然科学版》 *
胡提坤: "基于OCR快递单据识别的研究与实现", 《中国优秀博硕学位论文全文数据库(硕士)信息科技辑》 *
邓红耀等: "投影和模板匹配相结合分割车牌字符", 《计算机工程与设计》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682671A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 图像文字识别系统
CN110032401A (zh) * 2018-01-10 2019-07-19 武汉斗鱼网络科技有限公司 一种特殊样式数字的转化方法、存储介质、设备及系统
CN110032401B (zh) * 2018-01-10 2022-06-21 武汉斗鱼网络科技有限公司 一种特殊样式数字的转化方法、存储介质、设备及系统
CN109739233A (zh) * 2018-12-29 2019-05-10 歌尔股份有限公司 Agv小车定位方法、装置及系统
CN109816640A (zh) * 2019-01-08 2019-05-28 南京富士通南大软件技术有限公司 一种基于图片对比的产品校验方法
CN109816640B (zh) * 2019-01-08 2023-05-12 南京富士通南大软件技术有限公司 一种基于图片对比的产品校验方法
CN110110788A (zh) * 2019-05-06 2019-08-09 云城(北京)数据科技有限公司 原件和比对件的比对方法及装置
CN110245576A (zh) * 2019-05-21 2019-09-17 深圳壹账通智能科技有限公司 Ocr识别准确率的检测方法、装置、设备及存储介质
CN111161247A (zh) * 2019-12-30 2020-05-15 凌云光技术集团有限责任公司 用于可变码识读字符质量验证的检测方法
CN111161247B (zh) * 2019-12-30 2023-10-20 凌云光技术股份有限公司 用于可变码识读字符质量验证的检测方法
US11995905B2 (en) 2020-02-10 2024-05-28 Beijing Baidu Netcom Science Technology Co., Ltd. Object recognition method and apparatus, and electronic device and storage medium
CN113760415A (zh) * 2020-06-04 2021-12-07 Oppo广东移动通信有限公司 表盘生成方法、装置、电子设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN106682698A (zh) 基于模板匹配的ocr识别方法
CN106682671A (zh) 图像文字识别系统
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
CN106611174A (zh) 一种非常见字体的ocr识别方法
CN107093172B (zh) 文字检测方法及系统
CN104809481B (zh) 一种基于自适应色彩聚类的自然场景文本检测方法
CN110738207A (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
CN111723585A (zh) 一种风格可控的图像文本实时翻译与转换方法
CN106682667A (zh) 非常见字体的图像文字ocr识别系统
CN105447522A (zh) 一种复杂图像文字识别系统
CN104008384A (zh) 字符识别方法和字符识别装置
CN105512611A (zh) 一种表格图像检测识别方法
CN107248134A (zh) 一种文本文档中的信息隐藏方法和装置
CN111563563B (zh) 一种手写体识别的联合数据的增强方法
CN111523622B (zh) 基于特征图像自学习的机械臂模拟手写笔迹方法
CN107463866A (zh) 一种用于成绩评价的识别手写实验报告的方法
CN109685061A (zh) 适用于结构化的数学公式的识别方法
CN106682666A (zh) 用于非常见字体ocr识别的特征模板制备方法
CN107273928A (zh) 一种基于权重特征融合的遥感图像自动标注方法
CN106778759A (zh) 用于图像文字识别的特征图片自动生成系统
CN115618847A (zh) 一种解析pdf文档的方法、装置和可读存储介质
JP2006053920A (ja) 文字認識プログラム、文字認識方法および文字認識装置
Darma et al. Segmentation of balinese script on lontar manuscripts using projection profile
CN112580738B (zh) 基于改进的AttentionOCR文本识别方法及装置
CN108062548B (zh) 一种盲文方自适应定位方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170517

WD01 Invention patent application deemed withdrawn after publication