CN111178355B - 印章识别方法、装置和存储介质 - Google Patents
印章识别方法、装置和存储介质 Download PDFInfo
- Publication number
- CN111178355B CN111178355B CN201911378424.0A CN201911378424A CN111178355B CN 111178355 B CN111178355 B CN 111178355B CN 201911378424 A CN201911378424 A CN 201911378424A CN 111178355 B CN111178355 B CN 111178355B
- Authority
- CN
- China
- Prior art keywords
- image area
- image
- seal
- determining
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 47
- 238000013527 convolutional neural network Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 5
- 239000003086 colorant Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000011176 pooling Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种印章识别方法、装置以及存储介质。其中,印章识别方法包括:获取待识别图像,其中待识别图像中包括印章图形;利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含印章图形的第一图像区域;以及根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字。
Description
技术领域
本申请涉及图像识别技术,特别是涉及一种印章识别方法、装置和存储介质。
背景技术
目前在识别圆形印章中的中文字符时,首先要定位圆形印章位置,然后再根据所确定的圆形印章的位置读取圆形印章中的中文字符。目前解决红色圆形印章位置问题通常是利用物理方法,例如利用HSI或者RGB等颜色模型估算圆心位置,然后通过圆边界点估算半径求出位置。但是如果圆形印章和文档字体颜色一致时(例如,携带红色圆形印章的文件采用黑白复印件时),上述算法将会不再适用或者效果较差。
针对上述的现有技术中存在的印章和文档字体颜色一致时,不能准确确定印章在图像中的位置的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种印章识别方法、装置和存储介质,以至少解决现有技术中存在的印章和文档字体颜色一致时,不能准确确定印章在图像中的位置的技术问题的技术问题。
根据本公开实施例的一个方面,提供了一种印章识别方法,包括:获取待识别图像,其中待识别图像中包括印章图形;利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含述印章图形的第一图像区域;以及根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上所述的方法。
根据本公开实施例的另一个方面,还提供了一种印章识别装置,包括:图像获取模块,用于获取待识别图像,其中待识别图像中包括印章图形;第一图像区域信息确定模块,用于利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含印章图形的第一图像区域;以及文字识别模块,用于根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字。
根据本公开实施例的另一个方面,还提供了一种印章识别装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取待识别图像,其中待识别图像中包括印章图形;利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含印章图形的第一图像区域;以及根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字。
本公开实施例借助于基于深度学习的卷积神经网络替代现有技术中的利用HSI或者RGB等颜色模型估算圆心位置的方法,从而即便是在印章图形与文档中的文字颜色一致的情况下,也能够准确地定位出包含该印章图形的图像区域。从而克服了现有技术中存在的,印章和文档字体颜色一致时,不能准确确定印章在图像中的位置的技术问题。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
图2是根据本公开实施例1的第一个方面所述的印章识别方法的流程示意图;
图3是根据本公开实施例1所述的包括印章图形的待识别图像的示意图;
图4是根据本公开实施例1所述的第一图像区域以及第一图像区域信息的示意图;
图5A是根据本公开实施例1所述的第一神经网络的示意图;
图5B是根据本公开实施例1所述的第一神经网络的输出数据的示意图;
图6是根据本公开实施例1所述的去噪后的第一图像区域的示意图;
图7是根据本公开实施例1所述的印章图形的中心点以及外沿半径的示意图;
图8是根据本公开实施例1所述的第一图像区域以及包含文字的扇形区域的示意图;
图9和图10分别示出了将图8中所示的扇形区域拉平后的图像区域的示意图;
图11是根据本公开实施例2所述的印章识别装置的示意图;以及
图12是根据本公开实施例3所述的印章识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,还提供了一种印章识别方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现印章识别方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的印章识别方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的印章识别方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
在上述运行环境下,根据本实施例的第一个方面,提供了一种印章识别方法,该方法由图1中所示的计算设备实现。图2示出了该方法的流程示意图,参考图2所示,该方法包括:
S202:获取待识别图像,其中待识别图像中包括印章的印章图形;
S204:利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含印章图形的第一图像区域;以及
S206:根据所确定的第一图像区域信息,在第一图像区域中识别印章中的文字。
具体地图3示例性地示出了包括印章图形的待识别图像的一个具体的实例。正如背景技术中所述,目前在识别圆形印章中的中文字符时,首先要定位圆形印章位置,然后再根据所确定的圆形印章的位置读取圆形印章中的中文字符。目前解决红色圆形印章位置问题通常是利用物理方法,例如利用HSI或者RGB等颜色模型估算圆心位置,然后通过圆边界点估算半径求出位置。但是如果圆形印章和文档字体颜色一致时(例如,携带红色圆形印章的文件采用黑白复印件时),上述算法将会不再适用或者效果较差。
有鉴于此,本公开提出了一种对印章识别方法,该方法例如可以由图1中所示的计算设备执行。首先,计算设备获取待识别图像。参考图3所示,待识别图像包括印章的印章图形。但是该印章图形与文档字体的颜色一致,均为黑色。
然后,计算设备利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含印章图形的第一图像区域。例如该区域信息可以是包含该印章图形的矩形区域的信息(包括矩形区域的位置和大小等)。从而借助于深度学习的卷积神经网络,计算设备即便在印章图形与文档字体的颜色一致的情况下也能够准确识别出包含该印章图形的图像区域的区域信息。
从而计算设备可以根据所确定的区域信息,在该区域中进行文字识别,从而识别印章上的文字。
综上所述,本公开借助于基于深度学习的卷积神经网络替代现有技术中的利用HSI或者RGB等颜色模型估算圆心位置的方法,从而即便是在印章图形与文档中的文字颜色一致的情况下,也能够准确地定位出包含该印章图形的图像区域。从而克服了现有技术中存在的,印章和文档字体颜色一致时,不能准确确定印章在图像中的位置的技术问题。
可选地,印章为圆形印章,并且利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:利用第一神经网络,在待识别图像中确定与圆形印章的圆形印章图形外切的矩形区域的区域信息作为第一图像区域信息。参考图3和图4所示,本公开的技术方案能够对圆形印章进行识别。具体地,参考图4所示,本公开的技术方案能够利用第一神经网络在待识别图像中识别出圆形印章的外切正方形的区域信息,即(x,y,w,h)。其中(x,y)例如可以用于指示该外切正方形的左顶点的坐标位置。w可以用于指示该外切正方形的宽度,h可以用于指示该外切正方形的高度。因而通过这种方式设定的区域信息,是能够利用卷积神经网络模型识别和输出的信息。因此方便人们利用卷积神经网络识别图像中的圆形印章的区域位置。
具体地,本公开通过特定的深度卷积神经网络模型,能够对圆形印章的外切正方形定位。其中该特定的深度卷积神经网络模型,需要通过对包含圆形印章的多个训练样本图像进行训练得到。其中,训练样本图像是包含一个或者多个圆形印章,但是要求圆形印章不重叠,印章可以是任何颜色,每个图相对应的标记数据(英文:label)是一个或者多个位置,位置形如(x,y,w,h)。从而能够训练出本申请实施例中特定的深度卷积神经网络模型。
由于深度卷积神经网络模型训练该模型时采用的训练数据为包含圆形印章的样本图像,标记数据为训练样本内圆形印章外切正方形的位置,因此,将待识别图像输入到深度卷积神经网络模型后,卷积神经网络模型能过对待识别图像中的一个或者多个圆形印章外切正方形位置。
可选地,利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:利用预先设置的faster-RCNN卷积神经网络,确定第一图像区域信息。
具体地,本实施例的深度卷积神经网络模型的一种合理结构包括:卷积层、池化层、全连接层。其中,经过大量实验证明,当采用如下网络结构时(如图5A所示.采用fasterr-cnn网络结构),其中利用该深度卷积神经网络模型检测圆形印章位置具有较好的准确率。
在识别圆形印章过程中,网络结构中各层主要功能如下:
1)卷积神经网络层(CNN层),该层用来提取特征图,该层使用卷积层+relu激活函数+池化层提取输入图像的特征图,该特征图用于后续的候选区域网络层和全连接层。具体地,对于大小为3*m*n的图像矩阵(例如,RGB图像矩阵),卷积神经网络层对RGB三个通道做卷积。其中卷积层包括多个3*3卷积核,并且在卷积操作前先对图像矩阵补零从而保证输入和输出的矩阵大小相同。每个池化层都用于将图像矩阵的宽和高减半,即将m*n矩阵变为(m/2)*(n/2)。从而4个池化层可以将特征图的尺寸最终变成(m/16)*(n/16)。并且最后一层卷积层的卷积核例如可以是256个,因此输出256个(m/16)*(n/16)特征图。
2)候选区域网络层(Region Proposal Networks层),候选区域网络层主要用于生成候选区域。例如,候选区域网络层首先利用具有256个3*3卷积核的卷积层对特征图进行卷积,然后利用36个1*1卷积核(且步长为1)构成的卷积层生成36个尺寸大小为(m/16)*(n/16)的特征图,用于表示9*(m/16)*(n/16)个候选区域的位置及大小。以及利用18个1*1卷积核(且步长为1)构成的卷积层生成18个尺寸大小为(m/16)*(n/16)个特征图,用于表示9*(m/16)*(n/16)个候选区域的正负分类。并且候选区域网络层还根据预设的步骤从9*(m/16)*(n/16)个候选区域中选择预定数量的候选区域(例如可以300个),并且根据卷积神经网络层(CNN层)输出的特征图,生成300个256*(m/16)*(n/16)形式的候选区域。
3)RoI池化层,该层利用候选区域网络层生成的候选区域和cnn层最后得到的特征图,得到固定大小的区域候选特征图(例如将(m/16)*(n/16)的候选区域转换为7*7的候选区域),进入到后面可以利用全连接操作来进行目标识别和定位,
4)Classifier层,该层会将ROI池化层形成固定大小的特征图进行全连接操作,利用softmax进行具体的类别分类,同时,利用Smooth L1 Loss完成边界框回归操作获得物体的精确位置。具体地,图5B示出了faster=RCNN神经网络的输出数据的形式的示意图。参见图5B所示,全连接层2输出一个多维向量,其中多维向量的每两个数值与一个候选区域对应,用于指示该候选区域包含印章图形的积分以及不包含印章图形的积分。例如,a1用于表示候选区域1包含印章图形的积分,b1用于表示候选区域1不包含印章图形的积分,a2用于表示候选区域2包含印章图形的积分,b2用于表示候选区域2不包含印章图形的积分。从而各个softmax分类器的输出也分别与各个候选区域包含印章图形的概率以及不包含印章图形的概率对应。例如c1表示候选区域1包含印章图形的概率,d1表示候选区域1不包含印章图形的概率,c2表示候选区域2包含印章图形的概率,d2表示候选区域2不包含印章图形的概率,等等。此外,全连接层3中边界框回归的输出为一个多维向量,其中该向量中每四个数值与一个候选区域对应,例如(x1,y1,w1,h1)用于表示候选区域1的位置和大小,(x2,y2,w2,h2)用于表示候选区域2的位置和大小。从而通过这种方式,能够确定与印章图形匹配的候选区域以及其位置和大小。
可选地,利用预先设置的第一神经网络,确定第一图像区域信息之后,还包括:在第一图像区域内,利用印章图形与背景字符的颜色差异,进行去噪处理。具体地,图6示出了经过去噪处理后的第一图像区域的示意图。在实际的复印件中,尽管复印件中的印章图形不再是红色,而是黑色,但是其颜色的深浅仍然与复印件中的文本的颜色深浅不同(参见图3和图4所示)。因此计算设备可以利用印章图形与背景字符的颜色差异,进行去噪处理,从而去除第一图像区域中的噪声(例如文字字符等)。具体地,可以通过直方图统计第一图像区域中的灰度分布,然后根据灰度分布的情况,确定位于背景字符与印章图形的灰度值之间的灰度阈值,然后将低于该灰度阈值的像素的灰度值设置为白色,从而去除背景字符的噪声。当然,也可以采用其他的去噪的方法,例如使用bm3d(block-matching and 3dfiltering,3维匹配滤波)进行降噪处理。此处不再一一列举。
可选地,根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字的操作,包括:根据第一图像区域信息确定圆形印章图形的中心位置以及圆形印章图形的外沿的半径;在由所确定的中心位置以及半径所限定的第二图像区域内识别印章图形中的文字。
具体地,参考图7所示,计算设备可以根据所确定的外切正方形,确定圆形印章图形的中心位置(x,y),以及圆形印章图形的外沿的半径r。从而根据所确定的中心位置(x,y)以及半径r,即可确定圆形印章的外沿所限定的圆形图像区域。从而可以更精准地在该圆形图像区域中识别印章图形中的文字。
进一步可选地,在由所确定的中心位置以及半径所限定的区域内识别印章图形中的文字的操作,还包括:利用预先设置的第二神经网络,在第二图像区域内确定包含印章图形中的文字的扇形图像区域;将扇形图像区域转换成能够采用OCR模型进行识别的图像区域;以及利用OCR模型对转换后的图像区域进行识别,确定述印章图形中的文字。
具体地,参考图8所示,计算设备利用第二神经网络,在第二图像区域100内确定包含印章图形中的文字的扇形图像区域101和102。
然后,参考图9和图10所示,计算设备利用几何方法对扇形图像区域101和102进行拉平,从而生成图9和图10中所示的能够采用OCR模型进行识别的图像区域。然后计算设备利用OCR模型对图9和图10中所示的图像区域进行文字识别,从而确定印章图形中的文字。从而通过这种方式,可以利用现有的OCR技术识别银行中呈扇形分布的文字信息。
可选地,利用预先设置的第二神经网络,在所限定的区域内定位包含印章中的文字的扇形图像区域的操作,包括:利用预先设置的PSENET神经网络,在所限定的区域内确定包含印章中的文字的扇形图像区域。
此外,需要特别说明的是:
一.Psenet的优势:
Psenet神经网络可以对任意形状的文本进行定位,而圆形印章中的文本属于任意形状中的一种。
相比之下,现有的基于回归的文本检测方法很难找到任意形状的文本,很难完全封闭在矩形中大多数基于像素的分割检测器可能不会将彼此非常接近的文本实例分开。
二.本实施例中PSENET网络结构及处理流程大致如下:
首先其骨干网络是resnet-34(因为其是一种具有固定结构的深度卷积网络,故对其不再做过多介绍)。
其次是类似于fpn(区域候选网络)的操作方法,可以生成一系列fpn的特征图。
三.后期算法处理流程:
3-1:将fpn特征图分为两类,将除第一个以外的特征图都上采样到第一个特征图的尺度;
3-2:对不同尺度的feature map进行相加;
3-3:进行1*1的卷积处理,输出若干个预测结果。
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上任意一项所述的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图11示出了根据本实施例的第一个方面所述的印章识别装置1100,该装置1100与根据实施例1的第一个方面所述的方法相对应。参考图11所示,该装置1100包括:图像获取模块1110,用于获取待识别图像,其中待识别图像中包括印章图形;第一图像区域确定模块1120,用于利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含印章图形的第一图像区域;以及文字识别模块1130,用于根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字。
可选地,印章图形为圆形印章图形,并且第一图像区域确定模块1120,包括:第一图像区域确定子模块,用于利用第一神经网络,在待识别图像中确定与圆形印章图形外切的正方形区域的区域信息作为第一图像区域信息。
可选地,第一图像区域确定模块1120,包括:第一图像区域确定子模块,用于利用预先设置的faster-RCNN卷积神经网络,确定第一图像区域信息。
可选地,装置还包括:去噪模块,用于在第一图像区域内,利用印章图形与背景字符的颜色差异,进行去噪处理。
可选地,文字识别模块,包括:圆形特征确定子模块,用于根据第一图像区域信息确定圆形印章图形的中心位置以及圆形印章图形的外沿的半径;以及文字识别子模块,用于在由所确定的中心位置以及半径所限定的第二图像区域内识别印章图形中的文字。
可选地,文字识别子模块,还包括:扇形图像区域确定单元,用于利用预先设置的第二神经网络,在第二图像区域内确定包含印章图形中的文字的扇形图像区域;图像区域转换模块,用于将扇形图像区域转换成能够采用OCR模型进行识别的图像区域;以及文字识别单元,用于利用OCR模型对转换后的图像区域进行识别,确定印章中的文字。
可选地,扇形图像区域确定单元,包括:扇形图像区域确定子单元,用于利用预先设置的PSENET神经网络,在所限定的区域内确定包含印章中的文字的扇形图像区域。
综上,本公开借助于基于深度学习的卷积神经网络替代现有技术中的利用HSI或者RGB等颜色模型估算圆心位置的方法,从而即便是在印章图形与文档中的文字颜色一致的情况下,也能够准确地定位出包含该印章图形的图像区域。从而克服了现有技术中存在的,印章和文档字体颜色一致时,不能准确确定印章在图像中的位置的技术问题。
实施例3
图12示出了根据本实施例所述的印章识别装置1200,该装置1200与根据实施例1的第一个方面所述的方法相对应。参考图12所示,该装置1200包括:,处理器1210;以及存储器1220,与所述处理器1210连接,用于为所述处理器1210提供处理以下处理步骤的指令:获取待识别图像,其中待识别图像中包括印章图形;利用预先设置的第一神经网络,确定第一图像区域信息,其中第一图像区域信息用于指示待识别图像中包含印章图形的第一图像区域;以及根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字。
可选地,印章图形为圆形印章图形,并且利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:利用第一神经网络,在待识别图像中确定与圆形印章图形外切的正方形区域的区域信息作为第一图像区域信息。
可选地,利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:利用预先设置的faster-RCNN卷积神经网络,确定第一图像区域信息。
可选地,利用预先设置的第一神经网络,确定第一图像区域信息之后,还包括:在第一图像区域内,利用印章图形与背景字符的颜色差异,进行去噪处理。
可选地,根据所确定的第一图像区域信息,在第一图像区域中识别印章图形中的文字的操作,包括:根据第一图像区域信息确定圆形印章图形的中心位置以及圆形印章图形的外沿的半径;以及在由所确定的中心位置以及半径所限定的第二图像区域内识别印章图形中的文字。
可选地,在由所确定的中心位置以及半径所限定的第二图像区域内识别印章图形中的文字的操作,还包括:利用预先设置的第二神经网络,在第二图像区域内确定包含印章图形中的文字的扇形图像区域;将扇形图像区域转换成能够采用OCR模型进行识别的图像区域;以及利用OCR模型对转换后的图像区域进行识别,确定印章中的文字。
可选地,利用预先设置的第二神经网络,在所限定的区域内定位包含印章中的文字的扇形图像区域的操作,包括:利用预先设置的PSENET神经网络,在所限定的区域内确定包含印章中的文字的扇形图像区域。
综上所述,本公开借助于基于深度学习的卷积神经网络替代现有技术中的利用HSI或者RGB等颜色模型估算圆心位置的方法,从而即便是在印章图形与文档中的文字颜色一致的情况下,也能够准确地定位出包含该印章图形的图像区域。从而克服了现有技术中存在的,印章和文档字体颜色一致时,不能准确确定印章在图像中的位置的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种印章识别方法,其特征在于,包括:
获取待识别图像,其中所述待识别图像中包括印章图形;
利用预先设置的第一神经网络,确定第一图像区域信息,其中所述第一图像区域信息用于指示所述待识别图像中包含所述印章图形的第一图像区域;
所述印章图形为圆形印章图形,并且利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:
利用所述第一神经网络,在所述待识别图像中确定与所述圆形印章图形外切的正方形区域的区域信息作为所述第一图像区域信息;
利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:利用预先设置的faster-RCNN卷积神经网络,确定所述第一图像区域信息;以及
根据所确定的第一图像区域信息,在所述第一图像区域中识别所述印章图形中的文字;
根据所确定的第一图像区域信息,在所述第一图像区域中识别所述印章图形中的文字的操作,包括:
根据所述第一图像区域信息确定所述圆形印章图形的中心位置以及所述圆形印章图形的外沿的半径;以及
在由所确定的中心位置以及半径所限定的第二图像区域内识别所述印章图形中的文字。
2.根据权利要求1所述的方法,其特征在于,利用预先设置的第一神经网络,确定第一图像区域信息之后,还包括:在所述第一图像区域内,利用所述印章图形与背景字符的颜色差异,进行去噪处理。
3.根据权利要求2所述的方法,其特征在于,在由所确定的中心位置以及半径所限定的第二图像区域内识别所述印章图形中的文字的操作,还包括:
利用预先设置的第二神经网络,在所述第二图像区域内确定包含所述印章图形中的文字的扇形图像区域;
将所述扇形图像区域转换成能够采用OCR模型进行识别的图像区域;以及
利用OCR模型对转换后的图像区域进行识别,确定所述印章中的文字。
4.根据权利要求3所述的方法,其特征在于,利用预先设置的第二神经网络,在所限定的区域内定位包含所述印章中的文字的扇形图像区域的操作,包括:利用预先设置的PSENET神经网络,在所限定的区域内确定包含所述印章中的文字的扇形图像区域。
5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至4中任意一项所述的方法。
6.一种印章识别装置,其特征在于,包括:
图像获取模块,用于获取待识别图像,其中所述待识别图像中包括印章图形;
第一图像区域确定模块,用于利用预先设置的第一神经网络,确定第一图像区域信息,其中所述第一图像区域信息用于指示所述待识别图像中包含所述印章图形的第一图像区域;
所述印章图形为圆形印章图形,并且利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:
利用所述第一神经网络,在所述待识别图像中确定与所述圆形印章图形外切的正方形区域的区域信息作为所述第一图像区域信息;
利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:利用预先设置的faster-RCNN卷积神经网络,确定所述第一图像区域信息;以及
文字识别模块,用于根据所确定的第一图像区域信息,在所述第一图像区域中识别所述印章图形中的文字;
根据所确定的第一图像区域信息,在所述第一图像区域中识别所述印章图形中的文字的操作,包括:
根据所述第一图像区域信息确定所述圆形印章图形的中心位置以及所述圆形印章图形的外沿的半径;以及
在由所确定的中心位置以及半径所限定的第二图像区域内识别所述印章图形中的文字。
7.一种印章识别装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获取待识别图像,其中所述待识别图像中包括印章图形;
利用预先设置的第一神经网络,确定第一图像区域信息,其中所述第一图像区域信息用于指示所述待识别图像中包含所述印章图形的第一图像区域;
所述印章图形为圆形印章图形,并且利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:
利用所述第一神经网络,在所述待识别图像中确定与所述圆形印章图形外切的正方形区域的区域信息作为所述第一图像区域信息;
利用预先设置的第一神经网络,确定第一图像区域信息的操作,包括:利用预先设置的faster-RCNN卷积神经网络,确定所述第一图像区域信息;以及
根据所确定的第一图像区域信息,在所述第一图像区域中识别所述印章图形中的文字;
根据所确定的第一图像区域信息,在所述第一图像区域中识别所述印章图形中的文字的操作,包括:
根据所述第一图像区域信息确定所述圆形印章图形的中心位置以及所述圆形印章图形的外沿的半径;以及
在由所确定的中心位置以及半径所限定的第二图像区域内识别所述印章图形中的文字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911378424.0A CN111178355B (zh) | 2019-12-27 | 2019-12-27 | 印章识别方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911378424.0A CN111178355B (zh) | 2019-12-27 | 2019-12-27 | 印章识别方法、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111178355A CN111178355A (zh) | 2020-05-19 |
CN111178355B true CN111178355B (zh) | 2024-05-10 |
Family
ID=70654086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911378424.0A Active CN111178355B (zh) | 2019-12-27 | 2019-12-27 | 印章识别方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111178355B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767911B (zh) * | 2020-06-22 | 2024-06-28 | 平安科技(深圳)有限公司 | 面向复杂环境的印章文字检测识别方法、装置及介质 |
CN111950356B (zh) * | 2020-06-30 | 2024-04-19 | 深圳市雄帝科技股份有限公司 | 印章文本定位方法、装置及电子设备 |
CN112507946A (zh) * | 2020-12-18 | 2021-03-16 | 北京百度网讯科技有限公司 | 用于处理图像的方法、装置、设备以及存储介质 |
CN112784835B (zh) * | 2021-01-21 | 2024-04-12 | 恒安嘉新(北京)科技股份公司 | 圆形印章的真实性识别方法、装置、电子设备及存储介质 |
CN113033325A (zh) * | 2021-03-04 | 2021-06-25 | 杭州睿胜软件有限公司 | 图像处理方法及装置、智能发票识别设备和存储介质 |
CN112766275B (zh) * | 2021-04-08 | 2021-09-10 | 金蝶软件(中国)有限公司 | 印章文字识别方法、装置、计算机设备和存储介质 |
CN113378821B (zh) * | 2021-07-02 | 2023-02-28 | 人民中科(济南)智能技术有限公司 | 基于深度学习的公章文字识别方法、系统、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3022236U (ja) * | 1995-08-31 | 1996-03-22 | 耀元電子股▲ふん▼有限公司 | 神経ネットワークに類似の印鑑照合システム |
JPH11110411A (ja) * | 1997-10-03 | 1999-04-23 | Ebaretto Sogo Kenkyusho:Kk | 印鑑またはサインを含む書面のデータベース化システム |
WO2005064524A1 (fr) * | 2003-12-30 | 2005-07-14 | Ruizhen Liu | Systeme de sceau numerique |
CN107944452A (zh) * | 2017-12-12 | 2018-04-20 | 深圳市创业印章实业有限公司 | 一种圆形印章文字识别方法 |
CN109145723A (zh) * | 2018-07-09 | 2019-01-04 | 长江大学 | 一种印章识别方法、系统、终端装置及存储介质 |
CN109376658A (zh) * | 2018-10-26 | 2019-02-22 | 信雅达系统工程股份有限公司 | 一种基于深度学习的ocr方法 |
CN109657666A (zh) * | 2018-11-23 | 2019-04-19 | 汉王科技股份有限公司 | 一种圆形印章识别方法及装置 |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN110443250A (zh) * | 2019-07-31 | 2019-11-12 | 天津车之家数据信息技术有限公司 | 一种合同印章的类别识别方法、装置和计算设备 |
-
2019
- 2019-12-27 CN CN201911378424.0A patent/CN111178355B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3022236U (ja) * | 1995-08-31 | 1996-03-22 | 耀元電子股▲ふん▼有限公司 | 神経ネットワークに類似の印鑑照合システム |
JPH11110411A (ja) * | 1997-10-03 | 1999-04-23 | Ebaretto Sogo Kenkyusho:Kk | 印鑑またはサインを含む書面のデータベース化システム |
WO2005064524A1 (fr) * | 2003-12-30 | 2005-07-14 | Ruizhen Liu | Systeme de sceau numerique |
CN107944452A (zh) * | 2017-12-12 | 2018-04-20 | 深圳市创业印章实业有限公司 | 一种圆形印章文字识别方法 |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN109145723A (zh) * | 2018-07-09 | 2019-01-04 | 长江大学 | 一种印章识别方法、系统、终端装置及存储介质 |
CN109376658A (zh) * | 2018-10-26 | 2019-02-22 | 信雅达系统工程股份有限公司 | 一种基于深度学习的ocr方法 |
CN109657666A (zh) * | 2018-11-23 | 2019-04-19 | 汉王科技股份有限公司 | 一种圆形印章识别方法及装置 |
CN110443250A (zh) * | 2019-07-31 | 2019-11-12 | 天津车之家数据信息技术有限公司 | 一种合同印章的类别识别方法、装置和计算设备 |
Non-Patent Citations (1)
Title |
---|
卷积神经网络在印章编号识别中的应用;阳哲;;现代计算机(专业版)(04);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111178355A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111178355B (zh) | 印章识别方法、装置和存储介质 | |
CN111160352B (zh) | 一种基于图像分割的工件金属表面文字识别方法及系统 | |
CN110659647B (zh) | 印章图像识别方法及装置、智能发票识别设备和存储介质 | |
US10410353B2 (en) | Multi-label semantic boundary detection system | |
US10817741B2 (en) | Word segmentation system, method and device | |
CN107944450B (zh) | 一种车牌识别方法及装置 | |
US20210256258A1 (en) | Method, apparatus, and computer program for extracting representative characteristics of object in image | |
US11823358B2 (en) | Handwritten content removing method and device and storage medium | |
EP3806064A1 (en) | Method and apparatus for detecting parking space usage condition, electronic device, and storage medium | |
CN109753953B (zh) | 图像中定位文本的方法、装置、电子设备和存储介质 | |
CN111680690B (zh) | 一种文字识别方法及装置 | |
CN112418216A (zh) | 一种复杂自然场景图像中的文字检测方法 | |
WO2024002014A1 (zh) | 交通标线的识别方法、装置、计算机设备和存储介质 | |
CN114444565B (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
KR101842535B1 (ko) | 부호의 광학적 검출 방법 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN109886059B (zh) | 一种基于宽度学习的qr码图像检测方法 | |
CN111274863A (zh) | 一种基于文本山峰概率密度的文本预测方法 | |
CN111178153A (zh) | 一种交通标志检测方法及系统 | |
CN114841974A (zh) | 一种水果内部结构无损检测方法、系统、电子设备及介质 | |
CN111199240A (zh) | 银行卡识别模型的训练方法、银行卡识别方法以及装置 | |
CN111401365B (zh) | Ocr图像自动生成方法及装置 | |
CN110414497A (zh) | 对象电子化的方法、装置、服务器及存储介质 | |
CN116311290A (zh) | 基于深度学习的手写及打印文本检测方法和装置 | |
CN109871910B (zh) | 一种手写字符识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |