CN112348022A - 一种基于深度学习的自由格式文档识别方法 - Google Patents
一种基于深度学习的自由格式文档识别方法 Download PDFInfo
- Publication number
- CN112348022A CN112348022A CN202011168354.9A CN202011168354A CN112348022A CN 112348022 A CN112348022 A CN 112348022A CN 202011168354 A CN202011168354 A CN 202011168354A CN 112348022 A CN112348022 A CN 112348022A
- Authority
- CN
- China
- Prior art keywords
- document
- template
- recognition
- deep learning
- rectangular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000013135 deep learning Methods 0.000 title claims abstract description 31
- 239000012634 fragment Substances 0.000 claims abstract description 78
- 238000001514 detection method Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 7
- 238000012545 processing Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 12
- 238000003058 natural language processing Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及一种基于深度学习的自由格式文档识别方法,包括以下步骤:定义模板,所述模板中包含多个矩形碎片的坐标位置;获取待识别文档;OCR引擎全文识别,以判断待识别文档所属模板;调用模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有矩形碎片及其坐标位置对应在待识别文档中;根据矩形碎片及其坐标位置切割待识别文档,形成多个碎片文件;将多个碎片文件存入数据库,并将多个碎片文件传入消息队列中;OCR引擎继续识别消息队列中的碎片文件,得到识别结果;返回碎片文件和识别结果到数据库;完成识别。本发明通过两次采用OCR引擎进行识别,提高了识别的准确率;还通过提前定义模板及矩形碎片等,从而明确被识别内容的作用和意义。
Description
技术领域
本发明涉及识别技术领域,特别涉及一种基于深度学习的自由格式文档识别方法。
背景技术
文档识别任务一般通过一定的图像处理来识别图像中的文本内容。文本识别可应用于许多领域,如信件和包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总、商品编码的识别、商品仓库的管理,以及文档检索等,综上就是各类证件识别和财务票据处理的办公自动化等。方便用户快速录入信息,提高各行各业的工作效率。
目前关于文本识别方法有多种,例如基于传统图像处理,对字符进行分割,然后单独分类识别,其中一般需要对图像进行灰度化、二值化、阈值分割、归一化、支持向量机(Support Vector Machine,SVM)分类等来完成识别;再例如就是对具体的打印文档OCR识别结果进行自然语言处理,获得想要的信息。虽然OCR识别的适用范围比较通用,但也有它的缺点,处理过程比较复杂且不可见,不能保证输出完全正确。深度学习自然语言处理对于结果正确率的保障极其依赖于训练数据。对于专业文档来说语义是极其复杂的,现在市面上对于法律和财会等专业文档的自然语言处理引擎都不能保证很好的效果,基本上处理正确率能在80%就已经是很高了。
发明人在实施现有识别方法的过程中发现,现有识别方法存在如下缺点:
基于传统图像处理方法往往需要人工针对性的设计一些特征,中间还要穿插一些规则对算法处理不当的地方进行修正,并且对于图像背景复杂、干扰多,字符粘结严重的情况,传统方法处理的效果不是很好。而对具体的打印文档OCR识别结果进行自然语言处理,存在着处理过程比较复杂且不可见,正确率低等缺陷。
并且,目前市场上识别产品的功能主要是能把图片中的文字信息提取出来,但是并不知道提取出来的文字是什么意思。对于信息量巨大的财报或其他打印文档,如果不能准确知道识别的信息的标签,全部识别出来对于具体业务是几乎没有意义的。
因此有必要提供一种基于深度学习的自由格式文档识别方法,以解决现有技术中文档识别正确率低以及不能明确识别文字的标签的问题。
发明内容
本发明的目的在于提供一种基于深度学习的自由格式文档识别方法,以解决现有技术中文档识别正确率低以及不能明确识别文字的标签的问题。
为了解决现有技术中存在的问题,本发明提供了一种基于深度学习的自由格式文档识别方法,包括以下步骤:
定义模板,所述模板中包含多个矩形碎片的坐标位置;
获取待识别文档;
OCR引擎全文识别,以判断所述待识别文档所属模板;
调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;
根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
将所述多个碎片文件存入数据库,并将所述多个碎片文件传入消息队列中;
OCR引擎继续识别消息队列中的碎片文件,得到识别结果;
返回所述碎片文件和识别结果到数据库;
完成识别。
可选的,在所述基于深度学习的自由格式文档识别方法中,各碎片文件均具有各自的UUID。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述碎片文件包括:UUID、命名、坐标位置、编号以及识别引擎。
可选的,在所述基于深度学习的自由格式文档识别方法中,OCR引擎继续识别消息队列中的碎片文件的过程中,采用RCNN模型进行图片文本识别,得到识别结果。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述模板包括:证件类模板、申请书类模板、审批类模板和报表类模板;
各类模板中包括多种模板。
可选的,在所述基于深度学习的自由格式文档识别方法中,定义模板包括以下步骤:
上传具有模板的图片;
定义模板的名称;
在所述图片中画出所有的矩形碎片,并显示所有矩形碎片的坐标位置;
选择各所述矩形碎片的识别引擎;
填写各所述矩形碎片的标签;
完成模板定义。
可选的,在所述基于深度学习的自由格式文档识别方法中,在获取待识别文档之后,OCR引擎全文识别之前,还包括以下步骤:
主动选择对应模板。
可选的,在所述基于深度学习的自由格式文档识别方法中,在OCR引擎全文识别之后,调用所述模板中所有的坐标位置之前,还包括以下步骤:
对所述待识别文档进行预处理;
所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述待识别文档包括:单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。
可选的,在所述基于深度学习的自由格式文档识别方法中,若所述待识别文档不能归属于现有模板中任意一个模板,则不对所述待识别文档进行处理。
本发明相对于现有技术,具有以下优点:
(1)通过先识别待识别文档中的碎片文件及其坐标位置,再识别各碎片文件中的图片内容的方式,实现了异步识别;
(2)通过异步识别待识别文档的方式,解耦了图片输入处理服务和OCR引擎服务,保证了对大批量高并发识别请求的稳定处理,削除了请求高峰,合理分发了请求,另外,异步处理过程缓存了快速度服务的请求,解决了两个服务速度差异的冲突;
(3)通过采用OCR引擎继续识别消息队列中的碎片文件,提高了识别的准确率;
(4)通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;
(5)可用于自动识别、提取和存储自由格式文档中的文本内容;
(6)节省人工录入成本。
附图说明
图1为本发明实施例提供的识别待识别文档的流程图;
图2为本发明实施例提供的定义模板的流程图。
具体实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
在下文中,如果本文所述的方法包括一系列步骤,则本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序,且一些所述的步骤可被省略和/或一些本文未描述的其他步骤可被添加到该方法中。
目前市场上识别产品的功能主要是能把图片中的文字信息提取出来,但是并不知道提取出来的文字是什么意思,且识别的准确率不高。对于信息量巨大的财报或其他打印文档,如果不能准确知道识别的信息的标签,全部识别出来对于具体业务是几乎没有意义的。
因此有必要提供一种基于深度学习的自由格式文档识别方法,如图1所示,图1为本发明实施例提供的识别待识别文档的流程图,所述识别方法包括以下步骤:
定义模板,所述模板中包含多个矩形碎片的坐标位置;
获取待识别文档;
OCR引擎全文识别,以判断所述待识别文档所属模板;
调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;
根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
将所述多个碎片文件存入数据库,并将所述多个碎片文件传入消息队列中;
OCR引擎继续识别消息队列中的碎片文件,得到识别结果;
返回所述碎片文件和识别结果到数据库;
完成识别。
本发明通过先识别待识别文档中的碎片文件及其坐标位置,将得到的多个碎片文件传入消息队列中,再依次从消息队列中获取并识别各碎片文件中的图片内容的方式,实现了异步识别;通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;本发明可用于自动识别、提取和存储自由格式文档中的文本内容,使各种打印文档与各业务系统之间所需信息能够快速转换并输入。
在一个实施例中,所述识别方法可以采用前台录入GUI、web管理界面、定义模板模块、OCR引擎(可以为深度学习OCR识别引擎)和处理系统。其中,前台录入GUI和web管理界面用于为定义模板和输入待识别文档提供pdf文档录入界面和接口,识别结果查看和审核功能等。定义模板模块基于golang实现,用于定义模板的特征识别区域的位置和文本信息。OCR引擎和处理系统可以采用RCNN模型进行全文识别并且比对所述待识别文档,从而明确所述待识别文档所属的模板;OCR引擎在文本识别过程中分为两个步骤,首先是采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中,第一步骤用于对待识别文档进行全文识别,速度稍微慢点,返回全部识别结果和识别结果的位置信息;其次是基于RCNN模型进行图片文本识别,得到识别结果,第二步骤用于对于已切图片碎片的直接识别,速度快并且准确度高。采用本发明中的识别方法,识别结果可以达到98%以上的识别准确率,其中仅存在OCR引擎识别带来的误差,其余部分由于已经定义模板,使所有识别流程均是确定的系统处理过程。其中,YOLO目标检测模型的算法详情可以参考论文《You only look once unified real-time object detection》,RCNN模型算法详情可以参考现有技术中RCNN的介绍。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述模板包括:证件类模板、申请书类模板、审批类模板和报表类模板;各类模板中包括多种模板。
进一步的,如图1和2所示,图2为本发明实施例提供的定义模板的流程图,定义模板包括以下步骤:
上传具有模板的图片;
定义模板的名称;
在所述图片中画出所有的矩形碎片,待画出所有目标矩形碎片后,点击编辑模板,计算并显示所有矩形碎片的坐标位置,在此基础上定义任一矩形碎片为特征识别区域;
选择各所述矩形碎片的识别引擎,不同的识别引擎可以调用不同的后台OCR引擎;
填写各所述矩形碎片的标签;
完成模板定义。
模板例如身份证模板、银行系统中存款账户开户申请书模板等等,定义特定的照片识别区域、证件号码识别区域、姓名识别区域、电子邮箱识别区域以及联系方式识别区域等等,从而形成不同模板的不同矩形碎片,选择识别引擎并填写矩形碎片的标签,完成不同模板的定义。
本发明通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;并且使所有识别流程均是确定的系统处理过程,提高识别准确率。
在一个实施例中,在获取待识别文档之后,OCR引擎全文识别之前,还包括以下步骤:主动选择对应模板。若已经明确模板,则可以主动选择模板,在识别过程中,可以再采用RCNN模型进行全文识别核实。若不清楚待识别文档所属模板,则通过RCNN模型进行全文识别比对查找模板。
接着,OCR引擎全文识别,以判断所述待识别文档所属模板。
优选的,在OCR引擎全文识别之后,调用所述模板中所有的坐标位置之前,还包括以下步骤:
对所述待识别文档进行预处理;
所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。优选的,预处理阶段中,可以通过opencv形态学操作获取待识别文档的矩形元素,并由腐蚀和膨胀等操作初步获取待识别文档形态学位置,再通过霍夫变换确定待识别文档直线角度信息,然后通过直线角度信息整体旋转图片以获得纠正的标准图片。此方法主要是为了纠正待识别文档在扫描过程中带入的角度和位置偏移,为之后的待识别文档碎片化做准备。
进一步的,调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;并根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
优选的,各碎片文件均具有各自的UUID,可以理解为本发明将待识别文档中需要的部分切分出来单独识别,并且打上标签,作为需要提取的结果让计算机处理或者存储。优选的,所述碎片文件中包括但不限于:UUID、命名、坐标位置、编号以及识别引擎;所述碎片文件可以存储于数据库中。
优选的,将所述多个碎片文件传入消息队列中,每种或几种不同的业务分别存储在不同的queen中,作为消息队列消息的生产过程。另外本发明可以设置一个程序读取rabbitmq中消息队列的信息,每读取到一个碎片文件的信息,便按照坐标位置重新读取并根据识别引擎发送到下游不同的OCR引擎中,获得识别引擎的返回结果后,最后通过碎片的编号等信息更新此碎片文件的识别结果到数据库。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述待识别文档包括:单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。
可选的,在所述基于深度学习的自由格式文档识别方法中,若所述待识别文档不能归属于现有模板中任意一个模板,则不对所述待识别文档进行处理。优选的,可以将不能识别的待识别文档重新定义为一个新的模板存储的数据库中,以便后续能识别更多的文档。
本发明相对于现有技术,具有以下优点:
(1)通过先识别待识别文档中的碎片文件及其坐标位置,再识别各碎片文件中的图片内容的方式,实现了异步识别;
(2)通过异步识别待识别文档的方式,解耦了图片输入处理服务和OCR引擎服务,保证了对大批量高并发识别请求的稳定处理,削除了请求高峰,合理分发了请求,另外,异步处理过程缓存了快速度服务的请求,解决了两个服务速度差异的冲突;
(3)通过采用OCR引擎继续识别消息队列中的碎片文件,提高了识别的准确率;
(4)通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;
(5)可用于自动识别、提取和存储自由格式文档中的文本内容;
(6)节省人工录入成本。
上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。
Claims (10)
1.一种基于深度学习的自由格式文档识别方法,其特征在于,包括以下步骤:
定义模板,所述模板中包含多个矩形碎片的坐标位置;
获取待识别文档;
OCR引擎全文识别,以判断所述待识别文档所属模板;
调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;
根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
将所述多个碎片文件存入数据库,并将所述多个碎片文件传入消息队列中;
OCR引擎继续识别消息队列中的碎片文件,得到识别结果;
返回所述碎片文件和识别结果到数据库;
完成识别。
2.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,各碎片文件均具有各自的UUID。
3.如权利要求2所述的基于深度学习的自由格式文档识别方法,其特征在于,所述碎片文件包括:UUID、命名、坐标位置、编号以及识别引擎。
4.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,OCR引擎继续识别消息队列中的碎片文件的过程中,采用RCNN模型进行图片文本识别,得到识别结果。
5.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,所述模板包括:证件类模板、申请书类模板、审批类模板和报表类模板;
各类模板中包括多种模板。
6.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,定义模板包括以下步骤:
上传具有模板的图片;
定义模板的名称;
在所述图片中画出所有的矩形碎片,并显示所有矩形碎片的坐标位置;
选择各所述矩形碎片的识别引擎;
填写各所述矩形碎片的标签;
完成模板定义。
7.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,在获取待识别文档之后,OCR引擎全文识别之前,还包括以下步骤:
主动选择对应模板。
8.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,在OCR引擎全文识别之后,调用所述模板中所有的坐标位置之前,还包括以下步骤:
对所述待识别文档进行预处理;
所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。
9.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,所述待识别文档包括:单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。
10.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,若所述待识别文档不能归属于现有模板中任意一个模板,则不对所述待识别文档进行处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011168354.9A CN112348022B (zh) | 2020-10-28 | 2020-10-28 | 一种基于深度学习的自由格式文档识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011168354.9A CN112348022B (zh) | 2020-10-28 | 2020-10-28 | 一种基于深度学习的自由格式文档识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112348022A true CN112348022A (zh) | 2021-02-09 |
CN112348022B CN112348022B (zh) | 2024-05-07 |
Family
ID=74359289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011168354.9A Active CN112348022B (zh) | 2020-10-28 | 2020-10-28 | 一种基于深度学习的自由格式文档识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112348022B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113192607A (zh) * | 2021-04-13 | 2021-07-30 | 复旦大学附属中山医院 | 标注处理方法、装置、计算机设备和存储介质 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140046954A1 (en) * | 2012-08-07 | 2014-02-13 | 3M Innovative Properties Company And A Completed | Software tool for creation and management of document reference templates |
CN103744884A (zh) * | 2013-12-23 | 2014-04-23 | 武汉传神信息技术有限公司 | 一种整理信息碎片的方法及系统 |
CN104123550A (zh) * | 2013-04-25 | 2014-10-29 | 魏昊 | 基于云计算的文本扫描识别方法 |
CN104639950A (zh) * | 2015-02-06 | 2015-05-20 | 北京量子伟业信息技术股份有限公司 | 基于碎片化技术的影像加工系统及方法 |
CN106250987A (zh) * | 2016-07-22 | 2016-12-21 | 无锡华云数据技术服务有限公司 | 一种机器学习方法、装置及大数据平台 |
CN109492643A (zh) * | 2018-10-11 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于ocr的证件识别方法、装置、计算机设备及存储介质 |
CN109558846A (zh) * | 2018-11-30 | 2019-04-02 | 厦门商集网络科技有限责任公司 | 基于ocr模板归一化提升自定义模板识别率方法及设备 |
CN109656733A (zh) * | 2018-12-27 | 2019-04-19 | 厦门商集网络科技有限责任公司 | 智能调度多ocr识别引擎的方法及设备 |
CN109800761A (zh) * | 2019-01-25 | 2019-05-24 | 厦门商集网络科技有限责任公司 | 基于深度学习模型创建纸质文档结构化数据的方法和终端 |
CN110008944A (zh) * | 2019-02-20 | 2019-07-12 | 平安科技(深圳)有限公司 | 基于模板匹配的ocr识别方法及装置、存储介质 |
CN110334585A (zh) * | 2019-05-22 | 2019-10-15 | 平安科技(深圳)有限公司 | 表格识别方法、装置、计算机设备和存储介质 |
CN110751143A (zh) * | 2019-09-26 | 2020-02-04 | 中电万维信息技术有限责任公司 | 一种电子发票信息的提取方法及电子设备 |
CN110942061A (zh) * | 2019-10-24 | 2020-03-31 | 泰康保险集团股份有限公司 | 文字识别方法、装置、设备和计算机可读介质 |
CN111259882A (zh) * | 2020-01-14 | 2020-06-09 | 平安科技(深圳)有限公司 | 票据识别的方法、装置及计算机设备 |
US20200226400A1 (en) * | 2019-01-11 | 2020-07-16 | Microsoft Technology Licensing, Llc | Compositional model for text recognition |
US20200293714A1 (en) * | 2019-03-14 | 2020-09-17 | Proov Systems Ltd | Method, system and computer program product for generating artificial documents |
CN111709349A (zh) * | 2020-06-11 | 2020-09-25 | 杭州尚尚签网络科技有限公司 | 一种针对带表格合同的ocr识别方法 |
-
2020
- 2020-10-28 CN CN202011168354.9A patent/CN112348022B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140046954A1 (en) * | 2012-08-07 | 2014-02-13 | 3M Innovative Properties Company And A Completed | Software tool for creation and management of document reference templates |
CN104123550A (zh) * | 2013-04-25 | 2014-10-29 | 魏昊 | 基于云计算的文本扫描识别方法 |
CN103744884A (zh) * | 2013-12-23 | 2014-04-23 | 武汉传神信息技术有限公司 | 一种整理信息碎片的方法及系统 |
CN104639950A (zh) * | 2015-02-06 | 2015-05-20 | 北京量子伟业信息技术股份有限公司 | 基于碎片化技术的影像加工系统及方法 |
CN106250987A (zh) * | 2016-07-22 | 2016-12-21 | 无锡华云数据技术服务有限公司 | 一种机器学习方法、装置及大数据平台 |
CN109492643A (zh) * | 2018-10-11 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于ocr的证件识别方法、装置、计算机设备及存储介质 |
CN109558846A (zh) * | 2018-11-30 | 2019-04-02 | 厦门商集网络科技有限责任公司 | 基于ocr模板归一化提升自定义模板识别率方法及设备 |
CN109656733A (zh) * | 2018-12-27 | 2019-04-19 | 厦门商集网络科技有限责任公司 | 智能调度多ocr识别引擎的方法及设备 |
US20200226400A1 (en) * | 2019-01-11 | 2020-07-16 | Microsoft Technology Licensing, Llc | Compositional model for text recognition |
CN109800761A (zh) * | 2019-01-25 | 2019-05-24 | 厦门商集网络科技有限责任公司 | 基于深度学习模型创建纸质文档结构化数据的方法和终端 |
CN110008944A (zh) * | 2019-02-20 | 2019-07-12 | 平安科技(深圳)有限公司 | 基于模板匹配的ocr识别方法及装置、存储介质 |
US20200293714A1 (en) * | 2019-03-14 | 2020-09-17 | Proov Systems Ltd | Method, system and computer program product for generating artificial documents |
CN110334585A (zh) * | 2019-05-22 | 2019-10-15 | 平安科技(深圳)有限公司 | 表格识别方法、装置、计算机设备和存储介质 |
CN110751143A (zh) * | 2019-09-26 | 2020-02-04 | 中电万维信息技术有限责任公司 | 一种电子发票信息的提取方法及电子设备 |
CN110942061A (zh) * | 2019-10-24 | 2020-03-31 | 泰康保险集团股份有限公司 | 文字识别方法、装置、设备和计算机可读介质 |
CN111259882A (zh) * | 2020-01-14 | 2020-06-09 | 平安科技(深圳)有限公司 | 票据识别的方法、装置及计算机设备 |
CN111709349A (zh) * | 2020-06-11 | 2020-09-25 | 杭州尚尚签网络科技有限公司 | 一种针对带表格合同的ocr识别方法 |
Non-Patent Citations (4)
Title |
---|
JOSEPH REDMON等: "You only look once:unified, real-time object detaction", IEEE XPLORE, pages 779 - 788 * |
MOHAMED KERWAT等: "Detecting knowledge artifacts in scientific document images-comparing deep learing architetures", IEEE XPLORE, pages 147 - 152 * |
姜维 等: "基于深度学习的场景文字检测综述", 电子学报, pages 1152 - 1161 * |
李尚林;王鲁达;刘东;: "基于CNN的银行卡数字识别方法", 图学学报, no. 01, pages 84 - 90 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113192607A (zh) * | 2021-04-13 | 2021-07-30 | 复旦大学附属中山医院 | 标注处理方法、装置、计算机设备和存储介质 |
CN113192607B (zh) * | 2021-04-13 | 2024-03-26 | 复旦大学附属中山医院 | 标注处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112348022B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112508011A (zh) | 一种基于神经网络的ocr识别方法及设备 | |
US8064703B2 (en) | Property record document data validation systems and methods | |
CN103995904B (zh) | 一种影像档案电子资料的识别系统 | |
Wilkinson et al. | Neural Ctrl-F: segmentation-free query-by-string word spotting in handwritten manuscript collections | |
CN112800848A (zh) | 票据识别后信息结构化提取方法、装置和设备 | |
CN110909123B (zh) | 一种数据提取方法、装置、终端设备及存储介质 | |
CN112818785A (zh) | 一种气象纸质表格文档的快速数字化方法及系统 | |
CN103996055A (zh) | 基于影像档案电子资料识别系统中分类器的识别方法 | |
CN111858977B (zh) | 票据信息采集方法、装置、计算机设备和存储介质 | |
CN112348022B (zh) | 一种基于深度学习的自由格式文档识别方法 | |
CN112149654B (zh) | 基于深度学习的发票文本信息识别方法 | |
CN112036330A (zh) | 一种文本识别方法、文本识别装置及可读存储介质 | |
KR20180126352A (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
CN113553852B (zh) | 一种基于神经网络的合同信息提取方法、系统和存储介质 | |
CN117076455A (zh) | 一种基于智能识别的保单结构化存储方法、介质及系统 | |
CN116844182A (zh) | 一种版式自动识别的卡证文字识别方法 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
CN114202761B (zh) | 一种基于图片信息聚类的信息批量提取方法 | |
CN115640952B (zh) | 一种数据导入上传的方法及系统 | |
CN118585573B (zh) | 一种版式文件结构化处理方法 | |
CN117612182A (zh) | 文档分类方法、装置、电子设备和介质 | |
CN118053171A (zh) | 基于人工智能和大数据技术对多国邮快件面单识别的方法 | |
JPH0589279A (ja) | 文字認識装置 | |
CN115063114A (zh) | 一种合同补录自动化方法、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |