CN102332088B - 一种基于游程特征的选票符号机器视觉识别方法 - Google Patents
一种基于游程特征的选票符号机器视觉识别方法 Download PDFInfo
- Publication number
- CN102332088B CN102332088B CN201110169656.2A CN201110169656A CN102332088B CN 102332088 B CN102332088 B CN 102332088B CN 201110169656 A CN201110169656 A CN 201110169656A CN 102332088 B CN102332088 B CN 102332088B
- Authority
- CN
- China
- Prior art keywords
- swimming
- distance
- region
- segment
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000000007 visual effect Effects 0.000 title claims abstract description 12
- 238000013138 pruning Methods 0.000 claims abstract description 12
- 238000003066 decision tree Methods 0.000 claims abstract description 11
- 230000009182 swimming Effects 0.000 claims description 197
- 238000012545 processing Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 241000238876 Acari Species 0.000 claims description 6
- 230000019771 cognition Effects 0.000 claims description 6
- 239000012634 fragment Substances 0.000 claims description 5
- 238000007789 sealing Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 8
- 238000012015 optical character recognition Methods 0.000 description 8
- 238000012937 correction Methods 0.000 description 5
- 230000007797 corrosion Effects 0.000 description 4
- 238000005260 corrosion Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于游程特征的选票符号机器视觉识别方法,包括以下步骤:(1)得到经过预处理后的符号图像后,自上而下,自左向右扫描整幅图像,当扫描到第一次出现游程的那一行时,初始化三叉树结构,将那一行中最中间的游程加入到根节点中,根据其他各游程的左右关系,依次创建左右根节点,初步形成一颗三叉树结构;(2)完成整个符号图像的扫描,完成创建一颗表征选票符号的三叉树;(3)对于得到的三叉树进行剪枝和合并处理,使得三叉树只由一个或两个大块的游程区域组成,而且在同一个方向都只有一个游程区域;(4)对于得到的三叉树,在决策树中进行自左向右的验证,到达一个叶子节点后就获得了符号的类别。本发明正确率高、识别速度较快。
Description
技术领域
本发明涉及一种选票符号机器视觉识别方法。
背景技术
随着社会的进步,民主制度的完善,既能体现选民意愿又能快速正确统计出结果的选举方式越来越受到大家的青睐。现存的选举方式是多种多样的,如传统的人工唱票,举手表决、电子选举等,但根据投票与计票方式的不同,可将当前选举模式概括为三类:纸质选票人工唱票、无纸化电子选举、基于机器视觉的纸质选举。
纸质选票人工唱票方式是一种传统的全纸质选举计票方式,其特点在于人工统计选票的工作量大,计票速度慢,但纸质选票具有可验证性、用户易接受等优点。
而无纸化电子选举是选举在形式上的一次崭新飞跃,无纸化电子选举方式的研究和应用主要集中在国外。在国内,一些大型的选举场合也采用电子选举方式,如浙江省人大会堂等。它的优点是计票快捷准确、节省人力和开支、投票方便等,有着传统投票方式无法企及的优越性。尽管如此,该方式仍然受到了广大选民的质疑,存在的很多问题,如安全性、票据的不可验证性等。
为了弥补人工唱票和电子选举的不足,基于机器视觉的纸质选举系统开始出现。相对于前两种选举方式,基于机器视觉的纸质选举方式的主要优点是,统计效率高且票据可验证性。表1是对3种选票模式的比较。
表1
基于机器视觉的选票识别技术主要分为OMR(Optical Mark Recognition,光学标记识别)和OCR(Optical Character Recognition,光学字符识别)两种。基于OMR的选票统计系统存在的问题有,选票格式固定,且为涂卡式,与人们通常采用的打勾、叉、圈的习惯不相吻合,因此市场接受程度较低。而基于OCR的选票统计系统克服了基于OMR选票统计系统不灵活的缺点,它的特点是选票格式相对灵活,选票符号采用人们易于接受的勾、叉、圈,硬件成本较低等。
基于OCR的选票统计系统是利用小字符集选票符号的不同特征来对选票进行自动识别。其大致工作流程是,先利用图像采集设备获取选票灰度图像,再通过各种预处理技术得到待识别的单个选票符号,接着从待识别的单个选票符号提取出其统计特征或结构特征,然后,通过某种分类器根据该符号的特征来将符号分类,最后,统计出所识别的全部选票符号以完成选票自动统计。
虽然现在纸质选票统计系统只能应用在中小型会议中,且普及率也不是很高,但正如Wendy M.Grossman(美,2004)所言,纸质选举自动计票方式将成为一种新的潮流。而随着计算机计算性能的不断增强,基于OCR的选票统计系统的计算弱势正在逐渐消除。
目前,国内外虽然基于OCR的选票统计系统的研究很少,但基于OCR的其他字符识别系统却有很多,如票据自动识别系统(如张红云(同济大学,2006)等),车牌字符自动识别系统(如王敏(华中科技大学,2001)等),钢坯标号自动识别系统(如张浩(浙江大学,2007)等)等。各种基于OCR的字符识别系统的研究的内容虽然千差万别,但系统的核心问题都是利用字符符号的某种特征实现对字符符号的识别,因此,特征提取模块是核心,其他模块中所采用的方法都是服务于特征提取而采用的。
对于一个选票统计系统,现存的问题还是比较多的:
如通过图像采集设备获得的图像不可避免地会出现倾斜现象,这给后续的选票符号识别带来了困难;现有通过手写符号识别算法来识别选票符号的办法,其识别正确率低,识别速度慢。而对于选举这样一个严肃的事情,采取何种机制来保证100%的识别正确率也是一个亟待解决的问题。
发明内容
为了克服现有的选票符号机器视觉识别方法的正确率低、识别速度慢的不足,本发明提供一种正确率高、识别速度较快的基于游程特征的选票符号机器视觉识别方法。
为了解决上述技术问题采用的技术方案为:
一种基于游程特征的选票符号机器视觉识别方法,所述识别方法包括以下步骤:
(1)得到经过预处理后的符号图像后,自上而下,自左向右扫描整幅图像,当扫描到第一次出现游程的那一行时,初始化三叉树结构,将那一行中最中间的游程加入到根节点中,根据其他各游程的左右关系,依次创建左右根节点,初步形成一颗三叉树结构;
所述游程的定义为:图像上沿x或y轴方向上一组连续的白色像素构成的像素段;
(2)接着是一个不断循环的过程:对于最左的叶子节点向左进行延伸和扩展,而对于非最左的叶子节点,则进行向下延伸和扩展,不断创建新的游程区域或延伸现有的游程区域,直到完成整个符号图像的扫描,完成创建一颗表征选票符号的三叉树;
(3)对于得到的三叉树进行剪枝和合并处理,使得三叉树只由一个或两个大块的游程区域组成,而且在同一个方向都只有一个游程区域;
(4)对于得到的三叉树,在决策树中进行自左向右的验证,到达一个叶子节点后就获得了符号的类别。
所述步骤(4)中,验证时如果到达两个叶子节点,说明出现了符号冲突就判定为无效符号,如果没有到达叶子节点说明不能验证符号,对于这些无效的符号和不能验证符号进行剔除,然后进行人工识别。
更进一步,所述步骤(1)中,如果当前扫描的是第一行,创建并初始化第一个游程区域,即选取中间的两个Segment作为根节点的游程,两边Segment形成的游程依次作为根节点的左右节点。
再进一步,所述步骤(2)中,活动节点中游程区域的延伸和扩展的过程为:首先让处于这棵树左右边界的活动节点向两边展开,扫描下一行在x轴方向上的起始像素到对应于上一行的左边第一个Segment.start之间区域的Segment,用这些Segment创建一颗子树,并把子树添加到当前活动节点的左边;
然后对于每个非左右边界的活动节点,扫描runRegion中最后一个游程下一行的对应区域,按照该区域中的所有Segment,根据Segment个数的不同分别执行(a),(b),(c),(d)四个步骤:
(a)如果Segments的个数大于2,说明当前游程区域分裂为多个游程区域,这时根据扫描到的Segment按照创建子树的内容生成一棵子树,然后把子树的根节点赋值给前活动节点的below节点;
(b)如果Segment的个数等于2,说明当前游程区域应该向下延伸,所以把当前Segment形成的游程加入到活动节点runRegion中;
(c)如果Segment的个数为0,说明该游程区域结束或中断,所以把当前活动节点标记为死节点;
(d)如果Segment的个数为1,说明游程一侧的线段中断,如果是游程起始线段断裂就把当前活动节点标记为死节点,否则寻找它右边第一个游程的节点,并用它创建一个新的游程区域作为below节点链接到当前节点。
所述游程区域的形状分为三个类别:一端封闭,一端开口的锥形;两端都封闭的圆形和两端都开口的圆柱形,叉号模型:两个锥形游程区域,两个锥形的顶点被连接起来;圈号模型:一个圆形的游程区域,高度大于符号图形高度的2/3;或者两个锥形游程区域他们的开口相对应,两个封闭点之间的高度大于符号图形高度的2/3;对号模型:一个锥形区域。
本发明的技术构思为:
(1)根据选票符号的结构特点,提出一种基于游程特征的特征提取方法。
通过对大量不同种类选票的观察和分析可得,选票符号具有如下特点:
1)、选票符号的种类有限,通常人们采用的只有勾,叉,圈三类;
2)、选票符号的组成极其简单,只由一条曲线或一两条线段构成,理想选票符号各自的特征非常明显。
3)、选票符号都是手写体,因每个人的手写习惯不同而形状各异,相同种类的选票符号差异很大,而不同种类的选票符号有时却相差很小;
4)、选票符号经常与表格框粘连,使得分割困难,对识别造成很大的影响;
5)、因环境因素等外界因素的干扰,造成选票符号部分断裂,模糊等,影响符号的识别。
用于描述字符的特征可分类两大类:统计特征和结构特征。统计特征是对识别样本经过数学变换(如几何不变矩,小波变换等)处理后提取的特征。而结构特征是直接从字符的轮廓或骨架上提取的字符像素分布特征,如:圈、端点、节点、弧、突起、凹陷、笔画等等。考虑到三类选票符号(勾,叉,圈)本身笔画就很少的特点以及手写符号的不规则性,如果提取它们的统计特征,势必导致在某些情况下很难区分符号。而如果提取的是手写选票符号的结构特征,则它不仅反应了选票符号的局部特征,同时也反映了选票符号的整体特征,有效的处理了不规则符号产生的边界噪音,局部轮廓变形等问题。本发明选择提取选票符号的游程特征来表征符号。
游程的定义为:图像上沿x或y轴方向上一组连续的白色像素构成的像素段。在图像上建立直角坐标系,设定所述x轴(横向)和y轴(纵向)。它通过描述两条线段之间的间隔来描述符号的外部轮廓,同时也反应了x或y方向上轮廓线的关系。根据扫描方向的不同,游程可以分为横向游程和纵向游程两类。段的定义为图像上沿x或y轴方向上一组连续的黑色像素构成的像素段。在x或y轴方向上,游程处于两个相邻连续的段之间。游程区域由n个连续的游程组成,即在x或y方向上对应的两条线段之间的空白区域。最后,本发明是通过分析符号的游程区域来区分符号类别的。图2描述了游程1与段2的关系。
通过分析几种符号的游程特征发现,横向游程能够更好的区分不同的符号,因为几种符号的横向游程特征相差很大,很容易进行区分。所以算法提取符号的横向游程特征。为了能够从复杂多样的符号中稳定的提取到特征,算法必须全面的提取游程,同时保持各个游程区域之间的相对关系。为了能够保持游程之间的关系,算法使用了三叉树来描述游程间的关系,三叉树的每个节点表示一个游程区域。
基于游程特征的特征提取方法的大致过程如下:得到经过预处理后的符号图像后,自上而下,自左向右扫描整幅图像,当扫描到第一次出现游程的那一行时,初始化三叉树结构,将那一行中最中间的游程加入到根节点中,根据其他各游程的左右关系,依次创建左右根节点,初步形成一颗三叉树结构。接着是一个不断循环的过程:对于最左(最右)的叶子节点向左(右)进行延伸和扩展,而对于非最左(非最右)的叶子节点,则进行向下延伸和扩展,不断创建新的游程区域或延伸现有的游程区域,直到完成整个符号区域的扫描。这样一颗表征选票符号的三叉树就创建完成了。
(2)由于提取特征而构成的三叉树仍然存在影响识别的噪声,提出一种三叉树剪枝与合并方法。
选票符号上多余的轮廓线或者孔洞、噪声点所形成的多余游程区域被称为噪声游程区域。而把代表符号特征的游程区域称为特征游程区域。
经过对大量选票符号图像及其生成的三叉树的观察与分析,得出三叉树仍然存在噪声的以下三点情形:
1)、选票符号图像中存在的多余轮廓线及噪声点容易导致噪声游程区域的产生,而这些噪声游程区域的特点是它们高度和宽度都较小。
2)、在选票符号图像中,除主要的选票符号外,由于有时还会存在一些大块的笔画线段,从而导致一些孤立游程区域的产生,而这些孤立游程区域的所形成的三叉树的高度一般不会很高。
3)、理想符号都是由一个或两个大块的游程区域组成,而且在同一个方向都只有一个游程区域。如果有多个游程区域,则存在两种情形:一是特征游程区域被分裂为多个,而被分裂的游程区域通常是在上一个特征游程区域的下方或上方;二是特征游程区域的两边有多余的噪声区域,多余的游程区域通常分布在特征游程区域的两边。
经过对以上三叉树仍然存在噪声情形的分析,可以分别设置三叉树中游程区域的高度和宽度阀值来消除情形1)中提到的噪声;通过大量实验,选择合适的三叉树的高度阀值来消除情形2)中提到的噪声;而3)中的噪声消除则可通过按照一定的规则分别删除一个节点的左右或上下子树来实现。
(3)基于所提取的游程特征,提出用于识别选票符号类型的验证模型。经过对大量手写选票符号的实验与分析,得出选票符号所对应的三叉树具有如下几个特点:
1)、经过剪枝和合并处理的三叉树由一个或两个大块的游程区域组成,而且在同一个方向都只有一个游程区域。
2)、游程区域的形状可分为三个类别:一端封闭,一端开口的锥形,两端都封闭的圆形,和两端都开口的圆柱形。
表2显示了选票符号的游程个数及游程区域数的统计结果。
平均游程数 | 41 |
平均游程区域数 | 3.2 |
剪枝后平均游程区域数 | 1.8 |
表2
基于此,总结出三类选票符号的特点:
叉号模型:两个锥形游程区域,两个锥形的顶点被连接起来。
圈号模型:一个圆形的游程区域,高度大于符号图形高度的2/3。或者两个锥形游程区域他们的开口相对应,两个封闭点之间的高度大于符号图形高度的2/3。
对号模型:一个锥形区域。
算法根据提取到的游程特征,建立一个完整的决策树模型,在决策树中进行自左向右的验证,到达一个叶子后就获得了符号的类别。如果可以到达两个叶子节点,说明出现了符号冲突就判定为无效符号,如果没有到达叶子节点说明不能验证符号。对于这些无效的符号,或者有相互冲突特征的符号,算法能够进行比较准确的剔除,然后进行人工识别。它提高了符号的识别率,满足了选举的严肃性对较高符号识别率的要求。
本发明的效果是:采用了适合表征选票符号的游程特征来识别选票符号,配合专门为该特征设计的验证模型,再加上预处理阶段的倾斜校正和版面理解等配套操作,所有操作既简洁又高效,具有选票设计灵活、通用性好、处理速度快等特点。
附图说明
图1是选票统计系统的实施步骤图。
图2是游程的描述图。
图3是一个圈号对应的三叉树结构图。
图4是基于游程特征的决策树模型图。
图5是选票统计系统的工作流程图。
图6是选票统计系统体系结构总图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图4,一种基于游程特征的选票符号机器视觉识别方法,其特征在于:所述识别方法包括以下步骤:
(1)得到经过预处理后的符号图像后,自上而下,自左向右扫描整幅图像,当扫描到第一次出现游程的那一行时,初始化三叉树结构,将那一行中最中间的游程加入到根节点中,根据其他各游程的左右关系,依次创建左右根节点,初步形成一颗三叉树结构;
所述游程的定义为:图像上沿x或y轴方向上一组连续的白色像素构成的像素段;
(2)接着是一个不断循环的过程:对于最左的叶子节点向左进行延伸和扩展,而对于非最左的叶子节点,则进行向下延伸和扩展,不断创建新的游程区域或延伸现有的游程区域,直到完成整个符号图像的扫描,完成创建一颗表征选票符号的三叉树;
(3)对于得到的三叉树进行剪枝和合并处理,使得三叉树只由一个或两个大块的游程区域组成,而且在同一个方向都只有一个游程区域;
(4)对于得到的三叉树,在决策树中进行自左向右的验证,到达一个叶子节点后就获得了符号的类别。
将本实施例应用于选票快速识别统计方法,统计方法包括以下步骤:
第一、图像采集阶段:将选票扫描成选票灰度图像。
第二、预处理阶段:经过一系列的处理,提取出待识别的选票符号。
2.1二值化
使用全局阀值法将选票图像转换成二值图像;
2.2去除噪声
通过预先设定的面积阀值,除去投票图像上的噪声点;
2.3膨胀处理
对投票图像进行膨胀处理,膨胀是为了将投票图像中断裂的笔画线段连接起来,减少后面提取游程特征时的复杂度;
2.4腐蚀处理
对膨胀后的投票图像进行腐蚀处理,腐蚀是为了将笔画线段的宽度减小到一定程度,同样也可以使后面游程特征的提取更容易;
2.5倾斜校正
通过扫描选票图像,先得到表格线游程,然后由表格线游程组成对应的表格线,接着计算出表格线的倾斜角度,即整幅图像的倾斜角度,最后根据得到的倾斜角度对选票图像进行倾斜校正操作;
2.6选票图像的版面理解
选票图像的版面理解的作用是确定每个选票单元格的几何位置及其属性,它包括选票图像几何结构识别和选票图像逻辑结构识别两个部分。其中,选票图像几何结构识别是选票图像逻辑结构识别的基础。选票图像几何结构的识别是通过识别组成选票单元格的两条相邻表格横线和竖线来完成的。选票图像逻辑结构的识别是通过遍历选票表格中每个选票单元格的属性来完成的;
2.7选票符号的提取
选票符号的提取主要是指从选票表格的投票单元格中提取选票符号,由于在版面理解中已经获得了选票表格的几何和逻辑结构信息,选票符号的提取变得相对简单;
第三、特征提取阶段:从选票符号图像中提取出其游程特称,创建一颗三叉树,并进行剪枝和合并处理。
一颗三叉树的三个分叉分别标记为left,right,below,分别表示当前游程区域左边,右边和下面的游程区域。runRegion是当前游程区域。
3.1选票符号游程特征的三叉树创建
(1)算法扫描整幅符号图像,如果遇到黑色像素就创建一个Segment并把当前像素作为Segment.start,向前扫描直到该连续像素段结束,把终点记录到Segment.end。然后扫描到行尾,记录所有的Segment。
(2)创建一棵三叉树,初始化根节点root。
(3)如果当前扫描的是第一行,创建并初始化第一个游程区域,方法是选取中间的两个Segment作为根节点的游程。两边Segment形成的游程依次作为根节点的左右节点。三叉树初始化完成后,所有叶子节点成为活动节点。以下的步骤是对活动节点中游程区域的延伸和扩展。如图3显示了一个圈号对应的三叉树结构图。
(4)三叉树被初始化后,所有叶子节点成为活动节点activeNodes。以下的步骤是对活动节点中游程区域的延伸和扩展。
(5)首先让处于这棵树左右边界的活动节点向两边展开,以向左展开为例,按照步骤(2)扫描下一行在x轴方向上的起始像素到对应于上一行的左边第一个Segment.start之间区域的Segment。用这些Segment创建一颗子树,并把子树添加到当前活动节点的左边。
(6)然后对于每个非左右边界的活动节点,扫描runRegion中最后一个游程下一行的对应区域(上一行游程的起始点和终止点的横坐标±1所对应的区域),按照步骤(2)记录该区域中的所有Segment。根据Segment个数的不同分别执行(a),(b),(c),(d)四个步骤:
(a)如果Segments的个数大于2,说明当前游程区域分裂为多个游程区域,这时根据扫描到的Segment按照步骤(3)中有关创建子树的内容生成一棵子树,然后把子树的根节点赋值给前活动节点的below节点。
(b)如果Segment的个数等于2,说明当前游程区域应该向下延伸,所以把当前Segment形成的游程加入到活动节点runRegion中。
(c)如果Segment的个数为0,说明该游程区域结束或中断,所以把当前活动节点标记为死节点。
(d)如果Segment的个数为1,说明游程一侧的线段中断,如果是游程起始线段断裂就把当前活动节点标记为死节点,否则寻找它右边第一个游程的节点。并用它创建一个新的游程区域作为below节点链接到当前节点。
(7)回到步骤(5),不断创建新的游程区域或延伸现有的游程区域,直到完成整个符号区域的扫描。
3.2三叉树中游程区域的剪枝与合并
为了最终能正确的识别选票符号类型,需要对三叉树按以下3条规则进行剪枝和合并。
(1)对游程区域分别设置高度和宽度阈值,一个正常游程区域的最小高度为3个像素,最小宽度为整幅选票符号图像宽度的1/5。然后把所有宽度和高度小于阈值的游程区域删除。
(2)对于孤立游程区域,由于他们单独形成了一颗三叉树,本发明只需要取得树的高度,然后把小于阈值的整棵树删除。
(3)对于有多个游程区域的情况,由于三叉树结构保持了游程区域之间的相对关系,剪枝和合并的条件是很容易判断的。多余的游程区域是分布在特征游程区域的两边的,而被分裂的游程区域是在上一个特征游程区域的下方或上方的。则噪声游程区域的消除可按一下规则实现:
(a)特征游程区域由于中间干扰线段的存在被分裂为多个游程区域,如果特征游程区域在上方,就把他下方的游程区域合并,并把合并后的游程区域链接在特征游程区域的下方。
(b)特征游程区域由于中间干扰线段的存在被分裂为多个游程区域,如果特征游程区域在下方,就把合并后的游程区域放在特征游程区域的上方。
(c)如果特征游程区域的宽度小于分裂后的游程区域的宽度,则分裂后的游程区域中一定有多余的部分。这时自左向右扫描分裂后的游程区域,直到游程区域的总宽度等于特征游程区域的宽度,然后把剩下的游程区域删除,把找到的游程区域按照上面两步的方法合并
第四、识别分类阶段:通过提出的决策树验证模型,识别选票符号所属的类别:完整的决策树模型如图4所示,根据提取到的游程特征,在决策树中进行自左向右的验证,到达一个叶子后就获得了符号的类别。如果可以到达两个叶子节点,说明出现了符号冲突就判定为无效符号,如果没有到达叶子节点说明不能验证符号。对于这些无效符号和不能验证符号,本发明能够成功进行剔除并交由人工进行识别。
以及采用本发明的识别方法形成一种基于游程特征的选票快速识别统计系统,统计系统包括:图像采集模块,用于将选票扫描成选票灰度图像。预处理模块,经过一系列的处理,提取出待识别的选票符号;该模块的内容包括,二值化,使用全局阀值法将选票图像转换成二值图像;噪声去除,通过预先设定的面积阀值,除去投票图像上的噪声点;膨胀处理,用于将投票图像中断裂的笔画线段连接起来;腐蚀处理,用于将笔画线段的宽度减小到一定程度;倾斜校正,通过扫描选票图像,先得到表格线游程,然后由表格线游程组成对应的表格线,接着计算出表格线的倾斜角度,即整幅图像的倾斜角度,最后根据得到的倾斜角度对选票图像进行倾斜校正操作;选票图像的版面理解,使系统理解选票表格的各个表格域在选票表格中的相互位置关系以及逻辑对应关系;选票符号的快速提取,用于将选票信息从选票图像的特定位置处提取出来。特征提取模块,得到经过预处理后的符号图像后,自上而下,自左向右扫描整幅图像,当扫描到第一次出现游程的那一行时,初始化三叉树结构,将那一行中最中间的游程加入到根节点中,根据其他各游程的左右关系,依次创建左右根节点,初步形成一颗三叉树结构。接着是一个不断循环的过程:对于最左(最右)的叶子节点向左(右)进行延伸和扩展,而对于非最左(非最右)的叶子节点,则进行向下延伸和扩展,不断创建新的游程区域或延伸现有的游程区域,直到完成整个符号区域的扫描。这样一颗表征选票符号的三叉树就创建完成了;接着,对于得到的三叉树进行剪枝和合并处理,使得三叉树只由一个或两个大块的游程区域组成,而且在同一个方向都只有一个游程区域。分类识别模块,对于得到的三叉树,在决策树中进行自左向右的验证,到达一个叶子节点后就获得了符号的类别。如果可以到达两个叶子节点,说明出现了符号冲突就判定为无效符号,如果没有到达叶子节点说明不能验证符号。对于这些无效的符号,或者有相互冲突特征的符号,算法能够进行比较准确的剔除,然后进行人工识别。统计模块,用于将存储于数据库的一个个识别结果进行统计,得出选举结果,并将选举结果存到数据库中。
参照图6,从体系结构上,本实施例的选票快速识别统计系统包括选票处理模块、选举项目管理模块、用户管理模块、数据库模块。
(1)选举项目管理模块:选举项目管理模块负责管理数据库中现存的选举项目,通过该模块可以对选举项目进行选举项目新建、打开(以进行选票统计结果的审查和重新统计)和删除操作。
(2)用户管理模块:用户管理模块负责管理使用该系统的所有用户,用户分为超级用户和普通用户两种,超级用户的功能包括添加用户、删除用户、给特定的用户分配系统使用权限、给特定的用户初始化用户密码,新建项目,项目管理,用户管理等,而普通用户只有新建项目和项目管理的权限。
(3)数据库模块:数据库模块负责项目信息的存储和访问。
(4)选票处理模块:选票处理模块为系统的核心模块,主要完成选票的模板版面理解,选票符号的识别和统计工作。根据执行任务的不同,又可细分为模板版面理解模块,选票符号识别模块,选举结果统计模块。
1)模板版面理解模块:模板版面理解模块包括两个子模块:辅助版面理解模块和机器版面理解模块。其中,辅助版面理解模块的主要作用是人工输入版面信息参数以辅助机器版面理解。而机器版面理解则根据提出的版面理解算法来理解选票版面信息。
2)选票符号识别模块:选票符号识别模块是选票处理模块的核心,主要负责实现选票符号的识别,分为机器识别模块和人工识别模块。机器识别模块根据提出的符号识别算法来识别选票符号类别,人工识别模块则对机器识别无法识别的选票符号进行识别。
3)选举结果统计模块:选举结果统计模块主要是对选票符号的识别结果进行统计,得出最终的选举结果。选举结果统计模块首先从数据库中获取识别过程中存储的数据,然后对各候选人所获得的赞成票数、反对票数、弃权票数信息进行统计,最后输出此次选举的统计结果。
Claims (4)
1.一种基于游程特征的选票符号机器视觉识别方法,其特征在于:所述识别方法包括以下步骤:
(1)得到经过预处理后的符号图像后,自上而下,自左向右扫描整幅图像,当扫描到第一次出现游程的那一行时,初始化三叉树结构,将那一行中最中间的游程加入到根节点中,根据其他各游程的左右关系,依次创建左右根节点,初步形成一棵三叉树结构;
所述游程的定义为:图像上沿x或y轴方向上一组连续的白色像素构成的像素段;
(2)接着是一个不断循环的过程:对于最左的叶子节点向左进行延伸和扩展,而对于非最左的叶子节点,则进行向下延伸和扩展,不断创建新的游程区域或延伸现有的游程区域,直到完成整个符号图像的扫描,完成创建一棵表征选票符号的三叉树;
(3)对于得到的三叉树进行剪枝和合并处理,使得三叉树只由一个或两个大块的游程区域组成,而且在同一个方向都只有一个游程区域;
所述游程区域的形状分为三个类别:a)一端封闭,一端开口的锥形,b)两端都封闭的圆形,c)两端都开口的圆柱形;三类选票符号的特点为:i)叉号模型:两个锥形游程区域,两个锥形的顶点被连接起来;ii)圈号模型:一个圆形的游程区域,高度大于符号图形高度的2/3,或者两个锥形游程区域他们的开口相对应,两个封闭点之间的高度大于符号图形高度的2/3;iii)对号模型:一个锥形区域;
(4)对于得到的三叉树,在决策树中进行自左向右的验证,到达一个叶子节点后就获得了符号的类别。
2.如权利要求1所述的一种基于游程特征的选票符号机器视觉识别方法,其特征在于:所述步骤(4)中,验证时如果到达两个叶子节点,说明出现了符号冲突就判定为无效符号,如果没有到达叶子节点说明不能验证符号,对于这些无效的符号和不能验证符号进行剔除,然后进行人工识别。
3.如权利要求1或2所述的一种基于游程特征的选票符号机器视觉识别方法,其特征在于:所述步骤(1)中,如果当前扫描的是第一行,创建并初始化第一个游程区域,即选取中间的两个Segment作为根节点的游程,两边Segment形成的游程依次作为根节点的左右节点;扫描整幅符号图像,如果遇到黑色像素就创建一个Segment并把当前像素作为Segment.start,向前扫描直到该连续像素段结束,把终点记录到Segment.end。
4.如权利要求3所述的一种基于游程特征的选票符号机器视觉识别方法,其特征在于:所述步骤(2)中,一颗三叉树的三个分叉分别标记为left,right,below,分别表示当前游程区域左边,右边和下面的游程区域,runRegion是当前游程区域,活动节点中游程区域的延伸和扩展的过程为:
首先让处于这棵树左右边界的活动节点向两边展开,扫描下一行在x轴方向上的起始像素到对应于上一行的左边第一个Segment.start之间区域的Segment,用这些Segment创建一棵子树,并把子树添加到当前活动节点的左边;
然后对于每个非左右边界的活动节点,扫描runRegion中最后一个游程下一行的对应区域,按照该区域中的所有Segment,根据Segment个数的不同分别执行(a),(b),(c),(d)四个步骤:
(a)如果Segments的个数大于2,说明当前游程区域分裂为多个游程区域,这时根据扫描到的Segment按照创建子树的内容生成一棵子树,然后把子树的根节点赋值给前活动节点的below节点;
(b)如果Segment的个数等于2,说明当前游程区域应该向下延伸,所以把当前Segment形成的游程加入到活动节点runRegion中;
(c)如果Segment的个数为0,说明该游程区域结束或中断,所以把当前活动节点标记为死节点;
(d)如果Segment的个数为1,说明游程一侧的线段中断,如果是游程起始线段断裂就把当前活动节点标记为死节点,否则寻找它右边第一个游程的节点,并用它创建一个新的游程区域作为below节点链接到当前节点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110169656.2A CN102332088B (zh) | 2011-06-22 | 2011-06-22 | 一种基于游程特征的选票符号机器视觉识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110169656.2A CN102332088B (zh) | 2011-06-22 | 2011-06-22 | 一种基于游程特征的选票符号机器视觉识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102332088A CN102332088A (zh) | 2012-01-25 |
CN102332088B true CN102332088B (zh) | 2014-10-29 |
Family
ID=45483859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110169656.2A Active CN102332088B (zh) | 2011-06-22 | 2011-06-22 | 一种基于游程特征的选票符号机器视觉识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102332088B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492641A (zh) * | 2018-09-18 | 2019-03-19 | 上海延华智能科技(集团)股份有限公司 | 基于图像识别的能源账单输入方法及系统、存储介质、服务器 |
CN111696245B (zh) * | 2020-06-30 | 2022-01-18 | 郭平波 | 一种基于p2p网络的投票方法 |
CN113378666A (zh) * | 2021-05-28 | 2021-09-10 | 山东大学 | 一种票据图像倾斜校正方法、票据识别方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1312625C (zh) * | 2004-07-02 | 2007-04-25 | 清华大学 | 基于游程邻接图的复杂背景彩色图像中字符提取方法 |
CN101833780A (zh) * | 2010-05-07 | 2010-09-15 | 南京大学 | 一种基于游程表达和运算的地图成图方法 |
CN101944180A (zh) * | 2010-09-07 | 2011-01-12 | 东南大学 | 基于乐符知识及双投影法的乐符基元分割方法 |
-
2011
- 2011-06-22 CN CN201110169656.2A patent/CN102332088B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1312625C (zh) * | 2004-07-02 | 2007-04-25 | 清华大学 | 基于游程邻接图的复杂背景彩色图像中字符提取方法 |
CN101833780A (zh) * | 2010-05-07 | 2010-09-15 | 南京大学 | 一种基于游程表达和运算的地图成图方法 |
CN101944180A (zh) * | 2010-09-07 | 2011-01-12 | 东南大学 | 基于乐符知识及双投影法的乐符基元分割方法 |
Non-Patent Citations (2)
Title |
---|
基于表格线游程的选票图像几何结构识别;沈军强等;《计算机工程》;20090930;第35卷(第17期);187-192 * |
沈军强等.基于表格线游程的选票图像几何结构识别.《计算机工程》.2009,第35卷(第17期),187-192. |
Also Published As
Publication number | Publication date |
---|---|
CN102332088A (zh) | 2012-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101447017B (zh) | 一种基于版面分析的选票快速识别统计方法及系统 | |
US9396404B2 (en) | Robust industrial optical character recognition | |
CN102346847B (zh) | 一种支持向量机的车牌字符识别方法 | |
CN103034848B (zh) | 一种表单类型的识别方法 | |
US20100189316A1 (en) | Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints | |
CN101604384B (zh) | 个性化指纹识别方法 | |
CN102902959A (zh) | 基于二代身份证存储证件照的人脸识别方法及系统 | |
CN104809481A (zh) | 一种基于自适应色彩聚类的自然场景文本检测的方法 | |
CN103914680A (zh) | 一种喷印字符图像识别与校验系统及方法 | |
CN103927539A (zh) | 离线式维吾尔文手写签名识别的一种高效的特征提取方法 | |
CN101452532B (zh) | 一种文本无关笔迹鉴别的方法和装置 | |
CN104408449A (zh) | 智能移动终端场景文字处理方法 | |
Anjum et al. | Design and Simulation of Handwritten Gurumukhi and Devanagri Numerals Recognition | |
CN105426890A (zh) | 一种字符扭曲粘连的图形验证码识别方法 | |
CN107122775A (zh) | 一种基于特征匹配的安卓手机身份证字符识别方法 | |
CN106778717A (zh) | 一种基于图像识别和k近邻的测评表识别方法 | |
CN107766854A (zh) | 一种基于模板匹配实现快速页码识别的方法 | |
Feng et al. | Fingerprint indexing using ridge invariants | |
CN111340032A (zh) | 一种基于金融领域应用场景的字符识别方法 | |
CN102332088B (zh) | 一种基于游程特征的选票符号机器视觉识别方法 | |
Mullick et al. | An efficient line segmentation approach for handwritten Bangla document image | |
Liu et al. | Wagon number recognition based on the YOLOv3 detector | |
Luo et al. | Alphanumeric character recognition based on BP neural network classification and combined features | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN114708186A (zh) | 一种电子签章定位方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |