CN107133929A - 基于背景估计和能量最小化的低质量文档图像二值化方法 - Google Patents
基于背景估计和能量最小化的低质量文档图像二值化方法 Download PDFInfo
- Publication number
- CN107133929A CN107133929A CN201710289747.7A CN201710289747A CN107133929A CN 107133929 A CN107133929 A CN 107133929A CN 201710289747 A CN201710289747 A CN 201710289747A CN 107133929 A CN107133929 A CN 107133929A
- Authority
- CN
- China
- Prior art keywords
- mrow
- image
- msub
- background
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 230000002146 bilateral effect Effects 0.000 claims abstract description 14
- 238000001914 filtration Methods 0.000 claims abstract description 13
- 230000003190 augmentative effect Effects 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 230000000877 morphologic effect Effects 0.000 claims description 7
- 238000003708 edge detection Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 claims description 5
- 230000003416 augmentation Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 229920006395 saturated elastomer Polymers 0.000 claims description 4
- 230000012010 growth Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 238000003306 harvesting Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 210000001525 retina Anatomy 0.000 claims description 2
- 230000003313 weakening effect Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 4
- 238000005286 illumination Methods 0.000 abstract description 4
- 230000008859 change Effects 0.000 abstract description 2
- 230000008595 infiltration Effects 0.000 abstract description 2
- 238000001764 infiltration Methods 0.000 abstract description 2
- 238000011946 reduction process Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 10
- 210000000695 crystalline len Anatomy 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/94—Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20028—Bilateral filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于背景估计和能量最小化的低质量文档图像二值化方法,首先对彩色文档图像进行灰度预处理、采用双边滤波对图像进行降噪处理、图像背景估计、背景减除与图像增强、构造能量函数、构造网络图、最后采用基于增广路径的图割算法实现能量函数的最小化。本发明显著提高了复杂背景下的文档图像二值化效果,能够适用于多种颜色书写、笔画渐变、墨迹浸润、页面有污渍或纹理、光照不均、对比度低等复杂背景的文档图像二值化处理。
Description
技术领域
本发明属于数字图像处理、模式识别与机器学习技术领域,特别是涉及一种基于背景估计和能量最小化的低质量文档图像二值化方法。
背景技术
文档分析与识别(DAR)技术已广泛应用于古籍数字化、版面分析与文字识别、视频字幕提取、文本信息检索等领域,主要包括图像的采集、二值化、歪斜校正、字符分割与识别等过程。图像二值化是其中一个关键预处理环节,它是将灰度图像转换成二进制图像,从而实现字符前景与文档背景的分离。二值化算法的效果直接影响整个DAR系统的性能,因此近年来很多学者对此进行了研究,并提出了很多算法;然而,受图像对比度差、墨迹浸润、页面污渍或光照不均等因素的影响,使得低质量文档图像二值化仍是一个挑战。
二值化算法可粗略分为全局阈值法和局部阈值法。全局阈值法采用单一的阈值将文档图像分为字符(前景)与背景两大类,如Otsu算法利用图像的灰度直方图选择一个最优阈值,使得经阈值分割后的前景与背景像素的类间方差最大。全局阈值法对于前景和背景差别较大,即直方图具有显著双峰特征的图像具有较好的分割效果,但在处理低质量文档图像时,会丢失部分甚至全部前景细节。
局部阈值法(也称为自适应阈值法)则通过滑动窗口与文档图像的卷积,从而实现在图像不同部分设定不同阈值,如Niblack、Sauvola、Wolf等算法利用像素邻域内的灰度均值和方差来构建阈值分割曲面,其算法性能有赖于滑动窗口的尺寸及字符笔画的粗细等。针对不同质量的文档图像需动态调整窗口尺寸,以获得最佳的阈值处理结果;当图像对比度较低时,会产生大量噪声点或造成误判。
此外,国内外研究人员还提出了很多更为复杂的算法,如局部对比度法、背景估计与笔画边缘检测法、拉普拉斯能量法、卷积神经网络法等。然而,以上这些方法都不能很好地解决在低对比度、墨迹浸润、渐变光照、带污迹和纹理等复杂文档背景下的图像二值化。
发明内容
为了解决上述技术问题,本发明提出了一种基于背景估计和能量最小化的低质量文档图像二值化方法,显著提高了复杂背景下的文档图像二值化效果,能够适用于多种颜色书写、笔画渐变、墨迹浸润、页面有污渍或纹理、光照不均、对比度低等复杂背景的文档图像二值化处理。
本发明所采用的技术方案是:一种基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,包括以下步骤:
步骤1:对彩色文档图像进行灰度预处理;
步骤2:采用双边滤波对图像进行降噪处理;
步骤3:图像背景估计,具体包括以下子步骤:
步骤3.1:针对步骤2处理后的图像,进行笔画宽度变换;
步骤3.2:计算模拟距离和成像高度;
步骤3.3:针对步骤2处理后的图像,通过两次形态学闭操作削弱文档图像中的暗特征;
步骤3.4:结合步骤3.2和步骤3.3的结果,进行图像降采样和升采样;
步骤4:背景减除与图像增强,具体包括以下子步骤:
步骤4.1:背景减除;
计算步骤2中的双边滤波图像与步骤3中的背景估计图像间的绝对差值,差值图像中灰度为零的像素点属于高置信背景像素点,并将其灰度值设为255;
步骤4.2:直方图均衡;
对背景减除图像中非零像素点进行取反,得到该点对应的灰度值,然后对整幅图像进行直方图均衡化,增大图像前景和背景的对比度;
步骤5:构造能量函数;
步骤6:构造网络图;
步骤7:采用基于增广路径的图割算法实现能量函数的最小化。
本发明与现有算法相比,其显著优点在于:
(1)本发明采用最小均值法对彩色文档图像进行灰度预处理,所得灰度图像具有彩色无关性,既能增大前景与背景像素间的对比度,又能减小前景像素间的灰度方差;
(2)本发明采用非线性双边滤波算法实现图像降噪处理,由于同时考虑了图像的空间邻近度和灰度相似性,从而达到了保边去噪的目的;
(3)本发明采用笔画宽度变换的方法来估计文档图像中的笔画宽度,其优势在于,笔画特征基本上是属于文字独有的特征(当然也不排除某些退化因素的干扰,需要后续操作加以剔除),对于不同语言的文本具有普适性;
(4)本发明基于视觉灵敏度测试模型,采用形态学闭操作实现图像背景估计,并对背景减除图像进行直方图均衡化,有效抑制了退化因素的影响,同时增强了图像的局部对比度;
(5)本发明基于最大流/最小割的组合优化算法实现文档图像二值化,该图割算法通用性强,可行性高,运行速度快(接近实时性能),并且适用于多种退化类型的低质量文档图像。
附图说明
图1:为本发明实施例的流程图;
图2:为本发明实施例的视力测试模型的角度分辨率示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明主要思想是:当目标图像离观察者距离较远时,能观测到的目标图像的细节(笔画)信息越来越少,但感知到的背景灰度和深度不受距离的影响,因此可以通过模拟远距离观测图像的场景,估计出图像的大致背景,再对剔除估计背景后的图像构造能量函数,采用图割算法实现图像二值化。
请见图1,本发明提供的一种基于背景估计和能量最小化的低质量文档图像二值化方法,包括以下步骤:
步骤1:最小均值灰度化;
本发明采用最小均值法对彩色文档图像f(x,y)进行灰度预处理,具体计算公式为:
其中,fi(x,y)分别为R、G、B彩色分量图像,fgray(x,y)为变换后的灰度图像。
所得灰度图像具有彩色无关性,即灰度图像中,前景与背景像素间具有较大的对比度,同时前景像素间的灰度差异性较小。
步骤2:双边滤波去噪;
本发明采用非线性双边滤波算法进行图像降噪处理,其输出像素值依赖于邻域S内像素值f(k,l)的加权组合,具体计算公式为:
其中,权重系数w(i,j,k,l)取决于定义域核和值域核的乘积,即 和分别表示高斯距离方差和高斯灰度方差。
由于双边滤波器同时考虑了图像的空间邻近度和灰度相似性,可以达到保边去噪的目的。
步骤3:图像背景估计;
步骤3.1笔画宽度变换(SWT):采用Canny算子对双边滤波后的灰度图像进行边缘检测,并对每一个边缘像素点p按其梯度方向查找与之对应的另一个边缘像素点q,两点间的欧式距离||p-q||即为[p,q]路径上所有像素点的笔画宽度估计,除非该像素点已经被指定了一个更小的宽度值,则图像的笔画宽度SWE为所有非零像素点笔画宽度估计的数学期望,具体计算公式为:
其中,n为笔画宽度变换输出图像s(x,y)中非零值像素点总数。
步骤3.2计算模拟距离和成像高度:基于视觉灵敏度测试模型,人眼的最小分辨角(1′的角度)所能感知的即为最小图像,如图2所示。由于低质量文档图像的对比度通常都低于视力表上的二值图像,对应目标的最小视角也通常大于视力测试的最小视角,并且图像的笔画越粗,不能感知到笔画细节所需的观测距离就会越远,因此,本发明将文档图像的笔画宽度对应的分辨角假定为3′,并根据步骤3.1估计得到的笔画宽度确定模拟观测距离d0,具体计算公式为:
d0=SWE×cotθ,
其中,θ为观测分辨角,此处为3′视角。
由于人眼的晶状体类似于凸透镜,根据透镜成像规律和焦距方程,可得到在距离目标图像为d0时视网膜上的成像高度hi,具体计算公式为:
其中,f为人眼晶状体与视网膜间距,即透镜焦距(约17mm),h0为目标图像原始高度。
步骤3.3形态学闭操作:通过两次形态学闭操作削弱文档图像中的暗特征(字符笔画),两次闭操作均采用圆形结构元素。本发明将第一次结构元素的直径设置为图像的笔画宽度,第二次结构元素的直径则比图像的笔画宽度大12个像素。
步骤3.4图像降采样和升采样:距离目标图像为d0时观测到的图像高度为hi,因此,将形态学闭操作后的图像通过双线性降采样缩放到hi高度;然后采用双线性内插法将缩放后的图像恢复到原始尺寸大小,得到的图像即为估计的背景图像。在进行图像缩放时,保持图像宽高比不变。
步骤4:背景减除与图像增强;
步骤4.1背景减除:计算双边滤波图像与背景估计图像间的绝对差值,差值图像中灰度为零的像素点属于高置信背景像素点,并将其灰度值设为255(白色)。
步骤4.2直方图均衡:对背景减除图像中非零像素点进行取反,得到该点对应的灰度值,然后对整幅图像进行直方图均衡化,增大图像前景和背景的对比度。
步骤5:构造能量函数;
拉普拉斯能量函数的具体形式为:
其中,数据项表示给像素点赋予某个标签的代价,如是指给像素pij赋予标签0(1)的代价;边界项表示相邻像素不连续的代价,即将两相邻像素赋予不同标签时的代价。
图像的拉普拉斯变换可以反映图像灰度突变的地方,当图像中某像素点的拉普拉斯值符号为正时,对应的像素点一般位于灰度图的波谷处(暗);反之,当图像某像素点的拉普拉斯值符号为负时,对应的像素点就位于灰度图的波峰处(亮)。因此,本发明定义拉普拉斯能量函数的数据项具体表示为:
其中,表示像素pij处的拉普拉斯值;
边界项可分为水平方向的边界项和竖直方向的边界项本发明采用Canny边缘检测算子来确定边界项,位于边缘附近的像素不连续的可能性较大,可以直接将位于边缘两侧的像素间的不连续代价置为零,具体表示为:
其中,Eij表示像素点pij处的边缘检测结果,Iij表示像素pij处的灰度值,c为任意常数(>0)。
步骤6:构造网络图;
图像的每个像素点pij构成了网络图的中间节点,另外附加两个终端节点s和t。连接中间节点的边称为nlink,其权值由能量函数的边界项确定;连接中间节点与终端节点的边称为tlink,其权值由能量函数的数据项确定。边(pij,s)的权值为边(pij,t)的权值为边(pij,pi+1,j)的权值为边(pij,pi,j+1)的权值为
步骤7:采用基于增广路径的图割算法实现能量函数的最小化;
基于网络图建立两颗搜索树S和T,树的根节点分别位于源点s和汇点t,将搜索树的节点分为两类:主动节点和被动节点,主动节点可以由非饱和边将自由节点扩展为主动节点,实现树的生长。
步骤7.1生长阶段:两棵树不断生长,直到两棵树的主动节点相遇便找到了一条从源点到汇点的路径;
步骤7.2增广阶段:对步骤7.1获得的路径进行增广,增广会形成至少一条饱和边,连接该边的子节点就变成了孤立节点,树S和T则被拆分为多颗子树;
步骤7.3收养阶段:为每一个孤立节点寻找父节点,如果没有满足条件的父节点,将其变为自由节点,直至所有的孤立节点都被处理。
重复执行上面三个步骤,直至两棵树不再生长,被饱和边分开,便求出了图的最小割即能量函数的最小值,从而实现了图像的最终二值化。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (10)
1.一种基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,包括以下步骤:
步骤1:对彩色文档图像进行灰度预处理;
步骤2:采用双边滤波对图像进行降噪处理;
步骤3:图像背景估计,具体包括以下子步骤:
步骤3.1:针对步骤2处理后的图像,进行笔画宽度变换;
步骤3.2:计算模拟距离和成像高度;
步骤3.3:针对步骤2处理后的图像,通过两次形态学闭操作削弱文档图像中的暗特征;
步骤3.4:结合步骤3.2和步骤3.3的结果,进行图像降采样和升采样;
步骤4:背景减除与图像增强,具体包括以下子步骤:
步骤4.1:背景减除;
计算步骤2中的双边滤波图像与步骤3中的背景估计图像间的绝对差值,差值图像中灰度为零的像素点属于高置信背景像素点,并将其灰度值设为255;
步骤4.2:直方图均衡;
对背景减除图像中非零像素点进行取反,得到该点对应的灰度值,然后对整幅图像进行直方图均衡化,增大图像前景和背景的对比度;
步骤5:构造能量函数;
步骤6:构造网络图;
步骤7:采用基于增广路径的图割算法实现能量函数的最小化。
2.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤1中采用最小均值法对彩色文档图像f(x,y)进行灰度预处理,其中预处理公式为:
<mrow>
<msub>
<mi>f</mi>
<mrow>
<mi>g</mi>
<mi>r</mi>
<mi>a</mi>
<mi>y</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mo>&lsqb;</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>i</mi>
</munder>
<mrow>
<mo>(</mo>
<msub>
<mi>f</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mrow>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mfrac>
<mn>1</mn>
<mn>3</mn>
</mfrac>
<munder>
<mo>&Sigma;</mo>
<mi>i</mi>
</munder>
<msub>
<mi>f</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>,</mo>
</mrow>
其中,fi(x,y)分别为R、G、B彩色分量图像,fgray(x,y)为变换后的灰度图像。
3.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤2中采用非线性双边滤波算法进行图像降噪处理,其输出像素值依赖于邻域S内像素值f(k,l)的加权组合,具体计算公式为:
<mrow>
<mover>
<mi>f</mi>
<mo>^</mo>
</mover>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>l</mi>
<mo>)</mo>
<mo>&Element;</mo>
<mi>S</mi>
</mrow>
</munder>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>l</mi>
<mo>)</mo>
</mrow>
<mi>w</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>,</mo>
<mi>k</mi>
<mo>,</mo>
<mi>l</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>l</mi>
<mo>)</mo>
<mo>&Element;</mo>
<mi>S</mi>
</mrow>
</munder>
<mi>w</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>,</mo>
<mi>k</mi>
<mo>,</mo>
<mi>l</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>,</mo>
</mrow>
其中,权重系数w(i,j,k,l)取决于定义域核和值域核的乘积,即 和分别表示高斯距离方差和高斯灰度方差。
4.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.1中采用Canny算子对双边滤波后的灰度图像进行边缘检测,并对每一个边缘像素点p按其梯度方向查找与之对应的另一个边缘像素点q,两点间的欧式距离||p-q||即为[p,q]路径上所有像素点的笔画宽度估计,除非该像素点已经被指定了一个更小的宽度值,则图像的笔画宽度SWE为所有非零像素点笔画宽度估计的数学期望,具体计算公式为:
<mrow>
<mi>S</mi>
<mi>W</mi>
<mi>E</mi>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mi>n</mi>
</mfrac>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>s</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>&NotEqual;</mo>
<mn>0</mn>
</mrow>
</munder>
<mi>s</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
</mrow>
其中,n为笔画宽度变换输出图像s(x,y)中非零值像素点总数。
5.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.2中,并根据步骤3.1估计得到的笔画宽度SWE确定模拟观测距离d0,具体计算公式为:
d0=SWE×cotθ,
其中,θ为观测分辨角;
根据透镜成像规律和焦距方程,得到在距离目标图像为d0时视网膜上的成像高度hi,具体计算公式为:
<mrow>
<msub>
<mi>h</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<mi>f</mi>
<mrow>
<msub>
<mi>d</mi>
<mn>0</mn>
</msub>
<mo>-</mo>
<mi>f</mi>
</mrow>
</mfrac>
<msub>
<mi>h</mi>
<mn>0</mn>
</msub>
<mo>,</mo>
</mrow>
其中,f为人眼晶状体与视网膜间距,即透镜焦距,h0为目标图像原始高度。
6.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.3中,两次闭操作均采用圆形结构元素;第一次结构元素的直径设置为图像的笔画宽度,第二次结构元素的直径则比图像的笔画宽度大12个像素。
7.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.4中,距离目标图像为d0时观测到的图像高度为hi,因此,将形态学闭操作后的图像通过双线性降采样缩放到hi高度;然后采用双线性内插法将缩放后的图像恢复到原始尺寸大小,得到的图像即为估计的背景图像;在进行图像缩放时,保持图像宽高比不变。
8.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤5中,拉普拉斯能量函数的具体形式为:
<mrow>
<msubsup>
<mi>L</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
<mn>0</mn>
</msubsup>
<mo>=</mo>
<mo>-</mo>
<msup>
<mo>&dtri;</mo>
<mn>2</mn>
</msup>
<msub>
<mi>I</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>+</mo>
<mi>&phi;</mi>
<mo>;</mo>
</mrow>
<mrow>
<msubsup>
<mi>L</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
<mn>1</mn>
</msubsup>
<mo>=</mo>
<msup>
<mo>&dtri;</mo>
<mn>2</mn>
</msup>
<msub>
<mi>I</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>+</mo>
<mi>&phi;</mi>
<mo>;</mo>
</mrow>
其中,数据项表示给像素点赋予某个标签的代价,是指给像素pij赋予标签0/1的代价;表示像素pij处的拉普拉斯值;边界项表示相邻像素不连续的代价,即将两相邻像素赋予不同标签时的代价;边界项分为水平方向的边界项和竖直方向的边界项Eij表示像素点pij处的边缘检测结果,Iij表示像素pij处的灰度值,c为任意常数,其c>0。
9.根据权利要求8所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,步骤6的具体实现过程是:图像的每个像素点pij构成了网络图的中间节点,另外附加两个终端节点s和t;连接中间节点的边称为nlink,其权值由能量函数的边界项确定;连接中间节点与终端节点的边称为tlink,其权值由能量函数的数据项确定;边(pij,s)的权值为边(pij,t)的权值为边(pij,pi+1,j)的权值为边(pij,pi,j+1)的权值为
10.根据权利要求1-9任意一项所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,步骤7的具体实现过程是:基于网络图建立两颗搜索树S和T,树的根节点分别位于源点s和汇点t,将搜索树的节点分为两类:主动节点和被动节点,主动节点可以由非饱和边将自由节点扩展为主动节点,实现树的生长;
步骤7.1:生长阶段;
两棵树不断生长,直到两棵树的主动节点相遇便找到了一条从源点到汇点的路径;
步骤7.2、增广阶段;
对步骤7.1获得的路径进行增广,增广会形成至少一条饱和边,连接该边的子节点就变成了孤立节点,树S和T则被拆分为多颗子树;
步骤7.3:收养阶段;
为每一个孤立节点寻找父节点,如果没有满足条件的父节点,将其变为自由节点,直至所有的孤立节点都被处理;
步骤7.4:重复执行上面三个步骤,直至两棵树不再生长,被饱和边分开,便求出了图的最小割即能量函数的最小值,从而实现了图像的最终二值化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710289747.7A CN107133929B (zh) | 2017-04-27 | 2017-04-27 | 基于背景估计和能量最小化的低质量文档图像二值化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710289747.7A CN107133929B (zh) | 2017-04-27 | 2017-04-27 | 基于背景估计和能量最小化的低质量文档图像二值化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107133929A true CN107133929A (zh) | 2017-09-05 |
CN107133929B CN107133929B (zh) | 2019-06-11 |
Family
ID=59716294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710289747.7A Expired - Fee Related CN107133929B (zh) | 2017-04-27 | 2017-04-27 | 基于背景估计和能量最小化的低质量文档图像二值化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107133929B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107705300A (zh) * | 2017-09-28 | 2018-02-16 | 成都大熊智能科技有限责任公司 | 一种基于形态学变换实现空白页检测的方法 |
CN108830186A (zh) * | 2018-05-28 | 2018-11-16 | 腾讯科技(深圳)有限公司 | 文本图像的内容提取方法、装置、设备及存储介质 |
CN109918482A (zh) * | 2019-03-14 | 2019-06-21 | 西安航空学院 | 一种大学生创新创业计划评价分析系统 |
CN111583157A (zh) * | 2020-05-13 | 2020-08-25 | 杭州睿琪软件有限公司 | 图像处理方法、系统及计算机可读存储介质 |
CN111681175A (zh) * | 2020-05-09 | 2020-09-18 | 浙江大学 | 一种扫描灰度文档图像的预处理方法 |
CN111754416A (zh) * | 2019-03-29 | 2020-10-09 | 通用电气精准医疗有限责任公司 | 用于磁共振图像中背景噪音降低的系统和方法 |
CN112488107A (zh) * | 2020-12-04 | 2021-03-12 | 北京华录新媒信息技术有限公司 | 一种视频字幕的处理方法及处理装置 |
CN112836541A (zh) * | 2021-02-03 | 2021-05-25 | 华中师范大学 | 一种香烟32位条码的自动采集及识别方法及装置 |
CN112837329A (zh) * | 2021-03-01 | 2021-05-25 | 西北民族大学 | 一种藏文古籍文档图像二值化方法及系统 |
CN113129246A (zh) * | 2021-04-19 | 2021-07-16 | 厦门喵宝科技有限公司 | 一种文档图片的处理方法、装置及电子设备 |
CN114283156A (zh) * | 2021-12-02 | 2022-04-05 | 珠海移科智能科技有限公司 | 一种用于去除文档图像颜色及手写笔迹的方法及装置 |
CN117436058A (zh) * | 2023-10-10 | 2024-01-23 | 国网湖北省电力有限公司 | 一种电力信息安全防护系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295648A (zh) * | 2016-07-29 | 2017-01-04 | 湖北工业大学 | 一种基于多光谱成像技术的低质量文档图像二值化方法 |
-
2017
- 2017-04-27 CN CN201710289747.7A patent/CN107133929B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295648A (zh) * | 2016-07-29 | 2017-01-04 | 湖北工业大学 | 一种基于多光谱成像技术的低质量文档图像二值化方法 |
Non-Patent Citations (3)
Title |
---|
NICHOLAS R. HOWE等: "A Laplacian Energy for Document Binarization", 《2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION》 * |
RAFAEL G. MESQUITA等: "Parameter tuning for document image binarization using a racing", 《EXPERT SYSTEMS WITH APPLICATIONS》 * |
熊炜等: "低质量文档图像二值化算法研究", 《计算机应用与软件》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107705300A (zh) * | 2017-09-28 | 2018-02-16 | 成都大熊智能科技有限责任公司 | 一种基于形态学变换实现空白页检测的方法 |
CN108830186A (zh) * | 2018-05-28 | 2018-11-16 | 腾讯科技(深圳)有限公司 | 文本图像的内容提取方法、装置、设备及存储介质 |
CN109918482A (zh) * | 2019-03-14 | 2019-06-21 | 西安航空学院 | 一种大学生创新创业计划评价分析系统 |
CN111754416A (zh) * | 2019-03-29 | 2020-10-09 | 通用电气精准医疗有限责任公司 | 用于磁共振图像中背景噪音降低的系统和方法 |
CN111681175A (zh) * | 2020-05-09 | 2020-09-18 | 浙江大学 | 一种扫描灰度文档图像的预处理方法 |
CN111583157A (zh) * | 2020-05-13 | 2020-08-25 | 杭州睿琪软件有限公司 | 图像处理方法、系统及计算机可读存储介质 |
CN112488107A (zh) * | 2020-12-04 | 2021-03-12 | 北京华录新媒信息技术有限公司 | 一种视频字幕的处理方法及处理装置 |
CN112836541A (zh) * | 2021-02-03 | 2021-05-25 | 华中师范大学 | 一种香烟32位条码的自动采集及识别方法及装置 |
CN112836541B (zh) * | 2021-02-03 | 2022-06-03 | 华中师范大学 | 一种香烟32位条码的自动采集及识别方法及装置 |
CN112837329A (zh) * | 2021-03-01 | 2021-05-25 | 西北民族大学 | 一种藏文古籍文档图像二值化方法及系统 |
CN112837329B (zh) * | 2021-03-01 | 2022-07-19 | 西北民族大学 | 一种藏文古籍文档图像二值化方法及系统 |
CN113129246A (zh) * | 2021-04-19 | 2021-07-16 | 厦门喵宝科技有限公司 | 一种文档图片的处理方法、装置及电子设备 |
CN114283156A (zh) * | 2021-12-02 | 2022-04-05 | 珠海移科智能科技有限公司 | 一种用于去除文档图像颜色及手写笔迹的方法及装置 |
CN114283156B (zh) * | 2021-12-02 | 2024-03-05 | 珠海移科智能科技有限公司 | 一种用于去除文档图像颜色及手写笔迹的方法及装置 |
CN117436058A (zh) * | 2023-10-10 | 2024-01-23 | 国网湖北省电力有限公司 | 一种电力信息安全防护系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107133929B (zh) | 2019-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133929B (zh) | 基于背景估计和能量最小化的低质量文档图像二值化方法 | |
CN112819772B (zh) | 一种高精度快速图形检测识别方法 | |
CN109872285B (zh) | 一种基于变分约束的Retinex低照度彩色图像增强方法 | |
Khan et al. | An efficient contour based fine-grained algorithm for multi category object detection | |
Roa'a et al. | Generation of high dynamic range for enhancing the panorama environment | |
CN111415316A (zh) | 基于生成对抗网络的缺陷数据合成算法 | |
CN110782477A (zh) | 基于序列图像的运动目标快速检测方法、计算机视觉系统 | |
CN111275643A (zh) | 基于通道和空间注意力的真实噪声盲去噪网络模型及方法 | |
CN108765325A (zh) | 一种小型无人机模糊图像复原方法 | |
CN114331886B (zh) | 一种基于深度特征的图像去模糊方法 | |
CN107610144A (zh) | 一种改进的基于最大类间方差法的红外图像分割算法 | |
CN109961416B (zh) | 一种基于形态学梯度多尺度融合的营业执照信息提取方法 | |
CN114219732A (zh) | 基于天空区域分割和透射率细化的图像去雾方法及系统 | |
Shah et al. | An iterative approach for shadow removal in document images | |
Liu et al. | Texture filtering based physically plausible image dehazing | |
CN115272306B (zh) | 利用梯度运算的太阳能电池板栅线增强方法 | |
Fazlali et al. | Single image rain/snow removal using distortion type information | |
Wang et al. | Straight lane line detection based on the Otsu-Canny algorithm | |
Zhang et al. | Dehazing with improved heterogeneous atmosphere light estimation and a nonlinear color attenuation prior model | |
Gasparyan et al. | Iterative Retinex-Based Decomposition Framework for Low Light Visibility Restoration | |
CN114358137A (zh) | 一种基于深度学习的档案扫描件图像自动纠偏方法 | |
Chengtao et al. | Improved dark channel prior dehazing approach using adaptive factor | |
Soumya et al. | Enhancement and segmentation of historical records | |
Subramani et al. | A novel binarization method for degraded tamil palm leaf images | |
CN117315702B (zh) | 基于集合预测的文本检测方法、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190611 |
|
CF01 | Termination of patent right due to non-payment of annual fee |