Nothing Special   »   [go: up one dir, main page]

CN106056031A - 一种图像分割算法 - Google Patents

一种图像分割算法 Download PDF

Info

Publication number
CN106056031A
CN106056031A CN201610108090.5A CN201610108090A CN106056031A CN 106056031 A CN106056031 A CN 106056031A CN 201610108090 A CN201610108090 A CN 201610108090A CN 106056031 A CN106056031 A CN 106056031A
Authority
CN
China
Prior art keywords
image
image segmentation
threshold
segmentation
evaluation function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610108090.5A
Other languages
English (en)
Inventor
王燕妮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU MEILUN IMAGING SYSTEMS Co Ltd
Original Assignee
JIANGSU MEILUN IMAGING SYSTEMS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU MEILUN IMAGING SYSTEMS Co Ltd filed Critical JIANGSU MEILUN IMAGING SYSTEMS Co Ltd
Priority to CN201610108090.5A priority Critical patent/CN106056031A/zh
Publication of CN106056031A publication Critical patent/CN106056031A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种图像分割算法,属于电子图像分割技术领域。步骤包含:(1)由原始图像形成一维直方图;(2)基于一维直方图的Fisher评价函数图像分割法确定最佳双阈值。有益效果:本发明提出的一种图像分割算法具有很好的图像分割效果,能够合理的实现对图像的三类分割。对带边框、文字和背景三类的灰度图像,能够很好的把背景、边框和文字三类独立的分割出来。

Description

一种图像分割算法
技术领域
本发明涉及一种图像分割算法,属于电子图像分割技术领域。
背景技术
数字图象处理是计算机视觉的重要内容,为进一步的图像识别打好坚实的基础,主要包括噪声滤波、像素点插值、图像增强和图像分割等内容。图像分割是其中一个关键环节。目前已经出现了上千种图像分割的方法,没有一种分割方法对于所有的图像都具有很好的分割效果。分割结果的优劣直接影响到高层视觉中问题求解的正确与否。尤其针对三类图像即带文字边框、背景的图像,现有的图像分割算法分割效果差,处理出来的图片效果往往不能满足客户的需求。
发明内容
为了解决上述问题,本发明针对带边框、文字和背景三类的灰度图像,提供一种能够很好的将背景、边框和文字三类独立出来的图像分割算法。
本发明提供的技术方案为:一种图像分割算法,该方法包括如下步骤:
步骤一,由原始图像生成一维图像直方图;
步骤二,基于一维图像直方图的Fisher评价函数图像分割法确定最佳双阈值;
①设有三个类别的w0、w1和w2的A、B、C三部分,用Fisher评价函数J(Y)对三个类别间的分离度进行定量描述,其定义为:
(公式2.1)
其中,m0,m1和m2分别为w0、w1和w2的类别平均值,为w0、w1和w2的类内方差;
②对Lenna图像直方图进行双阈值分割,选择合适的两个阈值s1和s2,图像像素点(m,n)的灰度值为f(m,n)∈[0,L-1],三类别的各部分概率为:
(公式2.2)
(公式2.3)
(公式2.4)
其均值u0(s),u1(s),u2(s)分别为:
(公式2.5)
(公式2.6)
(公式2.7)
其中Pi表示灰度的概率,Pi=fi/N,fi为灰度值i的像素点,N为总像素点;
③三类w0、w1和w2的类内方差分别为:
(公式2.8)
(公式2.9)
(公式3.0)
根据Fisher评价函数单阈值图像分割方法,当图像进行三类分割时,利用一维直方图上的投影满足各聚类两两组间方差之和与组内方差和的比达到极大,则基于Fisher评价函数双阈值图像分割方法的评价准则为:
当J(s1,s2)取得最大时所对应的阈值为最佳阈值,将三类分离的最好,图像分割效果最佳,因此将该Fisher评价函数作为图像双阈值分割的准则,其阈值选择为:
步骤三,在一维直方图上,做双阈值分割,对于像素点(m,n)有
其中,fs1,s2(m,n)为分割结果图像,阈值为最佳阈值,灰度为f(m,n)。
本发明所达到的有益效果:
本发明提供的基于Fisher评价函数双阈值分割方法具有很好的图像分割效果,能够合理的实现对图像的三类分割。对带边框、文字和背景三类的灰度图像,可以很好的把背景、边框和文字三类独立分割出来。
附图说明
图1是本发明的二类聚类情况的二维分布示意图。
图2是本发明的三类聚类情况的二维分布示意图。
图3是本发明的图像直方图双阈值分割的示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
一、模式识别中的Fisher理论
在模式识别理论中,可以利用评价函数进行特征选择,假设N维特征X在一直线上投影,应选择一条投影直线,式类间的距离最大。如图1所示,对于两个类别w0和w1,假设各类的特征是二维分布,如图1中的A、B部分,将它们在直线Y1和Y2上投影,特征向量X的线性组合y用(公式1.1)表示为:
y=YTX (公式1.1)
当||Y||=1时,则y就是X向Y方向直线上的投影。
在图1中,A表示X属于w0的分布;B表示X属于w1的分布;C表示X属于w1的分布;D表示X属于w0的分布;E表示X属于w0的分布;F表示X属于w1的分布。
属于wi的特征向量X的平均值用ui用(公式1.2)表示:
(公式1.2)
其中,ni表示属于wi类X的个数,用(公式1.1)变换X,得到y的平均值mi和类内方差
(公式1.3)
(公式1.4)
为了使w0和w1进行有效识别,两类的特征应分离的越开越好,因此必须用一个评价函数描述两个类之间的分离度,Fisher评价函数J(Y)正视基于这个思想提出来的,它可以对两个类别间的分离度进行定量的描述,其定义为:
(公式1.5)
m0为w0的类别平均值,m1为w1的类别平均值,从(公式1.5)可以看出,当两个类别平均值间距离很大而且各类方差很小,两类别的平均值间距离与类内 方差和之比达到极大时,J(Y)取得最大值,两类分离效果最佳。
二、基于Fisher评价函数的双阈值图像分割方法
针对有些图像分割为三类的需要,本发明提出了一种基于Fisher评价函数的双阈值图像分割方法。该方法利用了图像像素点的灰度信息进行投影,对图像进行三类分割。
图2为三类聚类情况示意图,在图中,A表示X属于w0的分布;B表示X属于w1的分布;C表示X属于w2的分布;E表示X属于w0的分布;F表示 X属于w1的分布;G表示X属于w2的分布;L表示X属于w2的分布;M表示X属于w1的分布;N表示X属于w0的分布。
对于三个类别的w0、w1和w2的A、B、C三部分,为了使w0、w1和w2进行有效的识别,三类特征应分离的越开越好,三类分割时当三个类别两两平均值距离之和很大而各类内方差之和很小,各分割类别的两两类件平均距离之和与各类类内方差和之比达到极大时分割效果最佳,三类分离的最好。利用Fisher评价函数J(Y)对三个类别间的分离度进行定量描述,其定义为:
(公式2.1)
m0为w0的类别平均值,m1为w1的类别平均值,m2为w2的类别平均值,为w0的类内方差,为w1的类内方差,为w2的类内方差。当三个类别平均值间距离之和很大而各类差和很小,各分割类别的两两类间平均距离之和与各类类内方差之和比达到极大时分割效果最佳,J(Y)取得最大值。
因此,就需要利用图像直方图,选取两个合适的阈值,如图3所示,对图像进行三类的图像分割。图像像素点(m,n)的灰度值为f(m,n)∈[0,L-1],阈值s1和s2将图像分为三部分,各部分的概率:
(公式2.2)
(公式2.3)
(公式2.4)
其均值u0(s),u1(s),u2(s)分别为:
(公式2.5)
(公式2.6)
(公式2.7)
其中Pi表示灰度的概率,Pi=fi/N,fi为灰度值i的像素点,N为总像素点。
三类的类内方差分别为:
(公式2.8)
(公式2.9)
(公式3.0)
根据Fisher评价函数单阈值图像分割方法,当图像进行三类分割时,考虑各类的先验概率,利用一维直方图上的投影满足各聚类两两组间方差之和与组内方差和的比达到极大,则基于Fisher评价函数双阈值图像分割方法的评价准则为: (公式3.1)
当J(s1,s2)取得最大时所对应的阈值为最佳阈值,将三类分离的最好,图像分割效果最佳,因此将该Fisher评价函数作为图像双阈值分割的准则,其阈值选择为:
对于每一个像素点(m,n)其灰度为f(m,n),则双阈值分割判别为:
(公式3.3)
根据上述分析,基于一维直方图Fisher评价函数双阈值图像分割方法可表述如下:
(1)由原始图像形成一维直方图;
(2)基于一维直方图的Fisher评价函数图像分割法确定最佳双阈值;
(3)在一维直方图上,做双阈值分割,对于像素点(m,n)有
其中,fs1,s2(m,n)为分割结果图像。
通过基于Fisher评价函数的双阈值图像分割方法,能够很好的实现对灰度图像三类的分割。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (6)

1.一种图像分割算法,其特征是,该方法包括如下步骤:
步骤一,由原始的三类图像生成一维图像直方图;
步骤二,基于一维图像直方图的Fisher评价函数图像分割法确定最佳双阈值;
步骤三,在一维直方图上,做双阈值分割,对于像素点(m,n)有
其中,fs1,s2(m,n)为分割结果图像,阈值为最佳阈值,灰度为f(m,n)。
2.根据权利要求1所述的一种图像分割算法,其特征是:所述步骤二具体包括:
①设有三个类别的w0、w1和w2的A、B、C三部分,用Fisher评价函数J(Y)对三个类别间的分离度进行定量描述,其定义为:
其中,m0,m1和m2分别为w0、w1和w2的类别平均值,为w0、w1和w2的类内方差;
②对一维图像直方图进行双阈值分割,选择合适的两个阈值s1和s2,图像像素点(m,n)的灰度值为f(m,n)∈[0,L-1],三类别的各部分概率为w0(s),w1(s),w2(s),其均值为u0(s),u1(s),u2(s);
③三类w0、w1和w2的类内方差分别为:
其中Pi表示灰度的概率,Pi=fi/N,fi为灰度值i的像素点,N为总像素点;
根据Fisher评价函数单阈值图像分割方法,当图像进行三类分割时,利用一维直方图上的投影满足各聚类两两组间方差之和与组内方差和的比达到极大,则基于Fisher评价函数双阈值图像分割方法的评价准则为:
当J(s1,s2)取得最大时所对应的阈值为最佳阈值,将三类分离的最好,图像分割效果最佳,因此将该Fisher评价函数作为图像双阈值分割的准则。
3.根据权利要求2所述的一种图像分割算法,其特征是:所述Fisher评价函数的阈值选择为:
其中s1和s2为阈值。
4.根据权利要求1所述的一种图像分割算法,其特征是:所述的三类别w0、w1和w2的各部分概率计算公式为:
其中Pi表示灰度的概率,s1和s2为阈值。
5.根据权利要求1所述的一种图像分割算法,其特征是:其均值u0(s),u1(s),u2(s)
计算公式分别为:
所述w0、w1和w2为三类别的各部分概率。
6.根据权利要求1所述的一种图像分割算法,其特征是:所述三类图像为带文字、背景和边框的图像。
CN201610108090.5A 2016-02-29 2016-02-29 一种图像分割算法 Pending CN106056031A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610108090.5A CN106056031A (zh) 2016-02-29 2016-02-29 一种图像分割算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610108090.5A CN106056031A (zh) 2016-02-29 2016-02-29 一种图像分割算法

Publications (1)

Publication Number Publication Date
CN106056031A true CN106056031A (zh) 2016-10-26

Family

ID=57484339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610108090.5A Pending CN106056031A (zh) 2016-02-29 2016-02-29 一种图像分割算法

Country Status (1)

Country Link
CN (1) CN106056031A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107966454A (zh) * 2017-12-25 2018-04-27 陕西科技大学 一种基于fpga的端塞缺陷检测装置及检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853494A (zh) * 2010-05-24 2010-10-06 淮阴工学院 基于核化模糊Fisher准则聚类的彩色图像分割方法
CN102542561A (zh) * 2011-11-23 2012-07-04 浙江工商大学 基于Fisher分布的活动轮廓SAR图像分割方法
US20140310314A1 (en) * 2013-04-16 2014-10-16 Samsung Electronics Co., Ltd. Matching performance and compression efficiency with descriptor code segment collision probability optimization

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853494A (zh) * 2010-05-24 2010-10-06 淮阴工学院 基于核化模糊Fisher准则聚类的彩色图像分割方法
CN102542561A (zh) * 2011-11-23 2012-07-04 浙江工商大学 基于Fisher分布的活动轮廓SAR图像分割方法
US20140310314A1 (en) * 2013-04-16 2014-10-16 Samsung Electronics Co., Ltd. Matching performance and compression efficiency with descriptor code segment collision probability optimization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
龚淑柯: "基于Fisher评价函数的图像分割方法", 《中国优秀博硕士学位论文全文数据库 (硕士)信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107966454A (zh) * 2017-12-25 2018-04-27 陕西科技大学 一种基于fpga的端塞缺陷检测装置及检测方法

Similar Documents

Publication Publication Date Title
CN110210413B (zh) 一种基于深度学习的多学科试卷内容检测与识别系统及方法
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
Yi et al. Text detection in natural scene images by stroke gabor words
WO2018145470A1 (zh) 一种图像检测方法和装置
CN104408449B (zh) 智能移动终端场景文字处理方法
Burie et al. ICFHR2016 competition on the analysis of handwritten text in images of balinese palm leaf manuscripts
CN101122952A (zh) 一种图片文字检测的方法
Jia et al. Deep convolutional neural network based HEp-2 cell classification
Gattal et al. Automatic parameter tuning of k-means algorithm for document binarization
CN106909884A (zh) 一种基于分层结构和可变形部分模型的手部区域检测方法和装置
Yogarajah et al. A dynamic threshold approach for skin tone detection in colour images
CN110889311A (zh) 金融电子传真文档识别系统及方法
CN109272522B (zh) 一种基于局部特征的图像细化分割方法
Shivakumara et al. A new RGB based fusion for forged IMEI number detection in mobile images
CN110334631B (zh) 一种基于人脸检测与二值运算的坐姿检测方法
JP3923243B2 (ja) カラー文書画像からの文字抽出方法
CN101802844B (zh) 用于将分割引擎应用于数字图像的不同映射的方法和设备
CN110807747B (zh) 一种基于前景蒙版的文档图像降噪方法
CN106056031A (zh) 一种图像分割算法
Liu et al. Detection and segmentation text from natural scene images based on graph model
CN114332866B (zh) 一种基于图像处理的文献曲线分离与坐标信息提取方法
JP2012003358A (ja) 背景判別装置、方法及びプログラム
Vu et al. Automatic extraction of text regions from document images by multilevel thresholding and k-means clustering
CN116246298A (zh) 一种空间占用人数统计方法、终端设备及存储介质
Worring et al. Segmentation of color documents by line oriented clustering using spatial information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161026