Nothing Special   »   [go: up one dir, main page]

RU2234126C2 - Способ распознавания текста с применением настраиваемого классификатора - Google Patents

Способ распознавания текста с применением настраиваемого классификатора Download PDF

Info

Publication number
RU2234126C2
RU2234126C2 RU2002123859/09A RU2002123859A RU2234126C2 RU 2234126 C2 RU2234126 C2 RU 2234126C2 RU 2002123859/09 A RU2002123859/09 A RU 2002123859/09A RU 2002123859 A RU2002123859 A RU 2002123859A RU 2234126 C2 RU2234126 C2 RU 2234126C2
Authority
RU
Russia
Prior art keywords
classifier
recognition
image
reliability
context analysis
Prior art date
Application number
RU2002123859/09A
Other languages
English (en)
Other versions
RU2002123859A (ru
Inventor
К.В. Анисимович (RU)
К.В. Анисимович
В.В. Терещенко (RU)
В.В. Терещенко
В.Ю. Рыбкин (RU)
В.Ю. Рыбкин
Original Assignee
Аби Софтвер Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Аби Софтвер Лтд. filed Critical Аби Софтвер Лтд.
Priority to RU2002123859/09A priority Critical patent/RU2234126C2/ru
Priority to US10/241,638 priority patent/US7769235B2/en
Publication of RU2002123859A publication Critical patent/RU2002123859A/ru
Application granted granted Critical
Publication of RU2234126C2 publication Critical patent/RU2234126C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1914Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

Изобретение относится к способам распознавания печатного текста из растрового изображения. Его применение позволяет получить технический результат в виде повышения качества распознавания текста, увеличения быстродействия и снижения требований к системным ресурсам. Этот результат достигается благодаря тому, что способ включает в себя, в частности, следующие этапы: изображение поступает в настраиваемый классификатор; в случае, если настраиваемый классификатор не может распознать символ, для распознавания используют предварительно настроенный классификатор; после обработки классификатором результаты распознавания направляют на контекстный анализ; результаты контекстного анализа направляют для настройки настраиваемого классификатора. При этом ненастраиваемый классификатор совместно с алгоритмом контекстного анализа применяют для настройки настраиваемого классификатора, который, вместе с алгоритмом для контекстного анализа, применяют как основной инструмент распознавания, а ненастраиваемый классификатор применяют как вспомогательный инструмент распознавания. 9 з.п. ф-лы, 1 ил.

Description

Изобретение относится к области оптического распознавания символов и, в частности, к методам распознавания печатного текста из растрового изображения, полученного любым способом.
Известен способ распознавания текстовой информации, при котором растровое изображение разбивается на области (блоки), предположительно содержащие изображения печатных символов текста, с последующим сопоставлением изображения в блоках с эталонным описанием изображения, содержащимся в одном или нескольких специальных признаковых (или растровых) классификаторах.
Такой способ реализуется в способе распознавания информации по патенту США №5680479, 21.10.1997.
Известен способ распознавания текстовой информации, при котором набор изображений символов, составляющих слово, прошедших через классификатор, вместе с набором возможных вариантов символов направляются на анализ в алгоритм контекстного анализа. В результате контекстного анализа число возможных вариантов букв снижается до одного варианта.
Такой способ реализуется в способе распознавания информации по патенту США №5933531, 03.08.1999.
Техническим результатом изобретения является повышение качества распознавания текста, увеличение быстродействия, снижение требований к компьютерным ресурсам.
Это достигается тем, что в системе организуют растровый классификатор, настраиваемый в процессе распознавания и, следовательно, более приспособленный к параметрам текущего текста и имеющий меньшее время обращения. Настройка растрового классификатора осуществляют по результатам обработки в предварительно настроенном признаковом классификаторе и в алгоритме контекстного анализа.
Реализация этого способа позволяет существенно повысить качество распознавания текста, быстродействие распознавания, уменьшить чувствительность к ошибкам омнифонтового классификатора, снизить требований к компьютерным ресурсам.
Известны способы распознавания символов печатного текста, использующие для увеличения быстродействия классификаторы с ограниченным набором шрифтов (напр., патент США №5509092, 16.04.1996).
Недостатком этих способов является ограниченность разновидностей текста имеющимся набором шрифтов, что сильно сужает область применения способа.
Известен способ распознавания символов печатного текста, использующий многошрифтовой (омнифонтовый) классификатор (патент США №5805747, 08.09.1998).
Недостатком способа является значительное время обращения к омнифонтовому классификатору, а также значительные требуемые компьютерные ресурсы.
Известен способ, использующий для распознавания динамически настраиваемый растровый классификатор как основной инструмент для распознавания, и омнифонтовый предварительно настроенный классификатор для настройки (патент США №6038342, 14.03.2000).
Недостатком способа является чувствительность к ошибкам омнифонтового классификатора.
Известен способ, использующий для распознавания вместе с омнифонтовым классификатором алгоритм контекстного анализа (патент США №6028970, 22.02.2000)
Недостатком способа является снижение быстродействия работы.
Известны способы настройки классификаторов на работу с разными типами и размерами шрифтов (напр., патенты США №5675710, 07.10.1997; №5818963, 06.10.1998; Японии JP 2001215987, 10.08.2001).
Недостатком способов является низкое быстродействие и недостаточная надежность распознавания.
Указанные недостатки значительно ограничивают возможности использования известных способов для распознавания текстовой информации.
Известные методы непригодны для достижения заявленного технического результата.
Предлагаемый способ отличается тем, что для распознавания символов печатного текста из растрового изображения используется настраиваемый растровый классификатор совместно с алгоритмом контекстного анализа как основной инструмент для распознавания, и омнифонтовый предварительно настроенный классификатор совместно с алгоритмом контекстного анализа - как вспомогательный инструмент распознавания, а также для настройки растрового классификатора.
Растровый классификатор сравнивает распознаваемое изображение с хранящимися эталонными изображениями.
Эталонное изображение получают усреднением изображений, используемых при настройке - каждый элемент усредненного изображения хранит среднюю интенсивность элементов изображений, используемых при настройке.
В качестве меры совпадения используют взвешенную сумму разностей интенсивности пикселей сравниваемых изображений. С каждым эталонным изображением связывают уровень его надежности, корректируемый в процессе настройки.
Уровень надежности может быть выражен через число сеансов настройки изображения.
Эталонные изображения с надежностью ниже предварительно установленного уровня не участвуют в распознавании.
Результатом распознавания растрового изображения в классификаторах является одна или несколько пар значений символов вместе с соответствующей вероятностью правильного распознавания.
В случае, если вероятность правильного распознавания слова ниже предварительно заданного уровня, слово помечается для повторного распознавания. Процесс настройки включает следующие шаги.
Для каждого распознанного символа проверяется наличие похожих среди эталонных изображений.
Если такого изображения нет, создается новое эталонное изображение.
Если среди эталонных изображений есть похожее, эталонное изображение дополнительно настраивают. При этом корректируют усредненное изображение и степень надежности. Величина, на которую увеличивается надежность, зависит от оценки, которое слово получило в процессе контекстного анализа, и может составлять 25-50%.
Поэтому, чтобы эталонное изображение достигло достаточно высокого уровня надежности распознавания, оно должно пройти 2-4 сеанса настройки.
Если изображение было распознано настраиваемым классификатором, но контекстный анализ отверг этот вариант, степень надежности эталонного изображения уменьшают. При уменьшении надежности до предварительно заданного минимального уровня эталонное изображение удаляют из классификатора.
Сущность предложения иллюстрируется чертежом.
Группа графических блоков 1 с изображениями букв, предположительно составляющих слово, последовательно направляется в настраиваемый классификатор 2 для распознавания. Нераспознанные символы 4 или символы с надежностью точного распознавания ниже предварительно заданного уровня, направляются в предварительно настроенный омнифонтовый классификатор 3, результат работы которого - распознанный символ 5. Результатом работы классификатора являются один или несколько возможных вариантов символов для каждого блока с изображением буквы 6.
После обработки в классификаторе (классификаторах) набор вариантов символов 6, предположительно составляющий слово, направляется на обработку алгоритмом контекстного анализа 7. Результатом контекстной обработки является значительно суженный - обычно до 1 варианта - набор возможных вариантов слова 9. Результаты контекстной обработки в виде набора распознанных символов вместе с уровнями надежности каждого символа 8 направляются в настраиваемый классификатор 2 для пополнения и корректировки его информации.

Claims (10)

1. Способ распознавания символов по информации растрового изображения, характеризующийся совместным применением настраиваемого классификатора, ненастраиваемого классификатора и алгоритма для контекстного анализа, отличающийся тем, что настраиваемый классификатор вместе с алгоритмом для контекстного анализа применяют как основной инструмент распознавания, ненастраиваемый классификатор применяют как вспомогательный инструмент распознавания, ненастраиваемый классификатор совместно с алгоритмом контекстного анализа применяют для настройки настраиваемого классификатора, причем распознавание включает следующие этапы: изображение поступает в настраиваемый классификатор; в случае, если настраиваемый классификатор не может распознать символ, для распознавания используют предварительно настроенный классификатор; после обработки классификатором результаты распознавания направляют на контекстный анализ; результаты контекстного анализа направляют для настройки настраиваемого классификатора.
2. Способ по п.1, отличающийся тем, что настройка настраиваемого классификатора включает следующие этапы: распознанное другими средствами изображение направляют в настраиваемый классификатор; изображение сравнивают с уже имеющимися эталонными на сходство, если сходство не находят, создают новое эталонное изображение; если сходство находят, информацию эталонного изображения пополняют следующим путем: корректируют усредненное изображение эталона вновь поступившим изображением; изменяют значение уровня надежности распознавания эталона; если уровень надежности эталонного изображения ниже предварительно установленного порога, процесс настройки продолжают; если уровень надежности эталонного изображения равен или превышает предварительно установленный порог, процесс настройки данного эталона заканчивают.
3. Способ по п.1, отличающийся тем, что в случае, если надежность правильного распознавания по крайней мере одного символа в слове ниже предварительно заданного уровня, слово помечают для повторного распознавания.
4. Способ по п.3, отличающийся тем, что по окончании распознавания документа, делают повторное распознавание по помеченным словам.
5. Способ по п.1, отличающийся тем, что нераспознанные и распознанные с недостаточной надежностью символы восстанавливают по словарю.
6. Способ по п.2, отличающийся тем, что новое эталонное изображение создают путем усреднения изображений, используемых для настройки.
7. Способ по п.2, отличающийся тем, что в качестве меры сходства используют взвешенную сумму разностей интенсивности элементов сравниваемых изображений.
8. Способ по п.1, отличающийся тем, что значение уровня надежности эталонного изображения, распознанного настраиваемым классификатором, но отвергнутого контекстным анализом, уменьшают.
9. Способ по п.8, отличающийся тем, что при уменьшении надежности до предварительно заданного минимального уровня эталонное изображение удаляют из классификатора.
10. Способ по п.2, отличающийся тем, что уровень надежности может быть выражен через число сеансов настройки изображения символа.
RU2002123859/09A 2002-09-09 2002-09-09 Способ распознавания текста с применением настраиваемого классификатора RU2234126C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2002123859/09A RU2234126C2 (ru) 2002-09-09 2002-09-09 Способ распознавания текста с применением настраиваемого классификатора
US10/241,638 US7769235B2 (en) 2002-09-09 2002-09-12 Text recognition method using a trainable classifier

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2002123859/09A RU2234126C2 (ru) 2002-09-09 2002-09-09 Способ распознавания текста с применением настраиваемого классификатора

Publications (2)

Publication Number Publication Date
RU2002123859A RU2002123859A (ru) 2004-03-27
RU2234126C2 true RU2234126C2 (ru) 2004-08-10

Family

ID=31989404

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2002123859/09A RU2234126C2 (ru) 2002-09-09 2002-09-09 Способ распознавания текста с применением настраиваемого классификатора

Country Status (2)

Country Link
US (1) US7769235B2 (ru)
RU (1) RU2234126C2 (ru)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100303356A1 (en) * 2007-11-28 2010-12-02 Knut Tharald Fosseide Method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
US8249344B2 (en) 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
US8509563B2 (en) 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images
RU2571545C1 (ru) * 2014-09-30 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Классификация изображений документов на основании контента
RU2571510C2 (ru) * 2013-12-25 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении
RU2571396C2 (ru) * 2014-03-26 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и система для верификации в процессе чтения
RU2603495C1 (ru) * 2015-06-16 2016-11-27 Общество с ограниченной ответственностью "Аби Девелопмент" Классификация изображений документов на основе параметров цветовых слоев
RU2634192C1 (ru) * 2016-06-24 2017-10-24 Общество с ограниченной ответственностью "Аби Девелопмент" Ввод данных из серии изображений, соответствующих шаблонному документу
RU2639668C2 (ru) * 2015-10-30 2017-12-21 Сяоми Инк. Способ и устройство для идентификации области
US11151472B2 (en) 2017-03-31 2021-10-19 At&T Intellectual Property I, L.P. Dynamic updating of machine learning models

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8571262B2 (en) * 2006-01-25 2013-10-29 Abbyy Development Llc Methods of object search and recognition
RU2006101908A (ru) * 2006-01-25 2010-04-27 Аби Софтвер Лтд. (Cy) Структурное описание документа, способ описания структуры графических объектов и способы их распознавания (варианты)
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US9514451B2 (en) * 2013-10-29 2016-12-06 Tencent Technology (Shenzhen) Company Limited Method, apparatus and system for information identification
US9361531B2 (en) * 2014-07-21 2016-06-07 Optum, Inc. Targeted optical character recognition (OCR) for medical terminology
US10348667B2 (en) 2014-10-27 2019-07-09 Oath Inc. System and method for entity detection in machine generated messages
US10185701B2 (en) * 2016-10-17 2019-01-22 Microsoft Technology Licensing, Llc Unsupported character code detection mechanism
US10679101B2 (en) * 2017-10-25 2020-06-09 Hand Held Products, Inc. Optical character recognition systems and methods

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
JP2749020B2 (ja) * 1991-11-14 1998-05-13 日立ソフトウエアエンジニアリング株式会社 ダイアグラム認識システム
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
DE69322306T2 (de) * 1992-04-24 1999-04-29 Hitachi, Ltd., Tokio/Tokyo Gegenstandserkennungssystem mittels Bildverarbeitung
JP2630923B2 (ja) * 1994-12-05 1997-07-16 日本アイ・ビー・エム株式会社 画像認識方法及び装置
US5844991A (en) * 1995-08-07 1998-12-01 The Regents Of The University Of California Script identification from images using cluster-based templates
US6232960B1 (en) 1995-12-21 2001-05-15 Alfred Goldman Data input device
JP3279913B2 (ja) * 1996-03-18 2002-04-30 株式会社東芝 人物認証装置、特徴点抽出装置及び特徴点抽出方法
US6330354B1 (en) * 1997-05-01 2001-12-11 International Business Machines Corporation Method of analyzing visual inspection image data to find defects on a device
US6028970A (en) * 1997-10-14 2000-02-22 At&T Corp Method and apparatus for enhancing optical character recognition
US6393159B1 (en) * 1998-06-29 2002-05-21 The Regents Of The University Of California Multiscale characterization and analysis of shapes
US6735337B2 (en) * 2001-02-02 2004-05-11 Shih-Jong J. Lee Robust method for automatic reading of skewed, rotated or partially obscured characters

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249344B2 (en) 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
US8509563B2 (en) 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images
US20100303356A1 (en) * 2007-11-28 2010-12-02 Knut Tharald Fosseide Method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
RU2445699C1 (ru) * 2007-11-28 2012-03-20 Люмэкс Ас Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью
US8467614B2 (en) 2007-11-28 2013-06-18 Lumex As Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images
RU2571510C2 (ru) * 2013-12-25 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении
RU2571396C2 (ru) * 2014-03-26 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и система для верификации в процессе чтения
RU2571545C1 (ru) * 2014-09-30 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Классификация изображений документов на основании контента
RU2603495C1 (ru) * 2015-06-16 2016-11-27 Общество с ограниченной ответственностью "Аби Девелопмент" Классификация изображений документов на основе параметров цветовых слоев
RU2639668C2 (ru) * 2015-10-30 2017-12-21 Сяоми Инк. Способ и устройство для идентификации области
US10157326B2 (en) 2015-10-30 2018-12-18 Xiaomi Inc. Method and device for character area identification
RU2634192C1 (ru) * 2016-06-24 2017-10-24 Общество с ограниченной ответственностью "Аби Девелопмент" Ввод данных из серии изображений, соответствующих шаблонному документу
US11151472B2 (en) 2017-03-31 2021-10-19 At&T Intellectual Property I, L.P. Dynamic updating of machine learning models

Also Published As

Publication number Publication date
US7769235B2 (en) 2010-08-03
US20040047508A1 (en) 2004-03-11
RU2002123859A (ru) 2004-03-27

Similar Documents

Publication Publication Date Title
RU2234126C2 (ru) Способ распознавания текста с применением настраиваемого классификатора
US8761514B2 (en) Character recognition apparatus and method based on character orientation
US7088873B2 (en) Bit-mapped image multi-stage analysis method
CN107067006A (zh) 一种服务于数据采集的验证码识别方法及系统
WO2017141802A1 (ja) 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体
JP3155616B2 (ja) 文字認識方法及び装置
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
EP1866838A1 (en) Method and system for adaptive recognition of distorted text in computer images
CN111695550B (zh) 一种文字提取方法、图像处理设备和计算机可读存储介质
CN110837816A (zh) 光学字符识别系统、边缘节点及系统
JPH10207978A (ja) 文字等パターン照合方法及び装置
JP3595081B2 (ja) 文字認識方法
Bataineh et al. Arabic-jawi scripts font recognition using first-order edge direction matrix
JP3226355B2 (ja) 認識結果評価方法
JP2922949B2 (ja) 文字認識の後処理方法
EP0625764A2 (en) Accelerated OCR classification
CN116311264A (zh) 一种基于字符轮廓的字符识别方法
JPH1166240A (ja) 文書認識方法および文書認識装置
CN112861589A (zh) 人像提取、质量评价、身份验证及模型训练方法及装置
JPH0484380A (ja) 文字認識装置
JPH02294792A (ja) 文字認識装置
JP2001043314A (ja) 文字切り出し方法
JPH0371380A (ja) 文字認識装置
JPH05159107A (ja) 光学文字読取装置
JPH05242299A (ja) 文字認識装置

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20050910

NF4A Reinstatement of patent
HE4A Change of address of a patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20141031

QB4A Licence on use of patent

Free format text: LICENCE

Effective date: 20151118

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20161213

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311