DE1549930C3 - Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen - Google Patents
Einrichtung zum Erkennen vorzugsweise handgeschriebener SchriftzeichenInfo
- Publication number
- DE1549930C3 DE1549930C3 DE1549930A DET0035145A DE1549930C3 DE 1549930 C3 DE1549930 C3 DE 1549930C3 DE 1549930 A DE1549930 A DE 1549930A DE T0035145 A DET0035145 A DE T0035145A DE 1549930 C3 DE1549930 C3 DE 1549930C3
- Authority
- DE
- Germany
- Prior art keywords
- zone
- form elements
- submatrices
- characters
- zones
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/166—Normalisation of pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/168—Smoothing or thinning of the pattern; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
Die Erfindung betrifft eine Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen, bei der
ein Schriftzeichen aufweisendes Bildfeld zeilenrasterartig abgetastet wird und das Abtastergebnis digitalisiert
und verdünnt sowie auf das Vorliegen vorbestimmte Formelemente untersucht wird, und bei der die
ermittelten Formelemente untersucht wird, und bei de: die ermittelten Formelemente mit vorgezeichneter
Standardmustern verglichen werden, wobei bei ausrei chender Übereinstimmung ein dem Schriftzeichet
entsprechendes Ausgabezeichen bewirkt wird.
Aus der Siemens-Zeitschrift, April 1963, Seiten 213 bh
215 ist es bekannt, Größe und gegenseitigen Abstanc einzelner Linien von Schriftzeichen zu deren Erkennung
auszuwerten. Das Erfordernis weitgehender Überein Stimmung erschwert bereits die Abtastung und setzt dk
Benutzung einer vorgegebenen Schriftart voraus Sollten dagegen unterschiedliche Schriftarten insbeson
dere aber auch handgeschriebene Schriftzeichen gelesen werden können, so werden gemäß de:
angegebenen Zeitschrift zweckmäßig die Schriftzeicher
in Formelemente aufgelöst, deren Beschreibung mit det vorgegebener Muster verglichen wird. Werden hierbe
an Stelle absoluter Maße relative Maße eingeführt, se wird eine gewisse Unabhängigkeit von der jeweilige!
Schriftgröße erzielt, und es ist möglich, an sich bekannte wirkungsvolle statische Methoden der Störverminde
rung wie die Digitalisierung und die Verdünnunc einzusetzen, ohne die Erkennbarkeit der Zeicher
hierdurch wesentlich zu beeinträchtigen.
Die US-PS 32 68 864 empfiehlt, eine Vielzahl vor Merkmalen von Formelementen zu ermitteln, aufgrünt
deren das dargestellte Zeichen erkennbar ist. Di: Vielzahl solcher Merkmale kompliziert nicht nur de:
Aufbau der zum Erkennen von Schriftzeichen vorgese henen Einrichtung, auch die zum Vergleich beigegebe
nen Standardmuster werden vielfältig und umfangreich so daß auch in diesem Falle die zugehörige:
Vorrichtungen komplex, umfangreich und aufwendi; werden, und die bei handgeschriebenen Schriftzeiche■
vielfach auftretenden Abweichungen erschweren da Erkennen und geben eine relativ hohe Quote nich
identifizierbarer Schriftzeichen.
Die Erfindung geht von der Aufgabe aus, ein
Einrichtung der beschriebenen Gattung zu schaffen, di bei relativ geringem Aufwand auch bei stark aufwei
chenden Größen und Formen von Schriftzeichen durd Berücksichtigen der Kontinuität des Schriftzeichen
sowie der Lage der Anbindungsstelle eines abwärt führenden Schriftzuges auf einem über diesem an
Zeichenanfang befindlichen Horizontalstrich eine höh Identifizierungsquote ergibt. Gelöst wird diese Aufgab
mit der im Patentanspruch 1 angegebenen Merkmals kombination. Eine vorteilhafte Weiterbildung de
Erfindung ist im Unteranspruch aufgeführt.
Im einzelnen werden die Merkmale der Erfindung
anhand der folgenden Beschreibung eines Ausführungs beispiels in Verbindung mit dieses darstellende;
Zeichnungen erläutert. Es zeigen hierbei
F i g. 1 im stark vereinfachten Blockschaltbild ein Einrichtung zum maschinellen Lesen handgeschriebe
ner Schriftzeichen,
F i g. 2 ein Diagramm zur Erläuterung der matrixart5
b0 gen Aufteilung eines Schriftzeichens durch den Abtas^
zeilenraster und dessen Unterteilung,
F i g. 3 ausführlicher dargestellt zum Erkennen einfi
eher Formelemente vorgesehene Vorrichtungen de Fig. 1,
Fig.4 eine Aufstellung einfacher Formelement sowie deren Verschlüsselung,
Fig.5 eine Aufstellung mit der Einrichtung nac
F i g. 1 ermittelbarer komplexer Formelemente sowi
deren Verschlüsselung,
Fig. 6 eine Vorrichtung zur Ermittlung einer Verbindungen benachbarter Kodezeichen kennzeichnenden
Zusatzmarkierung,
Fig.7 und 9 die Raster zweier handgeschriebener Schriftzeichen,
Fig.8 und 10 tabellenartig die Verschlüsselung der
Formelemente der Schriftzeichen nach F i g. 7 und 9, und
F i g. 11 nebeneinandergestellt die Matrix eines Schriftzeichens und die Kodebezeichnungen der in den
einzelnen Zonen ermittelten Formelemente.
In F i g. 1 ist eine Einrichtung zum maschinellen Lesen von handgeschriebenen Schriftzeichen im stark vereinfachten
Blockschaltbild dargestellt Auf dem Aufzeichnungsträger 1 ist als Beispiel eines zu lesenden
Schriftzeichens die Ziffer »8« dargestellt Dieses Schriftzeichen wird mittels eines optischen Systems 2
auf dem Schirm einer Fernsehkamera 3 abgebildet, welche die Abbildung des Schriftzeichens rasterförmig
abtastet und die erhaltene Signalfolge dem Triggerverstärker 4 zuführt, der die Signalfolge digitalisiert, d. h., in
eine Signalfolge wandelt, die zwischen zwei Pegeln wechselt.
Die digitalisierte Signalfolge wird dem Eingangskreis 5 zugeführt, in dem die Signalfolge gespeichert wird,
wobei gleichzeitig die anschließende Auswertung erleichternde bzw. sichernde Vorgänge durchgeführ:
werden: So wird die Lage der durch die Abtastung erhaltenen Bildmatrix ermittelt und gegebenenfalls
korrigiert, die Bildmatrix durch Vergrößern oder Verkleinern der Kapazität der zum Lesen benutzten
Speicher angeglichen und in an sich bekannter Weise wird die Bildmatrix des Schriftzeichens verdünnt.
Mittels der Zonenwahlvorrichtung 6 werden aus der Matrix des in einen Speicher eingelesenen Schriftzeichens
einzelne parallele Zonen ausgeblendet und einem Detektorkreis 7 für einfache Formelemente zugeführt,
der im Vergleich mit dem Speicher 8 festgehaltenen Normal-Formelementen Submatrizes der Zonen auf
einfache Formelemente untersucht. Die Symbole der aufgefundenen Formelemente werden dem Detektor 9
für komplexe Formelemente zugeführt, der aufgrund der Verknüpfung von durch Submatrizes jeweils einer
Zone ermittelten einfachen Formelemente und im Vergleich mit im Speicher 10 enthaltenen Zonenkennzeichen
zonenweise komplexe Formelemente analysiert und aufgrund deren Kodierung das abgetastete Zeichen
ermittelt und dem Ausgabekreis 11 zur Auslösung des Ausgabezeichens überstellt.
Im Ausführungsbeispiel ist gemäß der Darstellung in Fig.2 eine Abtastung des Aufzeichnungsträgers in
achtundzwanzig Abtastzeilen zu je dreißig Bildpunkten vorgesehen. In der Figur ist dies angedeutet indem vor
und hinter jeder Zeile der die Signale 12 des abgetasteten und zu lesenden Schriftzeichens aufweisenden
Bildmatrix 13 ein kleiner Kreis 14 dargestellt ist und über der Matrix sind entsprechende Kreise 15
gezeigt welche die Anzahl der Bildpunkte bzw. Bits innerhalb einer Zeile darstellen. Die im Ausführungsbeispiel
eine Kapazität von 28 χ 30 Bits aufweisende Bildmatrix 13 ist in dreizehn horizontale, vertikal
übereinander liegende Zonen 16 unterteilt die jeweils durch die Zonenwahlvorrichtung 6 der F i g. 1 ausblendbar
sind, und die jeweils drei Abtastzeilen umfassen, wobei einander benachbarte Zonen 16 sich um jeweils
eine Abtastzeile überlappen. Im Verlaufe der weiteren Bearbeitung der Signale im Detektor 9 der F i g. 1
werden die Zonen in Zeilenrichtung in achtundzwanzig Submatrizes 17 unterteilt, die im Ausführungsbeispiel
jeweils 3x3 Bits umfaßen.
Im einzelnen soll der Auswertungsvorgang nunmehr anhand detaillierter Blockschaltbilder erläutert werden.
Vom Triggerverstärker 4 der F i g. 1 aus werden die durch die Abtastung des Aufzeichnungsträgers 1
gewonnenen Signalfolgen dem Eingangskreis 5 zugeführt und in diesem, wie oben beschrieben, aufbereitet,
ίο insbesondere verdünnt und in einer Speichervorrichtung
500 der F i g. 3 gespeichert Die Kapazität dieses Digitalspeichers 500 entspricht einem Schriftzeichen
bzw. der gesamten Bildmatrix 13 und beträgt im Ausführungsbeispiel 28 χ 30 Bits.
Die Aufteilung der einer Bildmatrix zugehörigen Signalfolgen in die einzelnen Zonen und damit das
Arbeiten der Zonenwahlvorrichtung 6 der F i g. 1 wird anhand der Fig.3 erläutert Die die überarbeitete
Bildmatrix enthaltende Speichervorrichtung 500 wird mittels der Abfragestufe 60 zeilenweise abgefragt und
die ermittelten Signale werden dem eine Kapazität von drei Zeilen aufweisenden und durch den Taktgeber 62
geschalteten Zonenregister 61 zugeführt Nach Einbringen der drei Zeilen entsprechenden Signalfolgen
werden die Signale im Zonenregister 61 taktweise nach rechts verschoben, und die jeweils in den letzten neun
Zellen anstehenden, eine Submatrix darstellenden Signale werden zur Ermittlung der durch sie dargestellten
einfachen Formelemente einem Detektorkreis 70 zugeführt Nach dreißigfacher Verschiebung ist die erste
Zone 16 der F i g. 2 untersucht, und die mittlere sowie die untere, jeweils einer Zeile entsprechende Abteilung
des Zonenregisters 61 sind geleert, doch ist gleichzeitig der Inhalt der die untere Zeile repräsentierenden
Speicherzellen in die Speicherzellen der oberen Zeile übertragen worden. Zur Auswertung der nächsten Zone
überträgt daher die Abfragestufe 60 die Signalfolgen der folgenden beiden Zeilen aus der Speichervorrichtung
500 in die mittlere und untere Abteilung des Zonenregisters 61. So werden nacheinander die
dreizehn Zonen untersucht, wobei innerhalb der Zone jeweils aufeinanderfolgende einander überlappende
Submatrizes dem Detektorkreis 70 zur Auswertung übermittelt werden.
Aufgabe des Detektorkreises 70 ist es, die ihm aufeinanderfolgend zugeführten Submatrizes auf das
Vorliegen einfacher Formelemente zu untersuchen. Gemäß Fig.4 werden hierbei sieben Ergebnisse
unterschieden, die mit Ziffern 0 bis 6 bezeichnet sind,
so und denen die Auswertung erleichternde Symbole zugeordnet sind. Hierbei wird unterschieden zwischen
0: »Submatrix ohne Formelement«, 1: »vertikaler Strich«, 2: »steigender Schrägstrich«, 3: »fallender
Schrägstrich«, 4: »oberer horizontaler Strich«, 5:
»unterer horizontaler Strich«, und 6: »andere und mit den vorhergehenden nicht identifizierbaren Zeichen«.
Der Detektorkreis 70 gibt die Auswertergebnisse jeder untersuchten Submatrix kodiert über seinen
Ausgang 63 ab. Ist eine Auswertung nicht möglich, weil die Verdünnung oder aber die Verkleinerung als
Anpassung an das vorgegebene Matrixfeld nicht weit genug getrieben wurden, so wird über den Ausgang 64
ein Signal abgegeben, das anzeigt, daß die Identifizierung unmöglich ist Daraufhin findet eine weitere
Aufbereitung des Zeichens, gegebenenfalls unter erneuter Abtastung, statt
Eine sichere Erkennung handgeschriebener Schriftzeichen, insbesondere, wenn sie sich nicht nur auf
Ziffern beschränken, ist allein aufgrund der durch den Detektorkreis 70 ermittelten einfachen Formelemente
und ihrer Lage innerhalb der Bildmatrix sowohl umständlich als auch aufwendig und unsicher, wenn
übliche Vergleichsmethoden eingesetzt werden. Es wird daher der Ausgang 63 des Detektorkreises 70 gemäß
F i g. 1 mit dem Detektor 9 verbunden, der in der Lage ist, auch kompliziertere Formelemente zu ermitteln.
Erläutert wird dies anhand der F i g. 5. Werden, wie dies bei den ersten fünf Beispielen gezeigt ist, bei
Hinzuziehen der Auswertergebnisse der benachbarten Submatrizes keine weiteren Einzelheiten entdeckt, so
werden die aus Fig.4 bekannten einfachen Formelemente
durch einen Kode bezeichnet. Wird dagegen ermittelt, daß einfache Formelemente zu Bogen oder
geschwungenen Kurven verbunden sind, mehrfach parallel angeordnet sind oder sich verzweigen, so
werden zur weiteren Auswertung nunmehr diese komplexen, beim Vergleich von in einer Zone
aufeinanderfolgenden Submatrizes gewonnenen Formelemente durch Kodebezeichnungen fixiert.
Vorgesehen sind gemäß Fig.5 die Formelemente:
»kein Formelement«, »vertikaler Strich«, »steigender Schrägstrich«, »fallender Schrägstrich«, »Horizontalstrich«,
»nach oben geöffnete konvexe Kurve«, »nach unten geöffnete konvexe Kurve«, »zwei parallele
vertikale Striche«, »Sinuskurve, bei der eine Halbperiode auch flach ausgebildet sein kann«, »Spiegelkurve zur
vorhergehenden» drei vertikale Striche«, »ein Vertikalstrich mit nachgeordneter, nach unten geöffneter
konvexer Kurve«, »nach unten konvexe Kurve mit folgendem Vertikalstrich«, »Vertikalstrich, gefolgt von
Horizontalstrich«, »Horizontalstrich, gefolgt von Vertikalstrich«, und »verzweigte Kurve in Form eines
liegenden F oder £"«. Auch hier kann ein weiters Zeichen vorgesehen sein, das die Nichtauswertbarkeit
anzeigt und durch Auslösung einer Änderung des Erfassungsfeldes, der Verdünnung und/oder Verkleinerung
die Erkennbarkeit des untersuchten Schriftzeichens verbessert.
Parallel zur Ermittlung der Kodezeichen für komplexe Formelemente werden die Verbindungsverhältnisse
benachbarter Submatrizes aufeinanderfolgender Zonen der Matrix untersucht und gegebenenfalls eine Zusatzmarkierung
ausgelöst, wenn an eine vorbestimmte der Hälften eines am Zeichenanfang stehenden Horizontalstriches
sich ein abwärts weisender Vertikalstrich anschließt und im übrigen ein Zusammenhang zwischen
benachbarten Formelementen aufeinanderfolgender Zonen besteht Die Ableitung einer solchen Zusatzmarkierung
wird an Hand der Fig.6 erläutert, wobei Verbindungen zwischen komplexen Formelementen am
Zeichenanfang nur dann zur Auslösung von Zusatzmarkierungen führen, wenn ein abwärts weisendes Formelement
mittig oder linksseitig an einen Horizontalstrich 5s anschließt
Das in F i g. 6 dargestellte dreißgstellige Register 800 übernimmt die Kodezeichen für primäre Formelemente
vom Ausgang des Detektorkreises 70 und gibt sie an eine Schlüsselstufe 801 weiter, die für den Kodewert »0«
der F i g. 4, d. h. für eine Submatrix ohne Formelement, auch am Ausgang einen Binärwert »0« liefert, während
für die in F i g. 4 mit 1 bis 6 bezeichneten Formelemente der binäre Ausgangswert »1« abgegeben wird. Dem
Ausgang der Schlüsselstufe 802 sowie eine Schaltstufe 803 nachgeordnet Vor Beginn der Auswertung einer
Matrix wird die Schaltstufe 803 gesperrt so daß sie die ihr von der Schlüsselstufe 801 zugeführten Signale nicht
an die ihr nachgeschalteten und in Serie betriebenen Schieberegister 804 und 806 weiterzugeben vermag. Die
zunächst von der Schlüsselstufe 801 abgegebenen Binärwerte »0« vermögen auch die vor Beginn der
Auswertung in den Ausgangszustand zurückgeschaltete Zählstufe 802 nicht zu beeinflussen. Vom Auftreten des
ersten Binärwertes »1« am Ausgange der Schlüsselstufe 801 an jedoch zählt die dreiwertige Zählstufe 801 die
von dieser abgegebenen Signale und gibt nach Eintreffen des dritten Signales ein Ausgangssignal ab,
das der Schaltstufe 803 zugeführt wird und diese öffnet. Über diese Schaitstufe 803 werden damit die nunmehr
am Ausgang der Schlüsselstufe 801 auftretenden Ausgangssignale nacheinander in das Schieberegister
804 synchron mit der Ermittlung der Symbole für einfache Formelemente übertragen, und nach Füllung
des Schieberegisters 804 werden dessen überlaufende Impulse dem Schieberegister 806 übermittelt dessen
Kapazität der Anzahl der Submatrizes je Zone angepaßt ist Die drei letzten Speicherzellen des
Schieberegisters 804 sind mit drei Eingängen einer Oder-Stufe 805 verbunden, deren Ausgang zur Und-Stufe
807 führt Der zweite Eingang der Und-Stufe 807 steht mit der vorletzten Speicherzelle des Schieberegisters
806 in Verbindung. Damit tritt am Ausgange der Und-Stufe 807 stets dann ein Signal auf, das zur
Auslösung der Zusatzmarkierung dient bzw. als diese selbst gilt, wenn in mindestens einer der drei letzten
Speicherzellen des Schieberegisters 804 und der vorletzten Speicherzelle des Schieberegisters 806 eine
»1« auftreten. Dieses ist stets dann der Fall, wenn in einer Submatrix einer Zone mindestens in einer der
orthogonal oder diagonal unter dieser stehenden Submatrizes gleichzeitig Binärwerte »1« auftreten,
wobei jedoch infolge der durch das Zusammenwirken der Schaltstufe 803 mit der Zählstufe 802 der erste
Binärwert »1« sowie die beiden folgenden Binärwerte unterdrückt werden, so daß die Anbindung an ein den
unterdrückten Binärwerten am Zeichenanfang entsprechendes Formelement bei der Bildung der Zusatzmarkerung
nicht berücksichtigt wird.
Die Vorteile eirer solchen Zusatzmarkierung und
deren Aussagemöglichkeiten werden anhand der F i g. 7 bis 10 erläutert. Die Fig.7 bzw. 9 zeigen den
Belegungszustand einer Speichermatrix, der beim Abtasten von Schriftzeichen »3« bzw. »5« des
Aufzeichnungsträgers 1 erhalten wird. Die F i g. 8 bzw. 10 zeigen die sich in den einzelnen Zonen der Matrizes
der F i g. 7 und 9 für die Formelemente sich ergebenden Symbole sowie ggf. die als Stern dargestellte Zusatzmarkierung.
Wie der Vergleich der F i g. 8 und 10 zeigt, sind die Symbole der Formelemente der beiden zu
erkennenden Ziffern gleich. Der wesentliche Unterschied zwischen den Ziffern liegt darin, daß die
steigenden Linien (Symbol: INC) im Falle der F i g. 7 an das rechte Ende des Horizontalstriches (Symbol: BAR)
anschließen, während die entsprechend geneigte Linie bei der »5« der F i g. 9 am linken Ende anschließt In der
obersten der ein Symbol aufweisenden Zonen fehlt die Zusatzmarkierung in beiden Fällen, da eine weitere
Verbindung in eine höhere Zone nicht besteht, sondern das Zeichen hier endet In der folgenden niedrigeren
Zone fehlt wegen des Rechtsanschlusses des Schrägstriches in Fig.7 die Zusatzmarkierung in Fig.8. Wegen
der Linksanbindung des Schrägstriches in Fig.9 ist diese Zusatzmarkierung in Fig. 10 vorhanden, so daß
die Kodierungen beider Ziffern sich im wesentlichen durch das Fehlen bzw. Vorhandensein dieser Zusatz-
markierung unterscheiden. Die vollständige Auswertung innerhalb einer Zone, im folgenden als »Zonenkennwert«
bezeichnet, umfaßt also den Kode des Formkennwertes in Verbindung mit der Zusatzmarkierung.
Die Behandlung der Zonenkennwerte erfolgt, durch eine Zonensteuervorrichtung bestimmt, zonenweise
nacheinander in der Reihenfolge der Ordnungsnummern der Zonen. Hierbei wird einem Koinzidenzkreis
vom Speicher 10 für komplexe Formelemente des Detektors 9 deren Symbol zugeführt, während die
Und-Stufe 807 der Fig.6 dem Koinzidenzkreis die zugehörige Zusatzmarkierung zuführt, so daß die
kompletten Zonenkennwerte am Koinzidenzkreis anliegen.
Die Anzal der möglichen Zonenkennwerte beträgt im erläuterten Beispiel also 16 χ 2 = 32, so daß die
Kodierung auf diese Anzahl abzustellen ist. Sind so durch den Detektor 9 der F i g. 1 für alle Zonen
nacheinander die Zonenkennwerte bestimmt, so können sie mit im Speicher 10 vorgespeicherten Zonenkennwerten
verglichen werden, und im Falle der Übereinstimmung wird der Kode des identifizierten Schriftzeichens
vom Ausgangskreis 11 abgegeben.
Praktisch erläutert wird das Lesen eines handgeschriebenen
Schriftsatzes nunmehr anhand der beispielhaft gewählten Ziffer »7« in Verbindung mit F i g. 11. Im
linken Teil dieser Figur ist, angedeutet durch die daneben und darüber dargestellten Kreise 14 und 15,
eine Matrix dargestellt, in die das Bild des Schriftzeichens »7« nach elektrooptischer Ablesung des handgeschriebenen
Schriftzeichens vom Aufzeichnungsträger 1 und Digitalisierung, Größenanpassung sowie Verdünnung
des Abtastergebnisses eingespeichert ist. Dieses Speicherergebnis wird nunmehr nacheinander in einander
überlappenden Zonen 1 bis 13 untersucht, deren Ordnungsnummern in der vorletzten Spalte für die
jeweils oberen beiden der drei Abtastzeilen einer Zone angegeben sind. Die Abtastergebnisse innerhalb der im
Ausführungsbeispiel 3 χ 3 Bit großen Submatrizes sind in der breiten mittleren Spalte der F i g. 11 im einzelnen
aufgeführt, die beim Vergleich aufeinanderfolgender Submatrizes einer Zone ermittelten Bezeichnungen für
komplexe Formelemente sind durch Buchstaben in der rechts stehenden Spalte angezeigt, und die folgende, als
Stern dargestellte Zusatzmarkierung gibt die Verbindungsverhältnisse an, die beim Vergleich übereinander
liegender Submatrizes ermittelt werden, so daß diese Spalte die Folge der Zonenkennwerte und damit die
Ausgangskodierung für die durch Vergleich bewirkte Identififzierung enthält.
Zunächst werden innerhalb der Zonen jeweils drei in Zonenrichtung aufeinander folgende Speicherzellen
untersucht. In den ersten beiden Zonen beträgt die Breite des Zeichens »0«, und infolge fehlender
Einspeicherungen werden auch weder einfache noch komplexe Formelemente festgestellt.
In der dritten Zone, die sich bis zur siebenden Abtastzeile erstreckt, wird das einfache Formelement
horizontaler Strich« mit der Bezeichnung 5 bzw. das Symbol L der F i g. 4 dreifach ermittelt, und der in der
rechten Spalte der Figur dargestellte Zonenkennwert wird daher mit BAR gemäß Fi g. 5 angegeben; da eine
Verbindung zur darüber liegenden Zone fehlt, enthält der Zonenkennwert keine Zusatzmarkierung. Entsprechend
weitergeführt werden auch die Submatrizes der folgenden Zonen nacheinander untersucht und deren
Zonenkennwerte ermittelt.
Im Ausführungsbeispiel sind Speicher oft als Verschieberegister beschrieben, ohne daß die Erfindung auf
deren Einsatz beschränkt wäre. Ebenso sind Matrizes der Größen 28 χ 30 und 8x8 dargestellt worden, und
als Submatrizes zur Formerkennung wurden 3x3 Bit-Bereiche
benutzt. Auch die Größe dieser Submatrizes sowie die der zur Verkleinerung genutzten Quadrate
kann ebenso wie die Anzahl der Zonen unterschiedlich gewählt werden, und schließlich läßt sich auch die
Zonenkennzeichnung abändern; es hat sich jedoch gezeigt, daß bei der dargelegten Kodierung mit
zweiundreißig Kombinationen entsprechend jeweils 5 Bits sich Unterscheidungen treffen lassen, welche es
gestatten, auch bei relativ unterschiedlichen Handschriften nicht nur Ziffern, sondern auch Buchstaben mit
hoher Identifizierungsquote identifizieren zu können, ohne daß es des hierzu üblichen hohen Aufwandes
bedarf.
Hierzu 8 Blatt Zeichnungen 809 585/3
Claims (2)
1. Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen, bei der ein
Schriftzeichen aufweisendes Bildfeld zeilenrasterartig abgetastet wird und das Abtastergebnis digitalisiert
und verdünnt sowie auf das Vorliegen vorbestimmter Formelemente untersucht wird, und
bei der die ermittelten Formelemente mit vorgezeichneten Standardmustern verglichen werden,
wobei bei ausreichender Übereinstimmung ein dem Schriftzeichen entsprechendes Ausgabezeichen bewirkt
wird, dadurch gekennzeichnet, daß die abgetastete Signalfolge in einer matrixartigen
Speichervorrichtung (13) gespeichert wird, der eine Zonenwahlvorrichtung (6) nachgeordnet ist, welche
jeweils mehrere nebeneinanderliegende Abtastzeilen aufweisende, sich mindestens um eine Abtastzeile
überlappende Zonen (16) aus der Speichervorrichtung (13) abruft und einem Detektorkreis (7, 70)
zuführt, welcher nacheinander sich über die jeweilige Zone (16) erstreckende und in Zeilenrichtung sich
über mehrere Bits erstreckende und gegeneinander um jeweils ein Bit versetzte Submatrizes (17) auf das
Vorliegen einfacher, jeweils Lage und Richtung einer Linie umfaßender Formelemente untersucht,
daß Vorrichtungen (9,10) die für die innerhalb einer Zone (16) angeordneten Submatrizes (17) anfallenden
Symbole zu komplexen Formelementen entsprechenden Kodezeichen zusammenfassen, daß zur
Untersuchung der Verbindung zwischen Forme'ementen von Submatrizes und denen der benachbarten
Submatrix der folgenden Zone einem die Symbole für einfache Formelemente aufweisenden
Register (800) eine Schlüsselstufe (801) nachgeordnet ist, welche die Symbole für keine Formelemente
aufweisende Submatrizes (17) mit »0« und die Symbole für Formelemente aufweisende Submatrizes
mit »1« bewertet, daß die sich ergebenden Binärziffern einer eine vorgegebene geringe Kapazität
aufweisenden Zählstufe (802) zugeführt werden, und daß vom Erreichen von dessen Kapazität
ab die Schlüsselsignale zwei in Serie betriebenen Schieberegistern (804,806) zugeführt werden, wobei
mittels einer Und-Stufe (807) die logische Summe des über eine Oder-Stufe (805) abgegriffenen
Speicherstandes der drei letzten Zellen des ersten Schieberegisters und des der vorletzten des zweiten
gebildet und als die Verbindung zweier aufeinanderfolgender Zonen kennzeichnende Zusatzmarkierung
gespeichert wird, und daß in einem Koinzidenzkreis die aus Kodezeichen und Zusatzmarkierungen
bestehenden Zonen-Kennzeichen zonenweise nacheinander mit den Standardmustern verglichen
werden.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Zonenwahlvorrichtung (6) jeweils
drei Abtastzeilen umfaßende Zonen auswählt und die Submatrizes (17) in Abtastzeilenrichtung eine
Länge von drei Bits aufweisen.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7151666 | 1966-10-31 | ||
JP7151766 | 1966-10-31 | ||
JP7161366 | 1966-10-31 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE1549930A1 DE1549930A1 (de) | 1971-05-13 |
DE1549930B2 DE1549930B2 (de) | 1979-02-01 |
DE1549930C3 true DE1549930C3 (de) | 1979-10-04 |
Family
ID=27300667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1549930A Expired DE1549930C3 (de) | 1966-10-31 | 1967-10-30 | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen |
Country Status (4)
Country | Link |
---|---|
US (1) | US3541511A (de) |
DE (1) | DE1549930C3 (de) |
FR (1) | FR1547790A (de) |
GB (1) | GB1180290A (de) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1944073C3 (de) * | 1969-08-29 | 1974-05-16 | Standard Elektrik Lorenz Ag, 7000 Stuttgart | Einrichtung zur maschinellen Zeichenerkennung |
FR2073822A5 (de) * | 1969-12-31 | 1971-10-01 | Ibm | |
NL7016536A (de) * | 1970-11-12 | 1972-05-16 | ||
US3766520A (en) * | 1971-11-10 | 1973-10-16 | Regonition Equipment Inc | Character reader with handprint capability |
JPS48102926A (de) * | 1972-04-07 | 1973-12-24 | ||
JPS604505B2 (ja) * | 1972-07-10 | 1985-02-04 | スキヤン − オプテイクス インコ−ポレ−テツド | マルチ・フオント光学式文字認識装置 |
US3889234A (en) * | 1972-10-06 | 1975-06-10 | Hitachi Ltd | Feature extractor of character and figure |
US3930231A (en) * | 1974-06-10 | 1975-12-30 | Xicon Data Entry Corp | Method and system for optical character recognition |
US3992697A (en) * | 1974-12-27 | 1976-11-16 | Scan-Data Corporation | Character recognition system utilizing feature extraction |
FR2301051A1 (fr) * | 1975-02-14 | 1976-09-10 | Anvar | Procede et dispositifs de reconnaissance de formes |
JPS5215235A (en) * | 1975-07-26 | 1977-02-04 | Fujitsu Ltd | Character recognition unit |
JPS5242028A (en) * | 1975-09-29 | 1977-04-01 | Fujitsu Ltd | Letter recognition system |
US4020463A (en) * | 1976-02-27 | 1977-04-26 | Recognition Equipment Incorporated | Apparatus and a method for storage and retrieval of image patterns |
US4048615A (en) * | 1976-06-04 | 1977-09-13 | Recognition Equipment Incorporated | Automated character recognition system |
GB1587613A (en) * | 1976-11-04 | 1981-04-08 | Norprint Ltd | Character identification |
DE2822458C2 (de) * | 1977-05-23 | 1983-11-03 | Sharp K.K., Osaka | Einrichtung zum Erkennen von Schriftzeichen |
US4124871A (en) * | 1977-08-31 | 1978-11-07 | International Business Machines Corporation | Image data resolution change apparatus and process utilizing boundary compression coding of objects |
US4162482A (en) * | 1977-12-07 | 1979-07-24 | Burroughs Corporation | Pre-processing and feature extraction system for character recognition |
JPS596421B2 (ja) * | 1978-08-28 | 1984-02-10 | 肇産業株式会社 | パタ−ン情報処理方法 |
JPS5915381B2 (ja) * | 1978-10-16 | 1984-04-09 | 日本電信電話株式会社 | パタ−ン検査法 |
US4679951A (en) * | 1979-11-06 | 1987-07-14 | Cornell Research Foundation, Inc. | Electronic keyboard system and method for reproducing selected symbolic language characters |
JPS56103773A (en) * | 1980-01-21 | 1981-08-19 | Agency Of Ind Science & Technol | Feature extracing system of binary pattern |
JPS605037B2 (ja) * | 1980-01-28 | 1985-02-07 | 株式会社東芝 | 図面読取装置 |
JPS57105088A (en) * | 1980-12-22 | 1982-06-30 | Toshiba Corp | Character reader |
JPS57178578A (en) * | 1981-04-27 | 1982-11-02 | Toshiba Corp | Pattern recognition system |
DE3236336A1 (de) * | 1982-09-30 | 1984-04-05 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur darstellung von druckvorlagen in form von groessen- und drehlagenunabhaengigen bogenstrukturen zum zwecke einer dokumentenanalyse, insbesondere zur schriftzeichenerkennung |
US4544276A (en) * | 1983-03-21 | 1985-10-01 | Cornell Research Foundation, Inc. | Method and apparatus for typing Japanese text using multiple systems |
US4628532A (en) * | 1983-07-14 | 1986-12-09 | Scan Optics, Inc. | Alphanumeric handprint recognition |
JPH0754549B2 (ja) * | 1984-09-19 | 1995-06-07 | 株式会社日立製作所 | パターンマッチング用標準パターンの作成方法 |
US4876728A (en) * | 1985-06-04 | 1989-10-24 | Adept Technology, Inc. | Vision system for distinguishing touching parts |
US4891750A (en) * | 1986-10-29 | 1990-01-02 | Pitney Bowes Inc. | Optical character recognition by forming and detecting matrices of geo features |
JP3014097B2 (ja) * | 1987-02-20 | 2000-02-28 | 株式会社日立製作所 | 輪郭追跡方法及びシステム |
JPH01183793A (ja) * | 1988-01-18 | 1989-07-21 | Toshiba Corp | 文字認識装置 |
US5574803A (en) * | 1991-08-02 | 1996-11-12 | Eastman Kodak Company | Character thinning using emergent behavior of populations of competitive locally independent processes |
ITUD20050203A1 (it) * | 2005-11-29 | 2007-05-30 | Isomorph S R L | Dispositivo e procedimento per il riconoscimento di un oggetto in un'immagine |
US20070230789A1 (en) * | 2006-04-03 | 2007-10-04 | Inventec Appliances Corp. | Method of controlling an electronic device by handwriting |
US10725650B2 (en) * | 2014-03-17 | 2020-07-28 | Kabushiki Kaisha Kawai Gakki Seisakusho | Handwritten music sign recognition device and program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL265383A (de) * | 1960-05-31 | |||
US3293604A (en) * | 1963-01-25 | 1966-12-20 | Rca Corp | Character recognition system utilizing asynchronous zoning of characters |
US3268864A (en) * | 1963-03-18 | 1966-08-23 | Apparatus for feature recognition of symbols |
-
1967
- 1967-10-26 GB GB48752/67A patent/GB1180290A/en not_active Expired
- 1967-10-26 US US678427A patent/US3541511A/en not_active Expired - Lifetime
- 1967-10-30 DE DE1549930A patent/DE1549930C3/de not_active Expired
- 1967-10-31 FR FR126611A patent/FR1547790A/fr not_active Expired
Also Published As
Publication number | Publication date |
---|---|
GB1180290A (en) | 1970-02-04 |
FR1547790A (fr) | 1968-11-29 |
US3541511A (en) | 1970-11-17 |
DE1549930B2 (de) | 1979-02-01 |
DE1549930A1 (de) | 1971-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE1549930C3 (de) | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen | |
DE3633743C2 (de) | ||
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE2431451C3 (de) | Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens | |
DE2509353A1 (de) | Verfahren und vorrichtung zur gewinnung einer einem muster entsprechenden information | |
DE2612971A1 (de) | Bildmuster-erkennungssystem | |
DE2247942A1 (de) | Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen | |
DE2703158A1 (de) | Einrichtung zum erkennen einer zeichenposition | |
DE1225426B (de) | Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Zeichen | |
DE2432129B2 (de) | Verfahren zum maschinellen lesen von zeichen und vorrichtung zur durchfuehrung des verfahrens | |
DE2540101A1 (de) | Automatisches zeichenerkennungs- system | |
DE2633513C2 (de) | Zeichenerkennungsvorrichtung | |
DE69421487T2 (de) | Verfahren zum Vergleichen von Mustern basierend auf der Verwendung von Bildelementmatritzen und Bildelementvektoren | |
DE2629590C2 (de) | Schaltungsanordnung zur Trennung benachbarter Muster in einer Zeichenerkennungseinrichtung | |
DE3854216T2 (de) | Bildverarbeitungsgerät und -verfahren. | |
DE2050788A1 (de) | Lichtgriffelschaltung fur ein Darstell gerat mit Speicherschirm | |
DE1264118B (de) | Einrichtung zum maschinellen Erkennen von Zeichen | |
DE1212758B (de) | Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Schriftzeichen | |
DE1138571B (de) | Zeichen-Erkennungsvorrichtung | |
DE2064469A1 (de) | Mustererkennungseinrichtung | |
DE953474C (de) | Verfahren zum lichtelektrischen Ablesen von Schriftzeichen | |
DE1205743B (de) | Verfahren und Vorrichtung zur maschinellen Zeichenerkennung | |
DE2029710A1 (de) | Anzeigevorrichtung für an diskreten Adressenplätzen eines Bildschirms erscheinende Zeichen | |
DE1090890B (de) | Verfahren und Anordnung zur automatischen Zeichenerkennung | |
DE1944073C3 (de) | Einrichtung zur maschinellen Zeichenerkennung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) |