-
GEBIET DER ERFINDUNG
-
Diese
Erfindung betrifft ein System und Verfahren zur elektronischen Prüfung der
Rechtschreibung eines elektronischen Dokumentes.
-
GRUNDLAGEN
-
Computer,
insbesondere Personal Computer, werden hauptsächlich zur "Textverarbeitung" verwendet. Textverarbeitungsprogramme
(word processors) haben die Schreibmaschine als hauptsächliches
Mittel zur Dokumentenerstellung ersetzt. Bei der Erstellung von
Dokumenten ist es normalerweise sehr wichtig, dass jedes Wort richtig
geschrieben wird. In Textverarbeitungsprogrammen wird oftmals ein
Rechtschreibprüfprogramm
verwendet, um die Rechtschreibung von Worten in einem Dokument zu überprüfen. Der
Benutzer ruft normalerweise ein Rechtschreibprüfprogramm (spell checker) auf,
indem er eine Rechtschreib-Hilfsprogrammoption (spelling tool option)
auswählt.
Ein Rechtschreibprüfprogramm
weist eine zugeordnete Wörterbuchdatei (dictionary
file) auf, die eine Liste von richtig geschriebenen Wörtern enthält. Um die
Rechtschreibung eines Wortes im Dokument zu überprüfen, sucht das Rechtschreibprüfprogramm
nach diesem Wort. Falls das Wort im Wörterbuch vorhanden ist, ist das
Wort richtig geschrieben. Andernfalls ist das Wort falsch geschrieben.
Das Rechtschreibprüfprogramm
meldet dem Benutzer normalerweise falsch geschriebene Wörter und
fordert zur korrekten Schreibweise auf. Das Rechtschreibhilfsprogramm (spelling tool)
kann den Benutzer bei jedem möglicherweise
falsch geschriebenen Wort auffordern, das Wort zu ersetzen, zu ignorieren
oder zu bearbeiten. Diese Aufforderung beinhaltet oftmals die Darstellung
einer wählbaren
Liste von ähnlich
buchstabierten Wörtern,
aus der der Benutzer wählen
kann. Wenn der Benutzer das gewünschte
Wort auswählt, ersetzt
das Rechtschreibprüfprogramm
das falsch geschriebene Wort durch das richtig geschriebene Wort.
-
Eine
Rechtschreibprüfung
wird außerdem auf
verschiedenen Internet-Web-Seiten bereitgestellt, beispielsweise
auf der bekannten Web-Site von Alta Vista bei www.altavista.com,
die alternative Schreibweisen für
falsch geschriebene Worte bereitstellt, wenn Benutzer Wörter eingeben,
um Informationen im World-Wide Web zu suchen. Ein System und Verfahren
für ein
verbessertes Rechtschreibprüfprogramm
ist daher hilfreich bei der Textverarbeitung in jedem Bereich, in
dem Text getippt wird, beispielsweise in Computern oder in Web-Suchmaschinen
(web search engines). Die Verwendung eines verbesserten Rechtschreibprüfprogramms
ist nicht auf Dokumente begrenzt, die durch Tippen auf einer Tastatur erzeugt
werden, sondern kann auch auf Text angewandt werden, der durch Spracheingabe
oder handschriftliche Eingabe erzeugt wurde.
-
Eine
Rechtschreibprüfung
gemäß dem gegenwärtigen Prozess
ist nicht leistungsfähig,
da die wählbare
Liste von ähnlich
buchstabierten Wörtern möglicherweise
nicht tatsächlich
das Wort enthält, das
der Benutzer zu buchstabieren versuchte. Falls die Liste das Wort
enthält,
ist es oftmals mühsam, das
richtige Wort in einer Liste zu finden, die viele alternative Schreibweisen
enthält.
Obwohl die gegenwärtige
Rechtschreibprüfung
eine hilfreiche Funktion ist, ist sie daher bezüglich der erforderlichen Benutzerinteraktion
nicht leistungsfähig.
-
Beispiele
für Rechtschreibprüfprogramme, die
Datenbanken von ähnlich
buchstabierten Wörtern verwenden,
werden in der am 23. Februar 1999 von Nielsen veröffentlichten
US-Patentschrift 5 875 443
A erläutert.
Dieses Patent erläutert
die Verwendung von im Internet verfügbaren fernen Datenbanken und ist
in seiner Gesamtheit durch Bezugnahme hierin aufgenommen. Beispiele
für eine "Hintergrund"-Rechtschreibprüfung werden
in der am 28. Juli 1998 von Mogilevsky veröffentlichten
US-Patentschrift 5 787 451 A erläutert, die
in ihrer Gesamtheit durch Bezugnahme hierin aufgenommen ist. "Hintergrund"-Rechtschreibprüfung bezieht
sich auf eine Rechtschreibprüfung,
die während
Leerlaufperioden des Textverarbeitungsprogramms ausgeführt wird. Das
Rechtschreibprüfprogramm
führt eine "Hintergrund"-Rechtschreibprüfung aus, so dass Rechtschreibfehler
während
einer Bearbeitungssitzung im Dokument entsprechend hervorgehoben
werden können.
-
Es
ist daher Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren
und System zur elektronischen Prüfung
der Rechtschreibung eines elektronischen Dokumentes bereitzustellen.
-
Diese
Aufgabe wird durch das Verfahren nach einem der Ansprüche 1 bis
4 und das System nach Anspruch 5 und dem Datenträger nach Anspruch 6 gelöst.
-
Um
die Probleme und Nachteile vorhandener Rechtschreibprüfprogramme
anzugehen, stellt diese Erfindung ein Verfahren zum Darstellen einer wählbaren
Liste von ähnlich
buchstabierten Wörtern bereit,
wenn ein falsch geschriebenes Wort vom Benutzer ausgewählt wird,
der die korrekte Schreibweise herausfinden möchte. Hierbei prüft das Rechtschreibprogramm
für jeden
Buchstaben im Wort "nahe
beieinander liegende" Buchstaben
auf Tastaturtasten, um die Liste von Ersatzwörtern des Rechtschreibprüfprogramms
zu verbessern. Das System überwacht
außerdem
das Verwendungsprotokoll (history of use) eines Benutzers bezüglich nahe
beieinander liegenden Ersetzungen oder Tasten-(d. h. Buchstaben-)Ersetzungen
und geht bei der Darstellung von Listen von alternativen Wörtern von
diesen Informationen aus. Ein Benutzer kann diese Informationen
manuell ergänzen.
Das verbesserte Rechtschreibprüfprogramm
korrigiert außerdem
die Rechtschreibung, indem es ein Benutzerprotokoll von Rechtschreibprüfkorrekturen überwacht.
Datenverbundtabellen (aggregate tables) von Korrekturen für mehr als
einen Benutzer können
von Rechtschreibprüfprogrammen
verwaltet, gemeinsam genutzt und bereitgestellt werden.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
Die
Erfindung wird besser mit Bezugnahme auf die folgende ausführliche
Beschreibung verstanden, wenn sie in Verbindung mit den begleitenden Zeichnungen
gelesen wird, in denen:
-
1 eine
bildliche Darstellung eines Beispielcomputersystems zeigt, das die
vorliegende Erfindung ausführt.
-
2 zeigt
eine bildliche Darstellung eines Fensters eines Textverarbeitungsprogramms,
das mit einem Rechtschreibprüfprogramm
ausgestattet ist.
-
3 ist
ein Flussdiagramm, das die Schritte darstellt, die vom verbesserten
Rechtschreibprüfprogramm
in dem in 1 gezeigten Computersystem ausgeführt werden.
-
4 ist
ein Flussdiagramm, das darstellt, wie für die Schritte 310, 330 und 340 räumlich eine Priorität vergeben
werden kann.
-
AUSFÜHRLICHE BESCHREIBUNG
-
Mit
Bezugnahme auf die Figuren und insbesondere auf 1 wird
nun ein Computersystem 12 gemäß dem Verfahren und System
der vorliegenden Erfindung dargestellt. Das Computersystem 12 enthält einen
Computer 36, eine Computeranzeige 38, eine Tastatur 40 und
mehrere Eingabezeigereinheiten (input pointing devices) 42.
Fachleute werden verstehen, dass die Eingabezeigereinheiten 42 unter Verwendung
eines Zeigestabes 44, einer Maus 46, einer Rollkugel 48,
eines Stiftes 50, eines Bildschirms 52 (z. B.
eines berührungsempfindlichen
Bildschirms 52) oder irgendeiner anderen Einheit realisiert
werden können,
die es einem Benutzer ermöglicht,
Objekte, Symbole und andere Anzeigeelemente auf eine grafische Weise
auf der Computeranzeige 38 zu bearbeiten. Mit dem Computersystem 12 können außerdem Lautsprecher 54 und/oder
Toneingabeeinheiten (audio input devices) 51 verbunden
sein. (Siehe beispielsweise VoiceType-Diktiersystem von IBM. "VoiceType" ist ein Warenzeichen
der IBM Corporation.)
-
Auf
dem Bildschirm 52 kann eine grafische Benutzerschnittstelle 53 angezeigt
werden und unter Verwendung irgendeiner Eingabezeigereinheit 42 bearbeitet
werden. Die grafische Benutzerschnittstelle 53 kann die
Anzeige einer Textverarbeitungsanwendung 60 enthalten,
die Texte in einem Dokument 62 unter Verwendung irgendeines
bekannten Textverarbeitungsprogramms 90 mit einer Rechtschreibprüffunktion 93 anzeigt,
die die Rechtschreibung von Wörtern
in einem Dokument überprüft. Das
Dokument kann grafische Informationen, akustische Informationen
oder Textinformationen 67 enthalten, die dem Benutzer über den
Bildschirm 52, Lautsprecher 54 oder andere Ausgabeeinheiten
dargeboten werden. Die Informationsseiten können wählbare Verbindungen 66 enthalten,
beispielsweise im World-Wide Web verwendete Hypertextverbindungen
zu anderen Informationsseiten 62, wobei solche Verbindungen durch
eine der Eingabeeinheiten 42 aktiviert werden können, um
die zugeordneten Informationsseiten anzufordern. Diese Hardware
ist nach dem Stand der Technik gut bekannt und wird auch in Verbindung
mit Fernsehen ("Web-TV") und Multimedia-Unterhaltungszentren
verwendet. Das Computersystem 12 enthält einen oder mehrere Speicher 65,
in denen die Erfindung Speicherplatz eines Cachespeichers 80 reserviert.
Ein Server 130, der über
ein Netz 110 mit dem Computersystem 12 verbunden
ist, kann Seiten von Multimediainformationen zum Cachespeicher 80 senden.
Das Netz 110 kann irgendein bekanntes lokales Netz (LAN)
oder Weitverkehrsnetz (WAN) sein, z. B. das Internet.
-
Mit
Bezugnahme auf 1A wird nun ein Blockschaltbild
der Architektur des Computersystems 12 gemäß der vorliegenden
Erfindung dargestellt. Die Kernarchitektur (core architecture) enthält eine
Zentraleinheit 165, eine Speichersteuereinheit 162,
einen Systemspeicher 65, einen Plattenspeicher 70 und
eine Plattenspeichersteuereinheit 75. Ein Teil des Systemspeichers 65 wird
für den
Informationsseiten-Cachespeicher 80 genutzt.
Außerdem kann
ein Dateispeicherplatz 85 in der Plattenspeichereinheit 70 als
zusätzlicher
Dokumentseiten-Cachespeicher genutzt werden. Im Allgemeinen ist
ein Cachespeicher ein Ort, wo Daten (Dateien, Bilder und andere
Informationen) gespeichert werden können, um zu verhindern, dass
die Daten aus einer langsameren Einheit gelesen werden müssen, beispielsweise
aus einer fernen mit dem Netz verbundenen Computerplatte. Ein Plattencachespeicher
kann beispielsweise Informationen speichern, die ohne Zugriff auf einen
fernen Plattenspeicher gelesen werden können.
-
Mit
Bezugnahme auf 2 wird nun ein Bildschirm 52 mit
einer Anzeige einer Textverarbeitungsanwendung 60 gezeigt.
Falsch geschriebene Wörter, beispielsweise
das falsch geschriebene Wort "cimputee" 210 werden
oftmals durch das Rechtschreibprüfprogramm 93 eines
Textverarbeitungsprogramms 90 (siehe 1)
hervorgehoben 215, oder der Benutzer wird auf andere Weise
darauf aufmerksam gemacht. Wenn der Benutzer das Wort 210 auswählt, wird
dem Benutzer eine Liste von alternativen ähnlichen Schreibweisen präsentiert,
aus der der Benutzer die korrekte Schreibweise des im Dokument vorgesehenen
Wortes wählen
kann. Das erste korrekt buchstabierte alternative Wort 225 ist
beispielsweise "compute".
-
3 umfasst
ein Flussdiagramm für
einen bevorzugten Rechtschreibprüfprozess 300,
der vom Textverarbeitungsprogramm 90 und vom Rechtschreibprüfprogramm 93 realisiert
wird. Im Schritt 310 ermittelt das Rechtschreibprüfprogramm
den "Inhalt" oder das "Thema" eines Dokumentes.
Dies kann erreicht werden, indem die Wörter im Titel des Dokuments,
in den Hauptüberschriften
und im Text überprüft werden,
indem gezählt
wird, wie oft das Wort verwendet wurde. Das Rechtschreibprüfprogramm 93 kann
beispielsweise ermitteln, dass das Wort "divination" im Titel des Dokuments vorkommt. Außerdem kommt
das Wort eventuell 20 Mal im Text vor. Dies deutet daraufhin, das "divination" wahrscheinlich ein
wichtiges Wort ist, das sich auf den "Inhalt" des Dokuments bezieht. Falls ein Benutzer "devination" manchmal falsch
als "duvonation" schreibt, muss das
Rechtschreibprüfprogramm 93 zuerst
das Wort "divination" als möglicherweise
richtig geschriebenes Wort 225 präsentieren (in der Liste 220 von 2),
bevor eine andere mögliche
Wahl für
Wörter präsentiert
wird, wie "deviation".
-
Falls
das Rechtschreibprüfprogramm 93 im Schritt 310 feststellt,
dass "divination" der Inhalt des Dokumentes
ist und für
das Dokument wichtig ist, verwendet es außerdem eine latente semantische
Indizierung (latent semantic indexing), synonyme Listen und Thesauren 92 (in 1 gezeigt)
und/oder verwandte Verfahren, um festzustellen, ob wahrscheinlich
verwandte Wörter,
beispielsweise "fortune-telling", mit einiger Wahrscheinlichkeit
im Dokument vorkommen können,
und gibt diese wahrscheinlich verwandten Wörter in der Liste 220 von
alternativen Wörtern
zuerst an. Das falsch geschriebene Wort "fotune-telling" ist wahrscheinlich "fortune-telling", da "fortune-telling" ein mit "divination" verwandtes Wort ist, was das Thema
des Dokumentes ist oder für
den Inhalt des Dokumentes von Bedeutung ist. Die latente semantische
Indizierung ist ein Fachleuten gut bekanntes Verfahren, um den Inhalt
von Dokumenten festzustellen. Die Reihenfolge der Liste 220 von
richtig geschriebenen Wörtern
entspricht der Wahrscheinlichkeit, mit der das Wort mit dem Thema
des Dokumentes verwandt ist. Falls beispielsweise "rodent" zwanzigmal im Dokument
vorkommt und "computer" zehnmal und das
Wort "shrew" (ein Art von Nagetier)
als "shriw" falsch geschrieben
wird, erscheint das Ersatzwort "shrew" in der Liste 220 vor "screw", da "shrew" eher mit Nagetieren
verwandt ist als mit Computern. Falls ein Wort in einer Überschrift
oder in einem Titel oder in einer expliziten Liste von Schlüsselwörtern vorkommt,
die entweder im Dokument vorhanden sind oder vom Benutzer manuell
eingegeben wurden, betreffen diese Wörter mit hoher Wahrscheinlichkeit
den Inhalt eines Dokumentes. Die latente semantische Indizierung kann
verwendet werden, um die Bedeutung durch bekannte Verfahren festzustellen,
und kann daher ebenfalls verwendet werden, um die Liste 220 von
alternativen Wörtern
so zu ordnen, dass sich die wichtigsten Wörter am Anfang befinden.
-
Im
Schritt 330 führt
der Rechtschreibprüfprozess 300 zur
Verbesserung des Rechtschreibprogramms außerdem eine Prüfung auf "nahe beieinander
liegende" Tasten
auf der Tastatur aus. Diese Liste von Tasten und ihren Positionen
wird in einer Datei 91 gespeichert. Die Datei kann beispielsweise
Datensätze
mit den Tastennamen (z. B. "Q", "W", "E", usw.) und (x, y)-Positionen der Taste
enthalten. Die Prüfung
im Schritt 330 beinhaltet eine Berechnung einer Abstandsfunktion
(distance function) oder der Nähe
auf der Grundlage des Abstandes von einer Taste zur einer anderen.
Die Taste V auf einer typischen US-Tastatur befindet sich beispielsweise
neben der Taste C. Der Abstand von V zu C kann mit DV-C bezeichnet
werden. Die Taste G ist weiter von der Taste C entfernt als die
Taste V. Der Abstand von G zu C kann mit DG-C bezeichnet
werden. Es ist zu beachten, dass DG-C > DV-C.
Der Abstand kann unter Verwendung von bekannten Abstandsformeln
aus der Geometrie berechnet werden. Diese Abstandsinformationen
können
verwendet werden, um wahrscheinliche Kandidaten zu ermitteln, die
in der Liste 220 von ähnlich
buchstabierten Wörtern
enthalten sind. Das Wort "loce" ist wahrscheinlich "love", da die Taste "V" in der Nähe der Taste "C" ist (z. B. benachbart). Der Schritt 320 berücksichtigt
diese möglichen Buchstabenersetzungen
und präsentiert
eine Liste von gültigen
Wörtern
mit diesen wahrscheinlichen Ersetzungen. Kandidaten mit einer höheren Wahrscheinlichkeit
werden auf der Grundlage des Abstandes D vor weniger wahrscheinlichen
Kandidaten aufgelistet. Ein geringerer Abstand ist mit einem wahrscheinlicheren
Ersatzzeichen verbunden als ein größerer Abstand. Es ist zu beachten,
dass eine solche Lösung
bei verschiedenen Arten von Tastaturen hilfreich wäre, beispielsweise
bei chinesischen Tastaturen mit über
100 Tasten.
-
Der
Schritt 340 überwacht
das Verwendungsprotokoll eines Benutzers bezüglich Buchstabenersetzungen
und berücksichtigt
diese Informationen bei der Darstellung von Listen von alternativen Wörtern im
Schritt 320. Falls der Benutzer beispielsweise häufig "v" anstelle des nahegelegenen korrekten "c" tippt, wird dies berücksichtigt,
wenn eine wahrscheinliche Liste von korrekten Wörtern zum Ersetzen des falsch
geschriebenen Wortes ermittelt wird. Informationen, die Listen von
vergangenen Tastenersetzungen enthalten, können in einer Datenbank 94 (in 1 gezeigt)
oder in einem fernen Computer gespeichert werden, beispielsweise
dem Server 130. Jeder Datensatz in der Datenbank kann einen
Buchstaben und seinen wahrscheinlich falsch getippten Buchstaben
enthalten. Außerdem
kann ein Benutzer Informationen zu wahrscheinlichen Tastenersetzungen
manuell ergänzen.
Falls ein Benutzer beispielsweise weiß, dass er häufig "v" anstelle von "c" tippt,
kann er das System darüber
informieren, so dass es diese Information bei der Darstellung einer Liste
von korrekten Wörtern
(Schritt 320) zum Ersetzen des falsch geschriebenen Wortes
berücksichtigen
kann. Der Schritt 340 zeigt außerdem das Verwendungsprotokoll
eines Benutzers bezüglich
des "Vertauschens" ("swaps") von Buchstaben
an und berücksichtigt
diese Informationen bei der Darstellung von Listen von alternativen
Worten im Schritt 320. Der Begriff "Vertauschen" von Buchstaben bezieht sich auf das
Verwenden von zwei Buchstaben in der falschen Reihenfolge. Beispielsweise
vertauscht ein Benutzer möglicherweise
häufig
die Buchstaben "i" und "s", so dass er "si" tippt,
wenn er "is" meint, oder er kann "is" tippen, wenn er "si" meint. Das System
kann dieses Vertauschen automatisch protokollieren, oder ein Benutzer
kann das System manuell informieren, dass diese Vertauschvorgänge wahrscheinlich
auftreten. Der Schritt 320 überwacht außerdem das Verwendungsprotokoll
eines Benutzers von Wortkorrekturen und verwaltet eine Liste von wahrscheinlichen
Ersetzungen, die automatisch von einem früheren Tipp-Protokoll eines
Benutzers abgeleitet wird. Falls beispielsweise "dive" falsch "duve" geschrieben wird,
nimmt der Prozess 300 zur Kenntnis, dass ein falsches Tippen
von u statt i und das falsche Tippen von "duve" statt "dive" stattfanden, und verwendet
diese Informationen künftig,
wenn der Schritt 320 eine Liste von korrekten Wörtern zum
Ersetzen des falsch geschriebenen Wortes darstellt. Im Beispiel
des falschen Tippens von "duve" statt "dive" wird ein Benutzerprotokoll
von Rechtschreibprüfkorrekturen
angezeigt. In gewissem Sinne lernt das Programm die Muster von Rechtschreibfehlern
eines Benutzers, indem es die Anzahl und die Art von früheren ausgewählten Korrekturen
für Wörter überwacht,
die von einem Benutzer auf Rechtschreibfehler geprüft wurden.
Diese Informationen können
in einer Korrekturtabelle 96 (in 1 gezeigt)
gespeichert werden. Ein weiteres Beispiel ist, dass ein Benutzer
häufig "behavior" falsch als "behavoir" schreibt und diese Korrektur
in früheren
Verwendungen über
das Rechtschreibprüfprogramm
ausführt.
Der Schritt 320 verwaltet die Tabelle 96 mit Datensätzen, beispielsweise "behavior – behavoir", um Listen 220 von
alternativen richtig geschriebenen Wörtern leistungsfähig zu präsentieren.
-
Die
verschiedenen Korrekturtabellen können die persönlichen
Vorlieben eines Benutzers, ein Protokoll und so weiter widerspiegeln,
oder sie können Tabellen
von Korrekturen zusammenfassen, die mehr als einen Benutzer widerspiegeln.
Die Tabellen können
von Rechtschreibprüfprogrammen
verwaltet, über
Netze gemeinsam genutzt und bereitgestellt werden.
-
Die
zuvor erwähnten
Verfahren zur Verbesserung der Rechtschreibprüfung können alleine verwendet oder
als eine Folge von Prüfungen
sequenziell ausgeführt
werden. Es können
verschiedene Prioritäten
verwendet werden, so dass ein Lösungsweg vor
einem anderen bevorzugt wird. Falls beispielsweise ein Verfahren
mit einer höheren
Priorität
(z. B. das Dokumenteninhalt-Verfahren im Schritt 310) eine Liste
von drei Alternativen liefert und ein Verfahren mit einer geringeren
Priorität
(z. B. das Tastenabstand-Verfahren im Schritt 330) eine
Alternative liefert, werden die Alternativen mit höherer Priorität vor den
Alternativen mit geringerer Priorität aufgelistet. Die Prioritäten können durch
manuelle Eingabe eines Benutzers festgelegt oder von der Systemsoftware automatisch
bereitgestellt werden.
-
Mit
Bezugnahme auf die 2 und 3 kann der
Schritt 350 außerdem
ein zusätzliches Fenster 230 bereitstellen.
Der Schritt 355 stellt die am häufigsten falsch geschriebenen
Wörter
eines Benutzers in einem zusätzlichen
Fenster 230 bereit. Der Schritt 357 stellt die
kürzlich
falsch geschriebenen Wörter
eines Benutzers im zusätzlichen
Fenster 230 bereit. Diese Informationen können in
einer Datenbank gespeichert werden, um im zusätzlichen Fenster 230 angezeigt
zu werden, wenn das Textverarbeitungsprogramm 90 aufgerufen
wird. Der Benutzer kann die Maus 46 verwenden, um Wörter von
Interesse aus dem zusätzlichen
Fenster 230 in das aktuelle Dokument 62 zu kopieren
und einzufügen,
wobei die in vielen Betriebssystemen bereitgestellte "Zwischenablage" verwendet wird.
In einer Fensterumgebung, wie Microsoft Windows 95 oder Macintosh
Finder, ist ein Zwischenspeicherbereich im Speicher ("der Zwischenablagespeicher") vorhanden, in den
Material aus einem Dokument ausgeschnitten oder kopiert wird. Das
Material wird gespeichert, bis es der Benutzer an anderer Stelle
einfügt.
Der Rechtschreibprüfprozess 300 stellt
beispielsweise fest, dass ein Benutzer häufig die Wörter "behavior" und "dive" falsch
schreibt. Diese Wörter
werden im zusätzlichen
Fenster 230 aufgelistet. Der Benutzer kann die Wörter bei
Bedarf kopieren und einfügen oder
ziehen und ablegen. Das Sehen der richtigen Wörter auf dem Bildschirm kann
außerdem
einen erzieherischen Wert haben, wodurch die korrekte Schreibweise
für jedes
Wort im Gedächtnis
des Benutzers eingeprägt
wird. Der Problembereich des Wortes, beispielsweise die am häufigsten
falsch ersetzen Buchstaben, kann hervorgehoben werden 235.
Dies kann ebenfalls einen erzieherischen Wert haben. Das Hervorheben 235 wird
durch den Schritt 260 ausgeführt. Auf Wunsch kann die Hervorhebung 235 auch
im Hauptfenster erfolgen, in dem sich das Wort befindet. Ein Buchstabe
in einem Wort kann beispielsweise eine Farbe 236 ändern, um
anzuzeigen, dass er falsch ist.
-
4 ist
ein Flussdiagramm, das einen Prioritätsvergabeprozess (prioritizing
process) 400 darstellt, durch den das Rechtschreibprüfprogramm 93 eine
Priorität
für das
Sammeln von Informationen im Rechtschreibprüfprozess 300 vergeben
kann. Wenn das Rechtschreibprüfprogramm 93 den
Inhalt (Schritt 310) und das Protokoll eines Benutzers
(Schritt 330) prüft,
kann es Prioritäten
so vergeben, dass Informationen bezüglich auf dem Bildschirm sichtbaren
Wörtern "räumlich" bevorzugt werden, anschließend Wörter im
aktuellen Dokumentteil (z. B. Kapitel), anschließend Wörter im Dokument, anschließend Wörter in
anderen offenen Dokumenten, anschließend Wörter für alle Dokumente, die der Benutzer
bearbeitet hat. Auf diese Weise können Informationen gesammelt
werden, die für
den Bedarf eines Benutzers von großer Bedeutung sind. Insbesondere
ermittelt der Schritt 410 den Inhalt und Buchstabenersetzungen
für den
Text desselben Satzes, der das falsch geschriebene Wort enthält. Der
Schritt 415 ermittelt den Inhalt und Buchstabenersetzungen
für den
Text desselben Absatzes, der das falsch geschriebene Wort enthält. Der
Schritt 420 ermittelt den Inhalt und Buchstabenersetzungen
für den
Text, der auf dem Bildschirm sichtbar ist. Der Schritt 425 ermittelt
den Inhalt und Buchstabenersetzungen für den Text desselben Dokumentteils,
der das falsch geschriebene Wort enthält. Ein Dokumentteil kann sich
auf Text zwischen Hauptüberschriften
beziehen, beispielsweise Text in einem Kapitel, in dem sich das
falsch geschriebene Wort befindet. Der Schritt 430 ermittelt den
Inhalt und Buchstabenersetzungen für das restliche Dokument. Der
Schritt 435 ermittelt den Inhalt und Buchstabenersetzungen
für alle
offenen Dokumente. Der Schritt 440 ermittelt den Inhalt
und Buchstabenersetzungen für
alle Dokumente, auf die der Benutzer kürzlich zugegriffen hat. Der
Begriff "kürzlich" kann sich beispielsweise
auf Dokumente beziehen, die während
der vorhergehenden N Stunden offen waren. Der Wert von N kann vom
Benutzer gesetzt werden. Der Schritt 445 ermittelt den
Inhalt und Buchstabenersetzungen für die Dokumente, auf die ein
Benutzer am häufigsten
zugegriffen hat. Der Begriff "am
häufigsten" bezieht sich beispielsweise
auf Dokumente, auf die öfter
als M-mal zugegriffen wurde. Der Wert von M kann vom Benutzer gesetzt
werden. Der Schritt 450 ermittelt den Inhalt und Buchstabenersetzungen
für alle
Dokumente, auf die alle Benutzer kürzlich zugegriffen haben. Das
Rechtschreibprüfprogramm 93 kann
Zugang zu Dokumenten haben, die von anderen Benutzern über das
Internet erstellt wurden oder in einem zugänglichen Verwahrungsort (repository)
von Dokumenten gespeichert wurden. Der Schritt 455 ermittelt
den Inhalt und Buchstabenersetzungen für die Dokumente, auf die verschiedene
Benutzer am häufigsten
zugegriffen haben. Der Schritt 460 ermittelt den Inhalt
und Buchstabenersetzungen für
alle verfügbaren
Dokumente. Diese Informationen können
in Datenbanken gespeichert werden. Diese zusätzlichen Informationen können auf
viele Arten verwendet werden. Falls der Inhalt des Dokumentes für den auf
dem Bildschirm sichtbaren Text beispielsweise "Flut" ist
(wie im Schritt 420 geprüft wurde) und der Inhalt des
gesamten Dokumentes "Bibel" ist (wie im Schritt 430 geprüft wurde),
werden entsprechende Wörter,
die in der Liste 220 präsentiert
werden, so geordnet, dass korrekt geschriebene Wörter bezüglich "Flut" möglicherweise
vor den Wörtern
bezüglich "Bibel" erscheinen.
-
Obwohl
Beispiele bezüglich
einer Tastatureingabe angegeben wurden, ist zu beachten, dass die
hier dargestellten Verfahren auf Systeme mit Spracheingabe und Handschrifterkennung
angewandt werden können.
Daher können
das System und Verfahren auch zur Verbesserung von Handschrift-
und Spracherkennung verwendet werden. Ein Benutzer spricht beispielsweise
das Wort "proof" in das Mikrofon 51.
Ein Spracherkennungssystem 98 weiß möglicherweise nicht, welches
von mehreren Wörtern
wie "proof", "prude" oder "prune" der Benutzer ausgesprochen
hat. Durch das Erkennen des Inhaltes des erstellten Dokumentes (Schritt 310)
oder das Überwachen
des Protokolls eines Benutzers (Schritt 340) kann dem Benutzer
jedoch eine sachdienlichere Liste und Reihenfolge von alternativen Wörtern dargestellt
werden, aus denen er wählen kann.
-
Dieses
intelligente Rechtschreibprüfprogramm 93 kann
sich in einem lokalen oder fernen Computer, einem Personal Digital
Assistant, einer Telefonzelle (kiosk), einem Decoder (set-top box),
einem Fernsehgerät,
einer Kamera oder einer anderen Einheit befinden. Dieses Rechtschreibprüfprogramm ist
in jeder Textverarbeitungssituation hilfreich, in der ein Benutzer
Text eingibt, beispielsweise beim Ausfüllen von Online-Formularen
und beim Tippen von URLs oder Suchbegriffen in Web-Browsern.
-
Bei
der Beschreibung der vorliegenden Erfindung mit besonderer Bezugnahme
auf die bevorzugten Formen davon ist es offensichtlich, dass verschiedene Änderungen
daran vorgenommen werden können,
ohne von der Wesensart und vom Umfang der vorliegenden Erfindung
abzuweichen, wie sie in den angehängten Ansprüchen definiert wird.