Nothing Special   »   [go: up one dir, main page]

DE102008021954A1 - Method for operating an electronic assistance system - Google Patents

Method for operating an electronic assistance system Download PDF

Info

Publication number
DE102008021954A1
DE102008021954A1 DE102008021954A DE102008021954A DE102008021954A1 DE 102008021954 A1 DE102008021954 A1 DE 102008021954A1 DE 102008021954 A DE102008021954 A DE 102008021954A DE 102008021954 A DE102008021954 A DE 102008021954A DE 102008021954 A1 DE102008021954 A1 DE 102008021954A1
Authority
DE
Germany
Prior art keywords
phoneme
data
records
context
processing stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102008021954A
Other languages
German (de)
Inventor
Mathias Mühlfelder
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Garmin Wurzburg GmbH
Original Assignee
Navigon AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navigon AG filed Critical Navigon AG
Priority to DE102008021954A priority Critical patent/DE102008021954A1/en
Priority to PCT/DE2009/000156 priority patent/WO2009106031A1/en
Publication of DE102008021954A1 publication Critical patent/DE102008021954A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Betrieb eines elektronischen Assistenzsystems mit einer akustischen Aufnahmeeinrichtung, an der gesprochene Bedieneranweisungen aufgenommen werden können und mit einem Spracherkennungsmodul weiterverarbeitet werden, wobei in einer ersten Verarbeitungsstufe des Spracherkennungsmoduls die gesprochenen Bedieneranweisungen mit in einer Datenbank gespeicherten Phonem-Datensätzen verglichen werden, und wobei die Phonem-Datensätze entsprechend ihrer jeweiligen akustischen Übereinstimmungsrate mit einem Übereinstimmungswert bewertet werden, wobei in einer zweiten Verarbeitungsstufe des Spracherkennungsmoduls zumindest für einen Teil der Phonem-Datensätze die Inhalte der Phonem-Datensätze mit den in zumindest einer Kontextdatenbank gespeicherten Kontextdaten verglichen werden, wobei der in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert der Phonem-Datensätze in Abhängigkeit vom Ergebnis des inhaltlichen Kontextvergleichs modifiziert wird, und wobei zumindest der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert zur Weiterverarbeitung weitergegeben wird.The invention relates to a method for operating an electronic assistance system with an acoustic recording device, in which spoken operator instructions can be recorded and further processed with a voice recognition module, wherein in a first processing stage of the voice recognition module the spoken operator statements are compared with phoneme data records stored in a database, and wherein the phoneme data sets are evaluated according to their respective acoustic match rate with a match score, wherein in a second processing stage of the speech recognition module at least for a portion of the phoneme records the contents of the phoneme records are compared to the context data stored in at least one context database, wherein the match value of the phoneme data records determined in the first processing stage, depending on the result of the content context comparison and at least the phoneme record having the best modified match score is passed on for further processing.

Description

Die Erfindung betrifft ein Verfahren zum Betrieb eines elektronischen Assistenzsystems mit Spracherkennungsmodul nach dem Oberbegriff des Anspruchs 1.The The invention relates to a method for operating an electronic Assistance system with speech recognition module according to the generic term of claim 1.

Zur Eingabe von Eingabedaten an elektronischen Assistenzsystemen werden üblicherweise Tastaturen benutzt, an denen der Benutzer die Eingabedaten in alphanumerischer Form eingibt. Seit einigen Jahren finden auch Assistenzsysteme mit Spracherkennungsmodulen immer breitere Verwendung. Bei diesen Assistenzsystemen mit Spracherkennungsmodul ist die Eingabeschnittstelle mit einer Spracherkennung ausgestattet. Dies bedeutet, dass der Benutzer seine Bedieneranweisungen, d. h. seine Eingabedaten ganz allgemein, in eine Aufnahmeeinrichtung, beispielsweise ein Mikrofon des Assistenzsystems, hineinspricht, und diese Bedieneranweisung dort aufgenommen wird. Im Spracherkennungsmodul werden die gesprochenen Bedieneranweisungen dann weiterverarbeitet und interpretiert, um den Inhalt der gesprochenen Bedieneranweisung zu erkennen und in elektronischer Form weiterverarbeiten zu können. Die bekannten Spracherkennungsmodule von elektro nischen Assistenzsystemen beschränken sich gemäß dem vorbekannten Stand der Technik darauf, in einer ersten Verarbeitungsstufe die gesprochene und mit der Aufnahmeeinrichtung aufgenommene Bedieneranweisung mit in einer Datenbank gespeicherten Phonem-Datensätzen zu vergleichen. Bei den Phonem-Datensätzen kann es sich beispielsweise um Akustikdateien, insbesondere WAV-Dateien oder Phonem-Vektoren, handeln.to Input data to electronic assistance systems are typically keyboards used, where the user input data in alphanumeric Form enters. Assistance systems have also been included for some years Speech recognition modules are becoming more widely used. In these assistance systems with speech recognition module is the input interface with a speech recognition fitted. This means that the user has his user instructions, d. H. his input data in general, into a recording device, For example, a microphone of the assistance system, speaks in, and this operator's instruction is recorded there. In the speech recognition module the spoken operator statements are then further processed and interprets the contents of the spoken operator's statement recognize and process it in electronic form. The known speech recognition modules of electronic assistance systems are limited according to the prior art The prior art, in a first processing stage the spoken and recorded with the receiving device operator instruction with phoneme records stored in a database to compare. For example, the phoneme records may be acoustic files, in particular WAV files or phoneme vectors, act.

In jedem Phonem-Datensatz ist dabei zugleich auch noch ein bestimmter Inhalt in elektronischer Form gespeichert. Bei ausreichender Übereinstimmung zwischen der aufgenommenen Bedieneranweisung und dem Phonem-Datensatz wird dieser Inhalt dann zur Weiterverarbeitung weitergegeben.In At the same time, each phoneme record also has a specific one Content stored in electronic form. With sufficient agreement between the recorded user instruction and the phoneme record this content is then passed on for further processing.

Dies bedeutet mit anderen Worten, dass bei den bekannten Spracherkennungsmodulen immer der Phonem-Datensatz mit dem darin gespeicherten Inhalt zur Weiterverarbeitung ausgewählt wird, der in der ersten Verarbeitungsstufe die höchste akustische Übereinstimmung ergeben hat. Probleme ergeben sich aus dieser Art der Spracherkennung immer dann, wenn ähnlich klingende Worte bzw. Spracheingaben voneinander zu unterscheiden sind. Aufgrund der häufig sehr unterschiedlichen Sprechweise der verschiedenen Benutzer kann es dann sehr leicht zu vielen Interpretationen kommen, so dass das Spracherkennungsmodul nicht den vom Benutzer eigentlich gewünschten Inhalt der Spracheingabe erkennt.This in other words means that in the known speech recognition modules always the phoneme record with the content stored in it Further processing selected which in the first processing stage is the highest acoustic match has resulted. Problems arise from this type of speech recognition always then, if similar to distinguish between sounding words and voice inputs are. Due to the frequent very different speech of different users can it then very easily come to many interpretations, so that Speech Recognition Module not the one actually wanted by the user Contents of the speech input recognizes.

Ausgehend von diesem Stand der Technik ist es deshalb Aufgabe der vorliegenden Erfindung, ein Verfahren zum Betrieb eines elektronischen Assistenzsystems vorzuschlagen, mit dem die Treffergenauigkeit des Spracherkennungsmoduls erhöht werden kann.outgoing From this prior art, it is therefore an object of the present Invention, a method for operating an electronic assistance system to propose, with the accuracy of the accuracy of the speech recognition module increase can.

Diese Aufgabe wird durch ein Verfahren nach der Lehre des Anspruchs 1 gelöst.These The object is achieved by a method according to the teaching of claim 1 solved.

Vorteilhafte Ausführungsformen der Erfindung sind Gegenstand der Unteransprüche.advantageous embodiments The invention are the subject of the dependent claims.

Das erfindungsgemäße Verfahren beruht auf dem Grundgedanken, dass das Spracherkennungsmodul mit einer zweiten Verarbeitungsstufe erweitert wird. In dieser zweiten Verarbeitungsstufe werden zumindest für einen Teil der Phonem-Datensätze die darin jeweils gespeicherten Inhalte mit den in einer Kontextdatenbank gespeicherten Kontextdaten verglichen. Der in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert, der allein die akustische Übereinstimmung zwischen der gesprochenen Bedieneranweisung und dem Phonem-Datensatz charakterisiert, kann dann in Abhängigkeit von dem in der zweiten Verarbeitungsstufe vorgenommenen Kontextvergleich modifiziert werden. Zumindest der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert wird dann zur Weiterverarbeitung in die anderen Teile des Assistenzsystems weitergegeben.The inventive method is based on the idea that the speech recognition module with a second processing stage is extended. In this second Processing levels are at least for a portion of the phoneme records therein each stored content with those in a context database stored context data compared. The one in the first processing stage determined match score, alone the acoustic match characterized between the spoken operator instruction and the phoneme record, can then depend on from the context comparison made in the second processing stage be modified. At least the phoneme record with the best modified match score is then forwarded to the other parts of the assistance system for further processing.

Durch die erfindungsgemäße Erweiterung des Spracherkennungsmoduls mit der zweiten Verarbeitungsstufe wird erreicht, dass die Übereinstimmung der vom Benutzer gesprochenen Bedieneranweisung nicht mehr nur noch rein akustisch bewertet wird, sondern auch eine inhaltliche Kontextbewertung erfolgt. Dadurch wird es möglich, dass beispielsweise Phonem-Datensätze, die zwar eine relativ hohe akustische Übereinstimmung ergeben haben, aber aufgrund ihres Kontextes sehr unwahrscheinlich erscheinen, einen entsprechend schlechteren Übereinstimmungswert erhalten und somit mit entsprechend geringerer Wahrscheinlichkeit zur Weiterverarbeitung vorgesehen werden. Letztendlich kann durch Anwendung des erfindungsgemäßen Verfahrens die Trefferwahrscheinlichkeit bei der Erkennung von gesprochenen Bedieneranweisungen erheblich verbessert werden.By the extension of the invention Speech recognition module with the second processing stage is achieved that match the operator's manual spoken by the user is no longer just is assessed purely acoustically, but also a content context assessment he follows. This will make it possible that, for example, phoneme datasets, although a relatively high acoustic match but because of their context they seem very unlikely, a correspondingly worse match value received and thus with a correspondingly lower probability be provided for further processing. Ultimately, through Application of the method according to the invention the hit probability in the recognition of spoken Operator instructions are significantly improved.

Die erfindungsgemäße Verarbeitung der Phonem-Datensätze in der zweiten Verarbeitungsstufe zur Abarbeitung des inhaltlichen Kontextvergleichs stellt einen durchaus erheblichen Zusatzaufwand bei der Datenverarbeitung dar. Um den zusätzlichen Datenverarbeitungsaufwand insgesamt auf ein tolerierbares Maß zu begrenzen ist es deshalb besonders vorteilhaft, wenn nicht alle Phonem-Datensätze dem Kontextvergleich in der zweiten Verarbeitungsstufe unterzogen werden, sondern nur die Phonem-Datensätze an die zweite Verarbeitungsstufe zum inhaltlichen Kontextvergleich weitergegeben werden, deren in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert oberhalb eines vorgegebenen Grenzwerts liegt. Im Ergebnis wird dadurch also erreicht, dass alle Phonem-Datensätze, die beim akustischen Vergleich in der ersten Verarbeitungsstufe keine ausreichend guten Ergebnisse erbracht haben, bereits vor dem Kontextvergleich in der zweiten Verarbeitungsstufe ausgefiltert werden.The processing according to the invention of the phoneme data records in the second processing stage for processing the content context comparison represents a considerable additional effort in the data processing. In order to limit the overall data processing effort to a tolerable level, it is therefore particularly advantageous if not all phoneme data sets are available Context comparison in the second processing stage, but only the phoneme records to the second processing stage be forwarded to the content context comparison whose match value determined in the first processing stage is above a predetermined limit value. As a result, it is thus achieved that all phoneme data records which did not produce sufficiently good results in the first comparison during the acoustic comparison are filtered out before the context comparison in the second processing stage.

In der Grundform des erfindungsgemäßen Verfahrens wird jeweils nur der Phonem-Datensatz mit dem jeweils besten modifizierten Übereinstimmungswert zur Weiterverarbeitung weitergegeben. In der Weiterverarbeitung kann beispielsweise dann der im Phonem-Datensatz gespeicherte Inhalt automatisch zur Weiterverarbeitung ausgewählt und in nachgelagerten Funktionsmodulen weiterverarbeitet werden. Vielfach ist es jedoch wünschenswert, dass nicht nur der Phonem-Datensatz mit der besten Bewertung weitergegeben wird. Beispielsweise ist es bei elektronischen Assistenzsystemen vielfach üblich, dass dem Benutzer eine Gruppe von Treffern mit den relativ höchsten Bewertungen zur Auswahl angezeigt wird, so dass die tatsächliche Auswahl durch den Benutzer dann noch bestätigt werden muss. Im Hinblick auf das erfindungsgemäße Verfahren bedeutet dies, dass dann mehrere Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten nach der zweiten Verarbeitungsstufe zur Weiterverarbeitung weitergegeben werden, um dem Benutzer beispielsweise die Auswahl eines dieser Phonem-Datensätze für die Weiterverarbeitung anzubieten. Dies kann beispielsweise dadurch erfolgen, dass dem Benutzer die Inhalte der Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungs werten angezeigt werden und der Benutzer dann durch eine geeignete Auswahl einen der Phonem-Datensätze bestätigt.In the basic form of the method according to the invention in each case only the phoneme record with the respectively best modified match value passed on for further processing. In further processing For example, then the content stored in the phoneme record automatically selected for further processing and in downstream function modules be further processed. In many cases, however, it is desirable that not only passed the phoneme record with the best rating becomes. For example, it is in electronic assistance systems common practice, that gives the user a group of matches with the relatively highest ratings is displayed for selection, allowing the actual selection by the user then confirmed must become. With regard to the method according to the invention, this means that then has multiple phoneme records with the relatively highest modified match values passed on for further processing after the second processing stage For example, the user can choose one of these To offer phoneme records for further processing. This can be done, for example, that the user Contents of the phoneme records with the relatively highest modified match values and then the user through a suitable selection one of the phoneme records approved.

Um die Auswahl durch den Benutzer zu erleichtern, ist es besonders vorteilhaft, wenn die Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten in einer Liste sortiert werden. Die Sortierung der Phonem-Datensätze in der Liste kann dabei nach Größe ihres jeweiligen modifizierten Übereinstimmungswertes erfolgen. Dies bedeutet mit anderen Worten, dass an der ersten Stelle der Liste jeweils der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert angeordnet ist und sich daran die Phonem-Datensätze abgestuft nach ihrem jeweiligen modifizierten Übereinstimmungswert sortiert anschließen. Die Größe der Liste kann dabei vielfach durch eine bestimmte Anzahl von in der Liste auszunehmenden Phonem-Datensätzen definiert sein. Enthält die Liste beispielsweise fünf Speicherplätze, werden in der Liste die fünf Phonem-Datensätze aufgenommen, die die fünf höchsten modifizierten Übereinstimmungswerte aufweisen.Around It is special to facilitate the selection by the user advantageous when the phoneme records with the relatively highest modified match values be sorted in a list. The sorting of the phoneme records in the List may vary by size respective modified match score respectively. In other words, that means in the first place the list is the phoneme record with the best modified match score and the phoneme records are graded according to their respective phoneme records modified match score assorted. The size of the list can be many times by a certain number of in the list to be taken phoneme records be defined. contains for example, the list is five Memories, become the five in the list Phoneme records that included the five highest have modified match values.

In welcher Weise der Kontextvergleich in der zweiten Verarbeitungsstufe vorgenommen wird, ist grundsätzlich beliebig. Nach einer ersten bevorzugten Verfahrensvariante sind in der Kontextdatenbank frühere Eingaben der Daten des Benutzers, die vom Benutzer für die Benutzung bestätigt wurden, gespeichert. Dem liegt die Grundüberlegung zugrunde, dass zu einem früheren Zeitpunkt vom Benutzer bestätigte Eingabedaten mit relativ hoher Wahrscheinlichkeit erneut von dem gleichen Benutzer eingegeben werden. Mit diesem in der Kontextdatenbank gespeicherten und in der Vergangenheit bereits mindestens einmal bestätigten Eingabedaten, wird der Inhalt der Phonem-Datensätze dann in der zweiten Verarbeitungsstufe verglichen. Für die Phonem-Datensätze, für die eine Übereinstimmung des Inhalts mit den in der Kontextdatenbank gespeicherten früheren Eingabedaten festgestellt wird, wird der Übereinstimmungswert erhöht, um die Auswahl dieser Phonem-Datensätze entsprechend wahrscheinlicher zu machen.In which way the context comparison in the second processing stage is made is basically any. According to a first preferred variant of the method in the context database earlier Inputs of the user's data provided by the user for use approved were saved. This is based on the fundamental consideration that an earlier one Date confirmed by the user Input data with relatively high probability again from the same user. With this in the context database saved and in the past at least once confirmed Input data, the contents of the phoneme records will then be in the second processing stage compared. For the phoneme records, for the a match content with the past input data stored in the context database is determined, the match value elevated, accordingly more likely to select these phoneme records do.

Welchen Zweck das elektronische Assistenzsystem in seiner Grundfunktion erfüllt, ist wiederum grundsätzlich beliebig, da die Auswertung von akustischen Spracheingaben für eine Vielzahl von unterschiedlichen Funktionssystemen von Interesse ist. Von besonders großer Bedeutung für den Benutzerkomfort ist die elektronische Spracherkennung jedoch für Navigationssysteme, insbesondere mobile bzw. fest eingebaute Navigationsgeräte. Denn beim Betrieb solcher Navigationssysteme muss der Benutzer eine Vielzahl von Eingaben machen, wobei die Tastatureingabe aufgrund der Nutzung, beispielsweise in einem Kraftfahrzeug, vielfach als sehr unbequem empfunden wird.Which Purpose of the electronic assistance system in its basic function Fulfills, is again basically arbitrary, since the evaluation of acoustic speech inputs for a variety of different functional systems of interest. Of special greater Meaning of however, user comfort is electronic speech recognition for navigation systems, in particular mobile or permanently installed navigation devices. Because in the operation of such navigation systems, the user has a variety of input, whereby the keyboard input due to the use, For example, in a motor vehicle, often as very uncomfortable is felt.

Im Hinblick auf die Benutzung des erfindungsgemäßen Verfahrens beim Betrieb von Navigationssystemen ist es weiterhin besonders vorteilhaft, wenn eine Kontextdatenbank benutzerspezifische Adressdaten enthält. Dabei kann es sich beispielsweise um das elektronische Adressbuch eines Benutzers handeln. Denn alle im elektronischen Adressbuch des Benutzers gespeicherten Adressen weisen eine entsprechend hohe Wahrscheinlichkeit als mögliche Zielpunkte für das Navigationssystem auf.in the With regard to the use of the method according to the invention during operation Of navigation systems, it is also particularly advantageous if a context database contains user-specific address data. there For example, it can be the electronic address book of a User act. Because all in the user's electronic address book stored addresses have a correspondingly high probability as possible Target points for the navigation system.

Weiterhin ist es bei Betrieb des erfindungsgemäßen Verfahrens auf ein Navigationssystem besonders vorteilhaft, wenn eine Kontextdatenbank die Startpunkte bzw. Zielpunkte enthält, die bereits in der Vergangenheit Grundlage einer Routenplanung gewesen sind. Denn bestimmte Start- oder Zielpunkte werden vom Benutzer immer wieder angefahren und sind deshalb bei der späteren Routenplanung als auch besonders wahrscheinliche Treffer anzusehen.Farther it is in operation of the method according to the invention on a navigation system particularly advantageous if a context database the starting points contains target points, which has already been the basis of route planning in the past are. Because certain start or Destination points are approached by the user again and again therefore at the later Route planning as well as particularly likely to look at hits.

Gemäß einer weiteren Variante ist außerdem noch eine Kontextdatenbank vorhanden, in der Daten zur Beschreibung der Bedeutung von Städten enthalten sind. Dabei kann es sich beispielsweise um die Einwohnerzahl und/oder die Stadtfläche einer Stadt handeln. Denn die Auswahl einer Stadt mit großer Einwohnerzahl bzw. großer Stadtfläche ist erheblich wahrscheinlicher, als beispielsweise die Auswahl eines kleinen Dorfes. Alternativ zur Verwendung des erfindungsgemäßen Verfahrens auf einem Navigationssystem kann das elektronische Assistenzsystem auch in der Art eines Medienabspielgeräts, insbesondere in der Art eines MP3-Abspielgeräts, ausgebildet sein. Auch hier muss der Benutzer vielfach mit sehr geringem Eingabekomfort seine Eingabedaten eingeben, so dass die Verbesserung des Eingabekomforts durch entsprechende Spracheingaben bei hoher Trefferwahrscheinlichkeit von großer Bedeutung ist.According to another variant is also There is also a context database containing data describing the meaning of cities. This may, for example, be the population and / or the city area of a city. Because the selection of a city with a large population or large urban area is much more likely than, for example, the selection of a small village. As an alternative to using the method according to the invention on a navigation system, the electronic assistance system can also be designed in the manner of a media player, in particular in the manner of an MP3 player. Again, the user often has to enter his input data with very little input comfort, so that the improvement of the input comfort by means of appropriate voice inputs with high probability of hit is of great importance.

Beim Betrieb des Verfahrens auf einem Medienabspielgerät kann die Kontextdatenbank bevorzugt Daten zu bevorzugten Musikstücken, und/oder Daten zur benutzerspezifischen Bewertung von Musikstücken, und/oder Daten zum Zeitpunkt der Abspeicherung von Musikstücken enthalten. Denn die vom Benutzer favorisierten Musikstücke, die beispielsweise in Favoritenlisten gespeichert sind, bzw. die Musikstücke, die vom Benutzer eine hohe benutzerspezifische Bewertung erhalten haben oder erst vor kurzer Zeit auf dem Medienabspielgerät abgespeichert wurden, weisen eine deutlich höhere Trefferwahrscheinlichkeit auf als andere Musikstücke.At the Operation of the method on a media player, the Contextual database prefers data to preferred tunes, and / or data for the user-specific evaluation of pieces of music, and / or data at the time the storage of music pieces contain. Because the user-favorite pieces of music, the For example, in favorite lists are stored, or the pieces of music that have received a high user-specific rating from the user or only recently stored on the media player were significantly higher Hit probability on as other pieces of music.

Gemäß einer weiteren Funktionsalternative kann das erfindungsgemäße Verfahren auch auf Fahrkartenautomaten installiert werden. Auch hier ist wiederum die Eingabe von einer Vielzahl von Eingabedaten durch den Benutzer notwendig, der zudem vielfach völlig ungeübt ist.According to one Another functional alternative, the inventive method can also be installed on ticket vending machines. Again, this is again the input of a variety of input data by the user necessary, moreover, in many cases completely inexperienced is.

Beim Kontextvergleich auf einem Fahrkartenautomat können die Inhalte der Phonem-Datensätze dann mit den Daten von bevorzugten Zielbahnhöfen, bzw. mit Daten von nahe gelegenen Zielbahnhöfen oder mit den Daten zur Größe oder Bedeutung von Zielbahnhöfen verglichen werden.At the Context comparison on a ticket machine, the contents of the phoneme records can then with the data of preferred destination stations, or with data from near located destination stations or with the data to the size or Importance of destination stations be compared.

Verschiedene Aspekte der Erfindung sind in der Zeichnung schematisiert dargestellt und werden nachfolgend beispielhaft erläutert.Various Aspects of the invention are shown schematically in the drawing and are explained below by way of example.

Es zeigen:It demonstrate:

1: eine sortierte Ergebnisliste mit den Inhalten mehrerer Phonem-Datensätze nach Durchlaufen der ersten Verarbeitungsstufe; 1 an ordered result list containing the contents of a plurality of phoneme records after passing through the first processing stage;

2: die Ergebnisliste gemäß 1 nach Durchlaufen der zweiten Verarbeitungsstufe. 2 : the result list according to 1 after passing through the second processing stage.

1 zeigt eine Liste 01, in deren ersten Spalte fünf Ortsnamen angeschrieben sind. Bei diesen Ortsnamen handelt es sich um die Inhalte von Phonem-Datensätzen, die beim akustischen Vergleich mit einer Spracheingabe an einem Navigationssystem als mögliche Treffer in einer ersten Verarbeitungsstufe durch akustischen Vergleich erkannt worden sind. Entsprechend dem Übereinstimmungswert der akustischen Übereinstimmung wurde der Ort „Würzbach” als wahrscheinlichster Treffer identifiziert und deshalb mit der Priorisierung 1 versehen. Der Treffer „Mühlburg” weist dagegen den geringsten akustischen Übereinstimmungswert auf und erhält damit die schlechteste Priorisierung, nämlich 5 Punkte. 1 shows a list 01 , in whose first column five place names are written. These place names are the contents of phoneme data records which have been recognized by acoustic comparison as a possible hit in a first processing stage in the acoustic comparison with a voice input to a navigation system. According to the coincidence value of the acoustic match, the place "Würzbach" was identified as the most likely hit and therefore provided with the prioritization 1. The hit "Mühlburg" on the other hand has the lowest acoustic match score and thus receives the worst prioritization, namely 5 points.

2 zeigt die Liste 01a, nachdem die erkannten Orte in einer zweiten Verarbeitungsstufe einen inhaltlichen Kontextvergleich durchlaufen haben. Bei diesem inhaltlichen Kontextvergleich wurde festgestellt, dass der Benutzer den Ort „Würzburg” bereits sehr häufig als Ziel seiner Routenplanung eingegeben hat und außerdem eine Vielzahl von Adressen in seinem persönlichen Adressbuch unter der Stadt „Würzburg” gespeichert sind. Aufgrund dieses inhaltlichen Kontextvergleiches wird der Treffer „Würzburg” mit einem höheren Übereinstimmungswert modifiziert und erhält nunmehr die höchste Priorisierung 1. Auch die anderen Treffer der Liste 1 werden einem inhaltlichen Kontextvergleich unterzogen und die jeweiligen Übereinstimmungswerte modifiziert, so dass „Mühlburg” nach dieser Modifikation statt der Priorisierung 5 die Priorisierung 3 und „Würzbach” statt der Priorisierung 1 die Priorisierung 4 erhält. Die Orte gemäß der Liste 1 werden dann anschließend zur Weiterverarbeitung weitergegeben und können dem Benutzer eines Navigationssystems in der entsprechenden Reihenfolge als mögliche Zielorte angezeigt werden. 2 shows the list 01a after the detected locations have undergone a content context comparison in a second processing stage. In this content context comparison it was found that the user has already entered the place "Würzburg" very often as the destination of his route planning and also stored a variety of addresses in his personal address book under the city "Würzburg". On the basis of this contextual comparison of contents, the hit "Würzburg" is modified with a higher matching value and now receives the highest prioritization 1. The other hits of list 1 are also subjected to a content context comparison and the respective match values are modified so that "Mühlburg" takes place after this modification the prioritization 5 the prioritization 3 and "Würzbach" instead of the prioritization 1 receives the prioritization 4. The locations according to the list 1 are then subsequently passed on for further processing and can be displayed to the user of a navigation system in the appropriate order as possible destinations.

Claims (13)

Verfahren zum Betrieb eines elektronischen Assistenzsystems mit einer akustischen Aufnahmeeinrichtung, an der gesprochene Bedieneranweisungen aufgenommen werden können und mit einem Spracherkennungsmodul weiterverarbeitet werden, wobei in einer ersten Verarbeitungsstufe des Spracherkennungsmoduls die gesprochenen Bedieneranweisungen mit in einer Datenbank gespeicherten Phonem-Datensätzen verglichen werden, und wobei die Phonem-Datensätze entsprechend ihrer jeweiligen akustischen Übereinstimmungsrate mit einem Übereinstimmungswert bewertet werden, dadurch gekennzeichnet, dass in einer zweiten Verarbeitungsstufe des Spracherkennungsmoduls zumindest für einen Teil der Phonem-Datensätze die Inhalte der Phonem-Datensätze mit den in zumindest einer Kontextdatenbank gespeicherten Kontextdaten verglichen werden, wobei der in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert der Phonem-Datensätze in Abhängigkeit vom Ergebnis des inhaltlichen Kontextvergleichs modifiziert wird, und wobei zumindest der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert zur Weiterverarbeitung weitergegeben wird.A method for operating an electronic assistance system with an acoustic recording device can be recorded at the spoken operator statements and processed with a speech recognition module, wherein in a first processing stage of the speech recognition module, the spoken operator statements are compared with stored in a database phoneme records, and wherein the phoneme Records are evaluated according to their respective acoustic match rate with a match score, characterized in that in a second processing stage of the voice recognition module, the contents of the phoneme records are compared with the context data stored in at least one context database for at least a portion of the phoneme records; in the first processing level of the phoneme data sets is modified in dependence on the result of the content context comparison, and wherein at least the phoneme data record with the best modified match value is forwarded for further processing. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass nur die Phonem-Datensätze an die zweite Verarbeitungsstufe zum inhaltlichen Kontextvergleich weitergegeben werden, deren in der ersten Verarbeitungsstufe ermittelter Übereinstimmungswert oberhalb eines vorgegebenen Grenzwerts liegt.Method according to claim 1, characterized in that that only the phoneme records to the second processing stage for content context comparison whose match value determined in the first processing stage is above a predetermined limit. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass mehrere Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten nach der zweiten Verarbeitungsstufe zur Weiterverarbeitung weitergegeben werden.Method according to claim 1 or 2, characterized having multiple phoneme records with the relatively highest modified match values passed on for further processing after the second processing stage become. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten nach der Größe ihres jeweiligen modifizierten Übereinstimmungswertes geordnet in einer Liste sortiert werden.Method according to one of claims 1 to 3, characterized that the phoneme records with the relatively highest modified match values according to the size of her respective modified match score ordered in a list sorted. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass in der Kontextdatenbank frühere Eingabedaten, die vom Benutzer bestätigt wurden, gespeichert sind, wobei in der zweiten Verarbeitungsstufe der Übereinstimmungswert eines Phonem-Datensatzes erhöhend modifiziert wird, wenn der Inhalt des Phonem-Datensatzes mit einem in der Kontextdatenbank gespeicherten, in der Vergangenheit bestätigten Eingabedatum übereinstimmt.Method according to one of claims 1 to 4, characterized that in the context database earlier Input data that has been confirmed by the user are stored, wherein in the second processing stage the match value of a phoneme record increasing is modified when the contents of the phoneme record with an in the context database stored, confirmed in the past input date. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das elektronische Assistenzsystem in der Art eines Navigationssystems ausgebildet ist.Method according to one of claims 1 to 5, characterized that the electronic assistance system is designed in the manner of a navigation system is. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass als eine Kontextdatenbank eine benutzerspezifische Adressdatenbank verwendet wird.Method according to one of claims 1 to 6, characterized that uses a user-specific address database as a context database becomes. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass als eine Kontextdatenbank eine Datenbank mit Startpunkten oder Zielpunkten verwendet wird, die in der Vergangenheit Grundlage einer Routenplanung gewesen sind.Method according to one of claims 1 to 7, characterized that as a context database a database with starting points or Target points used in the past is the basis of a Route planning have been. Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, dass in einer Kontextdatenbank Daten zur Beschreibung der Bedeutung von Städten, insbesondere die Einwohnerzahl und/oder der Stadtfläche, enthalten sind.Method according to one of claims 6 to 8, characterized that in a context database data describing the meaning of cities, especially the number of inhabitants and / or the city area are. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das elektronische Assistenzsystem in der Art eines Medienabspielgeräts, insbesondere eines MP3-Abspielgeräts, ausgebildet ist.Method according to one of claims 1 to 5, characterized that the electronic assistance system in the manner of a media player, in particular an MP3 player, is trained. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass in der Kontextdatenbank Daten zu bevorzugten Musikstücken und/oder Daten zur benutzerspezifischen Bewertung der Musikstücke und/oder Daten zum Zeitpunkt der Abspeicherung der Musikstücke enthalten sind.Method according to claim 10, characterized in that that in the context database data on preferred music pieces and / or Data for the user-specific evaluation of the pieces of music and / or Data at the time of saving the music pieces included are. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das elektronische Assistenzsystem in der Art eines Fahrkartenautomats ausgebildet ist.Method according to one of claims 1 to 5, characterized that the electronic assistance system is designed in the manner of a ticket machine is. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass in der Kontextdatenbank Daten zu bevorzugten Zielbahnhöfen und/oder Daten zu nahe gelegenen Zielbahnhöfen und/oder Daten zur Größe oder Bedeutung von Zielbahnhöfen enthalten sind.Method according to claim 12, characterized in that in the context database, data on preferred destination stations and / or Data on nearby destination stations and / or size or data Importance of destination stations are included.
DE102008021954A 2008-02-29 2008-05-02 Method for operating an electronic assistance system Withdrawn DE102008021954A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102008021954A DE102008021954A1 (en) 2008-02-29 2008-05-02 Method for operating an electronic assistance system
PCT/DE2009/000156 WO2009106031A1 (en) 2008-02-29 2009-02-06 Method for operating an electronic assistance system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102008012067 2008-02-29
DE102008012067.7 2008-02-29
DE102008021954A DE102008021954A1 (en) 2008-02-29 2008-05-02 Method for operating an electronic assistance system

Publications (1)

Publication Number Publication Date
DE102008021954A1 true DE102008021954A1 (en) 2009-09-03

Family

ID=40911440

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008021954A Withdrawn DE102008021954A1 (en) 2008-02-29 2008-05-02 Method for operating an electronic assistance system

Country Status (2)

Country Link
DE (1) DE102008021954A1 (en)
WO (1) WO2009106031A1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011116460A1 (en) 2011-10-20 2013-04-25 Volkswagen Aktiengesellschaft Method for providing user interface of e.g. navigation system for passenger car, involves outputting confirmation to user according to user inputs, where confirmation comprises non specific confirmation independent of word portion group
DE102015226408A1 (en) * 2015-12-22 2017-06-22 Robert Bosch Gmbh Method and apparatus for performing speech recognition for controlling at least one function of a vehicle
WO2018082917A1 (en) * 2016-11-02 2018-05-11 Audi Ag Method for processing a user input and motor vehicle having a data-processing device
DE102013007964B4 (en) 2013-05-10 2022-08-18 Audi Ag Automotive input device with character recognition

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19742054A1 (en) * 1997-09-24 1999-04-01 Philips Patentverwaltung Input system at least for place and / or street names
DE19933524A1 (en) * 1999-07-16 2001-01-18 Nokia Mobile Phones Ltd Procedure for entering data into a system
DE10131157C1 (en) * 2001-06-29 2002-07-04 Project49 Ag Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user
DE10125825A1 (en) * 2001-05-26 2002-11-28 Bosch Gmbh Robert Speech input and recognition system for a road vehicle navigation system has input checked against stored values
DE10306022B3 (en) * 2003-02-13 2004-02-19 Siemens Ag Speech recognition method for telephone, personal digital assistant, notepad computer or automobile navigation system uses 3-stage individual word identification
DE102005018174A1 (en) * 2005-04-19 2006-11-02 Daimlerchrysler Ag Method for the targeted determination of a complete input data record in a speech dialogue 11
DE102007016887B3 (en) * 2007-04-10 2008-07-31 Siemens Ag Method for operating navigation system, involves entering address information into corresponding phonetic address information, where address information is decoded in phonetic code

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10218226A1 (en) * 2002-04-24 2003-11-06 Volkswagen Ag Speech-control method for multimedia device in motor vehicle, by allocating phoneme data as speech label to individual multimedia files, e.g. titles of tracks
KR100668297B1 (en) * 2002-12-31 2007-01-12 삼성전자주식회사 Method and apparatus for speech recognition
US7136459B2 (en) * 2004-02-05 2006-11-14 Avaya Technology Corp. Methods and apparatus for data caching to improve name recognition in large namespaces
JP4804052B2 (en) * 2005-07-08 2011-10-26 アルパイン株式会社 Voice recognition device, navigation device provided with voice recognition device, and voice recognition method of voice recognition device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19742054A1 (en) * 1997-09-24 1999-04-01 Philips Patentverwaltung Input system at least for place and / or street names
DE19933524A1 (en) * 1999-07-16 2001-01-18 Nokia Mobile Phones Ltd Procedure for entering data into a system
DE10125825A1 (en) * 2001-05-26 2002-11-28 Bosch Gmbh Robert Speech input and recognition system for a road vehicle navigation system has input checked against stored values
DE10131157C1 (en) * 2001-06-29 2002-07-04 Project49 Ag Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user
DE10306022B3 (en) * 2003-02-13 2004-02-19 Siemens Ag Speech recognition method for telephone, personal digital assistant, notepad computer or automobile navigation system uses 3-stage individual word identification
DE102005018174A1 (en) * 2005-04-19 2006-11-02 Daimlerchrysler Ag Method for the targeted determination of a complete input data record in a speech dialogue 11
DE102007016887B3 (en) * 2007-04-10 2008-07-31 Siemens Ag Method for operating navigation system, involves entering address information into corresponding phonetic address information, where address information is decoded in phonetic code

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011116460A1 (en) 2011-10-20 2013-04-25 Volkswagen Aktiengesellschaft Method for providing user interface of e.g. navigation system for passenger car, involves outputting confirmation to user according to user inputs, where confirmation comprises non specific confirmation independent of word portion group
DE102013007964B4 (en) 2013-05-10 2022-08-18 Audi Ag Automotive input device with character recognition
DE102015226408A1 (en) * 2015-12-22 2017-06-22 Robert Bosch Gmbh Method and apparatus for performing speech recognition for controlling at least one function of a vehicle
WO2018082917A1 (en) * 2016-11-02 2018-05-11 Audi Ag Method for processing a user input and motor vehicle having a data-processing device
US11086639B2 (en) 2016-11-02 2021-08-10 Audi Ag Method for processing a user input and motor vehicle having a data-processing device

Also Published As

Publication number Publication date
WO2009106031A1 (en) 2009-09-03

Similar Documents

Publication Publication Date Title
DE69937176T2 (en) Segmentation method to extend the active vocabulary of speech recognizers
DE19922974A1 (en) Method and device for processing a document
DE102008021954A1 (en) Method for operating an electronic assistance system
DE112016006512T5 (en) Intention estimation device and intention estimation method
DE102008027958A1 (en) Method for operating a navigation system
DE102007058651A1 (en) Method for operating a navigation device
EP1282897A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
DE60029456T2 (en) Method for online adjustment of pronunciation dictionaries
EP3115886B1 (en) Method for operating a voice controlled system and voice controlled system
DE10042942C2 (en) Speech synthesis method
DE102005030965A1 (en) Extension of the dynamic vocabulary of a speech recognition system by further voice enrollments
DE112009003930T5 (en) Voice recognition device
EP0834859A2 (en) Method for determining an acoustic model for a word
DE102020202795A1 (en) Method and device for compressing a neural network
EP0965088A1 (en) Reliable identification with preselection and rejection class
DE102014010315A1 (en) Computer-implemented method and device for processing voice input
EP0945705A2 (en) Recognition system
EP2154483B1 (en) Method for entering destinations into a navigation system
DE10210553A1 (en) Automatic text classification method is computer based and involves determination of word property occurrence frequencies so that it is more qualitative than existing methods which are purely quantitative
DE112017007852T5 (en) Speech recognition dictionary data construction unit, speech recognition device, speech recognition dictionary data construction method
DE102016009196B4 (en) Method for operating multiple speech recognizers
DE102023203660A1 (en) Computer-implemented method and device for machine learning of facts, in particular for filling a knowledge base
DE102013019208A1 (en) Motor vehicle voice control
DE19824450C2 (en) Method and device for processing speech signals
DE102008062923A1 (en) Method for generating hit list during automatic speech recognition of driver of vehicle, involves generating hit list by Levenshtein process based on spoken-word group of that is determined as hit from speech recognition

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20121201