DE10291392B4 - Method, system and data carrier for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets - Google Patents
Method, system and data carrier for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets Download PDFInfo
- Publication number
- DE10291392B4 DE10291392B4 DE10291392T DE10291392T DE10291392B4 DE 10291392 B4 DE10291392 B4 DE 10291392B4 DE 10291392 T DE10291392 T DE 10291392T DE 10291392 T DE10291392 T DE 10291392T DE 10291392 B4 DE10291392 B4 DE 10291392B4
- Authority
- DE
- Germany
- Prior art keywords
- knowledge
- information
- pointer
- grain
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Verfahren
zur Erzeugung von Korrelationen und/oder Interaktionen und/oder
Wissen aus einer Vielzahl von durchsuchten Datensätzen,
gekennzeichnet
durch folgende Verfahrensschritte:
manuelle Erzeugung eines
Wissensblocks (KG) mit einem individuellen Bereitstellen von Begriffstabellen,
welche Begriffe und/oder Wörter
zur Charakterisierung je eines vorgegeben Wissensgebietes aufweisen,
und
maschinelle Erzeugung eines Informationsblocks (IG) aus Datensätzen und
elektrischen Leseeinheiten mit automatisiertem Bereitstellen von
Thesaurustabellen, welche Begriffe und/oder Wörter eines durchsuchten Datensatzes aufweisen,
selbsttätige Erzeugung
von vektoriellen Bezügen
(Pointern), durch welche Verweise zwischen gleichartigen und/oder
unterschiedlichen Wissensblöcken
und Informationsblöcken
(IG, IG; KG, KG; IG, KG) markiert werden,
Gewichtung dieser
Pointer nach Maßgabe
von Übereinstimmungen
der über
Pointer verbundenen Wissens- und Informationsblöcke (IG, KG), und
Anzeige
eines Pointers, sobald ein Pointer einen vorgegeben Schwellwert
der Gewichtung überschreitet.Method for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets,
characterized by the following process steps:
manual generation of a knowledge block (KG) with an individual provision of term tables, which have terms and / or words for characterization of a given knowledge area, and
machine generation of an information block (IG) from data sets and electrical reading units with automated provision of thesaurus tables having terms and / or words of a searched data set,
automatic generation of vector references (pointers), by which references between similar and / or different blocks of knowledge and information blocks (IG, IG, KG, KG, IG, KG) are marked,
Weighting of these pointers in accordance with matches of the knowledge and information blocks (IG, KG) connected via pointers, and
Display of a pointer as soon as a pointer exceeds a specified weight threshold.
Description
Die Erfindung betrifft ein Verfahren zur Erzeugung von Korrelationen und/oder Interaktionen und/oder Wissen aus einer Vielzahl von durchsuchten Datensätzen sowie ein System das nach diesem Verfahren arbeitet. Die Erfindung betrifft auch einen Datenträger, der Bestandteil eines solches lauffähigen Systems ist und auf dem das Programm zur Durchführung des Verfahrens gespeichert ist.The The invention relates to a method for generating correlations and / or interactions and / or knowledge from a variety of searched records and a system that works according to this method. The invention also concerns a data medium, is the component of such an executable system and on the the program to carry out of the method is stored.
Es
sind bereits eine Vielzahl von Veröffentlichungen bekannt, die
sich mit der automatischen Erfassung von Daten aus Dokumenten befassen.
So wurde zu der vorliegenden Erfindung vorab eine Recherche beim Österreichischen
Patentamt unter dem Aktenzeichen R22/2002 durchgeführt. Dabei
wurden als technologischer Hintergrund zu der vorliegenden Erfindung
folgende Dokumente als Stand der Technik aufgefunden:
Technologischer Hintergrundtechnological background
Die mannigfaltigen und meist nicht miteinander kompatiblen Datensammlungen der modernen Informationsgesellschaft stellen mittlerweile ein ernsthaftes Problem bezüglich der Informationsverarbeitung und Wissensgenerierung dar. Zwar werden riesige Datenmengen elektronisch gespeichert, die Extraktion von Zusammenhängen und Wissen ist aber nach wie vor zum allergrößten Teil Arbeit, die von Menschen übernommen werden muss.The varied and mostly incompatible data collections The modern information society is now posing a serious one Problem regarding of information processing and knowledge generation huge amounts of data stored electronically, the extraction of cohere and knowledge, however, is still for the most part work undertaken by humans must become.
Allerdings sind die Datenmengen mittlerweile so umfangreich, dass auch. Menschen oftmals überfordert sind, daraus Wissen zu generieren. Es ist daher zwingend notwendig, Verfahren zu erarbeiten, die aus heterogenen Sammlungen von Daten automatisiert Korrelationen und Wissen generieren.Indeed the amounts of data are now so extensive that too. People often overwhelmed are to generate knowledge from it. It is therefore imperative Procedures to work out heterogeneous collections of data automatically generate correlations and knowledge.
Insbesondere
sind zwei Teilaspekte eines solchen Verfahrens bereits aus der
Aus
der
Es ist jedoch zu unterstreichen, dass in diesem System stets die Anforderung eines entsprechenden Dokumentes durch einen Nutzer notwendig ist. Unabhängig davon in Form der Korrelation vorliegendes Wissen wird nicht genutzt, um eine entsprechende nicht angeforderte Information dem Nutzer kund zu tun.It However, it should be underlined that in this system always the requirement a corresponding document by a user is necessary. Independently of which in the form of correlation existing knowledge is not used, a corresponding unsolicited information to the user to do.
Der WO 00/72256 A2 ist dem gegenüber eine andere Vorgehensweise zur Klassifizierung von Informationen zu entnehmen. Diese Druckschrift geht aus von einem neuronalen Netz zum computergestützten Wissensmanagement, das auf einem im Speicherbereich eines Computers ausgebildeten neuronalen Netz basiert. Diese neuronale Netz bildet ein System künstlicher Intelligenz aus, indem es sich über eine zu Grunde liegende Wissensbasis in Form von rechentechnisch lesbaren Textinhalten erstreckt. Zur Verwaltung und Analyse der Wissensmengen besteht das neuronale Netz aus aufeinander bezogene und gewichteten Elemente, welche durch ihre speziellen Eigenschaften als über Wechselwirkungspaare definierte Teilmengen einen Hilbertraum ausbilden und denen jeweils ein Koordinatensektor zugeordnet ist. Durch eine entsprechend gewählte Konvergenzeigenschaft der assoziativen Datenstruktur bei einer Vielzahl statistisch unabhängiger Eingaben durch einen Nutzer sinkt in dem das neuronale Netz ausgebildeten Expertensystem die Redundanz, und es kommt zu einer Klassifizierung des Wissens.Of the WO 00/72256 A2 is opposite another approach to classifying information refer to. This document is based on a neural network for computer-aided knowledge management, that on a neural in the memory area of a computer Network based. This neural network forms a system artificial Intelligence by thinking about it An underlying knowledge base in the form of computationally extends readable textual content. To manage and analyze the Sets of knowledge consists of the neural network of interrelated and weighted elements, which by their special properties as over Interaction pairs defined subsets form a Hilbert space and each of which is assigned a coordinate sector. By a selected accordingly Convergence property of associative data structure in a variety statistically independent Inputs by a user sink in the neural network formed Expert system redundancy, and it comes to a classification of knowledge.
Auch bei diesem Ansatz ist es jedoch nicht vorgesehen, dass selbständig dem Nutzer generiertes Wissen zur Kenntnis gebracht würde.Also However, with this approach it is not intended that independently User-generated knowledge would be brought to the knowledge.
Der vorliegenden Erfindung liegt deshalb die Aufgabe zugrunde, ein Verfahren anzugeben, das aus heterogenen Sammlungen von Daten gleich welcher Art (z. B. Sequenzen, Dokumente, Veröffentlichungen, Patentanmeldungen oder dgl.) automatisiert Korrelationen und/oder Interaktionen und/oder Wissen generiert und dieses dem Benutzer auch ohne Anforderung anzeigt. Zusätzlich soll ein System und ein Datenträger zur Durchführung dieses Verfahrens angegeben werden.Of the The present invention is therefore based on the object, a method indicate that from heterogeneous collections of data equal to which Type (eg sequences, documents, publications, patent applications or the like) automates correlations and / or interactions and / or Generates knowledge and displays this to the user without request. additionally supposed to be a system and a disk to carry out be specified in this method.
Lösungsolution
Diese Aufgaben werden für das Verfahren durch die Merkmale des Anspruchs 1, für das System durch die Merkmale des Anspruchs 21 und für den Datenträger durch die Merkmale des Anspruchs 22 gelöst.These Tasks are for the method by the features of claim 1, for the system by the features of claim 21 and for the disk by the features of claim 22 solved.
Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.further developments The invention are specified in the subclaims.
Das hier vorgestellte Verfahren kann weitgehend selbstständig und unabhängig von aktuellen Benutzeranfragen Zusammenhänge finden, bewerten und katalogisieren.The Here presented method can largely independently and independently Find, rate, and catalog relationships from current user queries.
Das erfindungsgemäße Verfahren geht davon aus, dass Information und Wissen aus Grund-Blöcken zusammengesetzt ist. Im folgenden werden diese Blöcke Information Grain (IG) und Knowledge Grain (KG) genannt. Zwischen diesen Grains gibt es-Beziehungsinteraktionen, die vektorielle Beziehungen oder Pointer genannt werden. Das erfindungsgemäße Verfahren ermöglicht, dass diese Pointer automatisch erstellt werden. Anschließend wird die Topologie des sich daraus ergebenden Netzwerkes nach Beziehungen der Grains untereinander durchsucht und diese Assoziationen bewertet. Diese Assoziationen werden, in geeigneter Weise aufbereitet, dem Benutzer zur Verfügung gestellt.The inventive method assumes that information and knowledge are composed of basic blocks is. The following are these blocks Information Grain (IG) and Knowledge Grain (KG). Between these grains there are relationship interactions, which are called vectorial relations or pointers. The inventive method allows that these pointers are created automatically. Subsequently, will the topology of the resulting network by relationships The Grains searched each other and evaluated these associations. These associations are prepared in an appropriate manner User available posed.
Da mit größer werdenden Informationsnetzwerken sehr schnell die zu berechnenden Werte so zahlreich werden, dass die derzeitigen Rechner dafür zu langsam wären, können in einer Weiterbildung der Erfindung beschränkte Teilnetzwerke betrachtet.There with growing Information networks very quickly the values to be calculated so be numerous, that the current computer for it too slowly would, can considered in a development of the invention limited subnetworks.
Da das vorliegende Verfahren generell kein anderes Ziel hat, als ständig Informationen in Beziehung zu setzen und diese Beziehungen zu gewichten und zu dokumentieren, besitzt das Verfahren auch keinen klassischen Endpunkt. Einmal angestoßen läuft es so lange, wie das physikalische Rechenwerk mit Energie versorgt wird. Anfragen an das Verfahren bringen immer nur einen aktuellen Wissensstand als Ausgabeergebnis. Damit gleicht es der organischen Informationsverarbeitung, die ja auch keinen definierten Endpunkt kennt.There the present method generally has no other goal than constantly information to relate and to weight these relationships and to document, the method also has no classic endpoint. Once triggered it works as long as the physical calculator supplies energy becomes. Queries to the procedure always bring only a current Knowledge as output result. It's like organic Information processing, which does not have a defined endpoint knows.
Das Verfahren ermöglicht es, das selbstständig Ergebnisse mitgeteilt werden, ohne dass das Verfahren explizit danach gefragt wurde. Die Verknüpfung der Netzwerkelemente durch Pointer erlaubt es, dass zu jedem Zeitpunkt jedes Ergebnis logisch begründet auf die Grundinformationen zurückgeführt werden und dokumentiert werden kann.The Procedure allows it, on its own Results are communicated without the procedure being explicit afterwards was asked. The link The network elements through pointers allow it at any time every result is logically justified be attributed to the basic information and can be documented.
Ein weiterer Vorteil des Verfahrens besteht darin, beliebige Informationsstrukturen zu integrieren und miteinander zu verknüpfen. Die integrierbaren Informationsstrukturen umfassen zum Beispiel relationale und/oder objektorientierte Datenbanken, Texte jeder Art (Veröffentlichungen, Berichte, Zusammenfassungen, Artikel), Tabellen, Tondokumente usw.One Another advantage of the method is any information structures integrate and link together. The integrable information structures include, for example, relational and / or object-oriented databases, Texts of any kind (publications, Reports, summaries, articles), tables, sound documents, etc.
Durch einen Frage-Antwort-Dialog zwischen Benutzer und dem erfindungsgemäßen System ist es möglich, komplexe Fragestellungen, die (noch) nicht zu beantworten sind, in weniger komplexe Teilfragen zu zerlegen, zu spezifizieren und einzugren zen, auf die das Verfahren eine Antwort zu geben in der Lage ist.By a question and answer dialog between the user and the system according to the invention Is it possible, complex questions that can not (yet) be answered to decompose, to specify and to explain in less complex sub-questions to give the answer to the procedure in the Location is.
Ein wichtiger Teilaspekt des vorliegenden Verfahrens ist die Möglichkeit Rückmeldungen über die Richtigkeit und Wertigkeit der gefundenen und ausgegebenen Antworten und Assoziationen zu verarbeiten. Dies bedeutet, dass Assoziationen zwischen den Netzwerkelementen durch die Rückmeldung der Benutzer gestärkt oder geschwächt werden können.One important aspect of the present method is the possibility Feedback on the accuracy and valence of the found and issued answers and associations to process. This means that associations between the network elements through the feedback the user strengthened or weakened can be.
Detailbeschreibungdetailed description
– Begriffsdefinitionen- Definitions
Seed Table ist eine Tabelle des Knowledge Grain, die Begriffe, Wörter und verbundene Begriffe und Wörter enthält, die das betreffende Wissensgebiet charakterisieren oder einen funktionalen Zusammenhang mit dem betreffenden Wissensgebiet besitzen oder herstellen. Die Seed Tables verschiedener Wissensgebiete können gemeinsame Elemente enthalten, unterscheiden sich aber voneinander in mindestens einem Element. In diese Tabelle werden a priori Begriffe, Wörter und verbundene Begriffe und Wörter über das betreffende Wissensgebiet eingegeben. Weiterhin wird die Gesamtanzahl der in der Seed Table abgespeicherten Begriffe ebenfalls in der Tabelle gespeichert.Seed Table is a table of the Knowledge Grain, the terms, words and related terms and words contains which characterize the relevant field of knowledge or a functional one Own or produce connection with the relevant field of knowledge. The seed tables of different knowledge areas can contain common elements but differ from each other in at least one element. In This table will be a priori terms, words and related terms and words about that entered domain of knowledge. Furthermore, the total number the terms stored in the seed table also in the Saved table.
Growth Table ist eine Tabelle des Knowledge Grain, in die Begriffe, Wörter und verbundene Begriffe und Wörter automatisch eingetragen werden, die das betreffende Wissensgebiet charakterisieren oder die einen funktionalen Zusammenhang mit dem betreffenden Wissensgebiet besitzen oder herstellen. Die Growth Tables verschiedener Wissensgebiete können gemeinsame Elemente enthalten. Für jeden im Growth Table abgespeicherten Begriff wird eine Zahl mit abgespeichert, die angibt, wie viele Vergleiche des Growth Table mit Thesaurustabellen verschiedener Information Grains durchgeführt wurden, bei denen der Begriff nicht in der Thesaurustabelle gefunden wurde. Weiterhin wird die Gesamtanzahl der in der Growth Table abgespeicherten Begriffe ebenfalls in der Tabelle gespeichert.Growth Table is a table of the Knowledge Grain, in the terms, words and related terms and automatically include words that characterize the area of knowledge or that have or are functionally related to the area of knowledge. The growth tables of different knowledge areas can contain common elements. For each term stored in the growth table, a number is stored that indicates how many comparisons of the growth table were made with thesaurus tables of various information grains for which the term was not found in the thesaurus table. Furthermore, the total number of terms stored in the Growth Table is also stored in the table.
Thesaurustabelle ist eine Tabelle des Information Grain, die alle Begriffe, Wörter und verbundene Begriffe und Wörter eines Datensatzes enthält. Ein Datensatz kann unter anderem ein Schriftstück, ein Dokument, eine Datei, ein Ergebnisprotokoll, eine Bilddatei, eine Tonaufzeichnung, eine Teilinformation einer Datenbank etc. sein.thesaurus table is a table of information Grain containing all terms, words and related terms and words of a record. A record can include a document, a document, a file, a result log, an image file, a sound recording, a Be part information of a database etc.
Storage Pointer ist ein abgespeicherter Verweis auf die Ursprungsablage der betreffenden Information. Dies kann zum Beispiel eine Dateibezeichnung, eine Schriftstückablage, eine Bildablage etc. sein.Storage Pointer is a saved reference to the source filing the information concerned. This can be, for example, a file name, a document tray, be a picture tray etc.
Information Pointer ist ein bidirektionaler, gewichteter Verweis zwischen einem Information Grain und einem Knowledge Grain. Die Gewichtung der einen Verweisrichtung kann aber muss nicht gleich der Gewichtung der anderen Verweisrichtung sein.information Pointer is a bidirectional, weighted reference between one Information Grain and a Knowledge Grain. The weight of the A reference direction may not be equal to the weighting the other direction of reference.
Knowledge Pointer ist ein bidirektionaler, gewichteter Verweis zwischen zwei Knowledge Grains. Die Gewichtung der einen Verweisrichtung kann aber muss nicht gleich der Gewichtung der anderen Verweisrichtung sein. Knowledge Pointer is a bidirectional, weighted reference between two Knowledge Grains. The weighting of a reference direction can but not equal to the weighting of the other direction of reference be.
Information Pointer Table ist eine Tabelle des Information Grain, die Information Pointer enthält.information Pointer Table is a table of information Grain, the information Contains pointers.
Knowledge Pointer Table ist eine Tabelle des Knowledge Grain, die Knowledge Pointer enthält.Knowledge Pointer Table is a table of the Knowledge Grain, the Knowledge Contains pointers.
Information Pointer Strength (IPS) ist das Maß der Übereinstimmung zwischen einem Information Grain und einem Knowledge Grain. Wie der Wert der Übereinstimmung gefunden wird, wird weiter unten im Text beschrieben.information Pointer Strength (IPS) is the measure of correspondence between one Information Grain and a Knowledge Grain. Like the value of the match will be described later in the text.
Knowledge Pointer Strength (KPS) ist das Maß der Übereinstimmung zwischen zwei Knowledge Grains. Wie der Wert der Übereinstimmung gefunden wird, wird weiter unten im Text beschrieben.Knowledge Pointer Strength (KPS) is the measure of agreement between two Knowledge Grains. How to find the value of the match will be described later in the text.
Threshold-Parameter sind Grenzwerte, bei deren Erreichung eine Aktion ausgeführt wird. Allgemein ist zu bemerken, dass diese Parameter in einer bevorzugten Ausführungsform des Verfahrens sowohl global, das heißt für alle Teilelemente gleich, als auch lokal, das heißt nur ein Teilelement betreffend eingestellt werden können.Threshold parameter are limits where an action is taken when they are reached. Generally it should be noted that these parameters are in a preferred embodiment of the method both globally, that is to say for all subelements, as well as local, that is only a subelement can be set regarding.
Pointer Strength Threshold ist ein Grenzwert für das Maß der Übereinstimmung. Damit ein Information Pointer oder ein Knowledge Pointer erstellt wird, muss der Wert der Übereinstimmung mindestens den Pointer Strength Threshold erreichen.pointer Strength Threshold is a limit to the degree of agreement. Thus an information pointer or a Knowledge Pointer is created, the value of the match must match at least reach the Pointer Strength Threshold.
Growth Storage Threshold ist ein Grenzwert für die Aufnahme neuer Begriffe in die Growth Table. Erreicht die Gewichtung eines Information Pointer mindestens den Growth Storage Threshold des betreffenden Knowledge Grain, so werden die am häufigsten in der betreffenden Thesaurustabelle des Information Grain vorkommenden Begriffe in den Growth Table des betreffenden Knowledge Grain aufgenommen.Growth Storage Threshold is a limit to the inclusion of new terms into the Growth Table. Reached the weighting of an information pointer At least the growth storage threshold of the relevant knowledge Grain, they are the most common occurring in the relevant thesaurus table of the Information Grain Terms added to the Growth Table of the Knowledge Grain.
Growth Deletion Threshold ist ein Grenzwert, bei dessen Erreichen der betreffende Begriff aus dem Growth Table des betrachteten Knowledge Grain gelöscht wird.Growth Deletion Threshold is a limit at which the respective one is reached Term is deleted from the Growth Table of the considered Knowledge Grain.
Information
Grain (IG) ist eine Datenstruktur; die bevorzugt mindestens folgende
Bestandteile umfasst:
Name, Information Type, Storage Pointer,
Thesaurustabelle, Information Pointer TableInformation Grain (IG) is a data structure; which preferably comprises at least the following constituents:
Name, Information Type, Storage Pointer, Thesaurus Table, Information Pointer Table
In
Knowledge
Grain (KG) ist eine Datenstruktur, die vorzugsweise mindestens folgende
Bestandteile umfasst:
Name, Knowledge Type, Seed Table, Growth
Table, Information Pointer Table, Knowledge Pointer Table, Information
Pointer Strength Threshold, Knowledge Pointer Strength Threshold,
Growth Storage Threshold, Growth Deletion Threshold.Knowledge Grain (KG) is a data structure that preferably comprises at least the following components:
Knowledge Pointer Table, Knowledge Pointer Table, Information Pointer Strength Threshold, Knowledge Pointer Strength Threshold, Growth Storage Threshold, Growth Deletion Threshold.
In
Informations- und Assoziationsnetzwerk (I + A-Netzwerk) bezeichnet das Geflecht, bestehend aus Information Grains und Knowledge Grains, verbunden durch Information Pointer und Knowledge Pointer.information and association network (I + A network) denotes the network, Consisting of Information Grains and Knowledge Grains through information pointer and knowledge pointer.
Assoziationskette bezeichnet eine lineare, durch Pointer geschaffene Verbindung zwischen zwei Grains des Informations- und Assoziationsnetzwerkes. Die Knoten der Assoziationskette werden durch Grains gebildet.Assoziationskette denotes a linear connection created by pointers between two grains of information and Association network. The nodes of the association chain are formed by grains.
Genereller Ablauf des erfindungsgemäßen VerfahrensGeneral course of the inventive method
a) Initialisierunga) Initialization
– Erstellung der initialen Knowledge Grains- Creation of the initials Knowledge Grains
Für die jeweils
in Frage kommenden Wissensgebiete werden durch den Menschen eine
Reihe von anfänglichen
Knowledge Grains erstellt. Ein Beispiel für ein Knowledge Grain ist in
In einer bevorzugten Ausführungsform können die Seed Tables der Knowldedge Grains automatisch erzeugt werden. Dabei kommen allgemein bekannte Verfahren zur Erzeugung von fachspezifischen Wortlisten und Thesauri zum Einsatz.In a preferred embodiment can The seed tables of Knowldedge Grains are automatically generated. Here are well-known methods for the production of subject-specific Word lists and thesauri are used.
Der Seed Table ist eine der zentralen Tabellen des Knowledge Grain. Darin werden alle Begriffe, Wörter und Begriffskombinationen abgelegt, die das betreffende Wissensgebiet charakterisieren beziehungsweise als Begriffe in diesem Gebiet verwendet werden. Je genauer und treffender die Auswahl der Be griffe ist, desto genauer und schärfer kann dass erfindungsgemäße Verfahren im späteren Verlauf Assoziationen berechnen.Of the Seed Table is one of the central tables of the Knowledge Grain. In it all terms, words and term combinations that cover the relevant knowledge area characterize or used as terms in this area become. The more accurate and appropriate the choice of terms is, the more accurate and sharper can that process according to the invention later Calculate history associations.
Weiterhin werden der Name des Grain, der Knowledge Type und die diversen Threshold-Werte festgelegt. Diese Anfangswerte werden auf Grund von Erfahrung eingegeben. Das erfindungsgemäße Verfahren ist in der Lage, diese Werte im Laufe der Informationsverarbeitung selbstständig zu verändern. Auch neue Knowledge Grains können durch das Verfahren im Zuge der Informationsverarbeitung selbstständig neu erstellt werden.Farther are the name of the Grain, the Knowledge Type and the various Threshold values established. These initial values are entered based on experience. The inventive method is able to independently set these values in the course of information processing change. Also, new knowledge grains can independently by the process in the course of information processing new to be created.
Erstellung eines initialen GlobalthesaurusCreation of an initial Global Thesaurus
Zur Vereinfachung und Vereinheitlichung der Informationsabspeicherung wird ein initialer Globalthesaurus erstellt. Es können auch aus Gründen der praktischen Durchführung für jedes Wissensgebiet separate Thesauri erstellt werden. Diese initialen Thesauri werden während der Laufzeit des Verfahrens ständig erweitert und überprüft.to Simplification and standardization of information storage An initial global thesaurus is created. It can too for reasons the practical implementation for each Knowledge area separate thesauri are created. These initials Thesauri will be during the duration of the procedure constantly extended and checked.
Erstellung einer initialen WortausschlusslisteCreation of an initial Word Exclusion List
Zur Vermeidung von Füllwörtern (z.B. in, am, wo, wer, bei etc.) im Globalthesaurus und in den Thesaurustabellen der Information Grains wird mindestens eine Wortausschlussliste erstellt, die ebenfalls während der Laufzeit des Verfahrens ständig erweitert und überarbeitet wird.To avoid filler words (eg in, at, where, who, etc.) in the Globalthesaurus and in the Thesau at least one word exclusion list is created, which is also continually expanded and revised during the runtime of the process.
b) Informationsaufnahmeb) information recording
Information Grain Erstellung – Erste PhaseInformation Grain Creation - First phase
Für jede zu
bearbeitende Informationseinheit (Schriftstück, Ergebnisdatei, Datensatz
etc.) erstellt das erfindungsgemäße Verfahren
ein Information Grain mit den oben beschriebenen Elementen. Ein
beispielhaftes Information Grain zeigt
Kernstück des Information Grain ist die Thesaurustabelle, in die jeder Begriff, jedes Wort eingetragen wird, das in der Informationseinheit vorkommt. Zusätzlich zu dem Begriff wird die Zahl, wie häufig dieser Begriff in der Informationseinheit vorkommt, mit abgespeichert. Weiterhin wird in der Thesaurustabelle vermerkt, wie viele verschiedene Begriffe insgesamt darin gespeichert sind und wie viele Wörter oder Begriffselemente die betrachtete Informationseinheit insgesamt besitzt. Vor dem Eintrag eines Begriffes in die Thesaurustabelle wird der Begriff mit den Einträgen im Globalthesaurus verglichen, damit eine einheitliche Schreib- und Darstellungsform der Begriffe gewährleistet werden kann. Kommt ein Begriff noch nicht im Globalthesaurus vor, so wird er darin aufgenommen.Centerpiece of information Grain is the thesaurus table, in which every term, every word is entered, which occurs in the information unit. In addition to the term becomes the number, how frequent this term occurs in the information unit, with stored. Furthermore, the thesaurus table notes how many different ones Total terms are stored in it and how many words or words Conceptual elements has the considered information unit in total. Before entering a term in the thesaurus table is the Term with the entries compared in the Global Thesaurus for a uniform writing and presentation of the terms can be guaranteed. comes a term not yet in the global thesaurus, it is in it added.
Der Storage Pointer verweist auf den Ablageort der Informationseinheit. Dies kann sowohl eine physikalische Ablage (z.Bsp. Aktenordner, Bild) als auch eine virtuelle Ablage (z. Bsp. Dateinamen, Datenbankeintrag) sein.Of the Storage Pointer refers to the storage location of the information unit. This can be both a physical filing (z. Image) as well as a virtual file (eg file name, database entry) be.
Der Information Type wird automatisch aus einer Liste möglicher Typen nach festgelegten Kriterien zugeordnet.Of the Information Type is automatically made from a list of possible Types assigned according to specified criteria.
Information Grain Erstellung – Zweite PhaseInformation Grain Creation - Second phase
Nachdem für alle aktuell zu verarbeitenden Informationseinheiten die erste Phase der Information Grain Erstellung durchgeführt wurde, werden in der zweiten Phase die Information Pointer Table der Information Grains und der Knowledge Grains berechnet.After this for all currently to be processed information units the first phase The Information Grain creation was done in the second Phase the Information Pointer Table of the Information Grains and the Calculated Knowledge Grains.
Hierzu
werden die Begriffe der Thesaurustabelle eines Information Grain
nacheinander mit den Begriffen in den Seed Tables und den Growth
Tables aller Knowledge Grains verglichen (siehe auch
In einer bevorzugten Ausführungsform wird dazu die folgende Formel verwendet: In a preferred embodiment, the following formula is used for this purpose:
Wobei:
- B
- = (Begriff 1, Begriff 2, Begriff 3, ..., Begriff N); B ist die Gesamtheit der zwischen dem jeweils betrachteten Information Grain (gespeichert in Thesaurustabelle) und dem jeweils betrachteten Knowledge Grain (gespeichert in Seed Table und Growth Table) übereinstimmenden Begriffe
- N
- = Anzahl der Begriffe in der Thesaurustabelle des Information Grain
- W
- = Gesamtanzahl der Wörter/Begriffe in der Informationseinheit, und
- K
- = Gesamtanzahl der Begriffe in Seed Table und Growth Table des Knowledge Grain sind.
- B
- = (Term 1, term 2, term 3, ..., term N); B is the totality of the terms that match between the respective considered information Grain (stored in thesaurus table) and the considered Knowledge Grain (stored in Seed Table and Growth Table)
- N
- = Number of terms in the thesaurus table of the Information Grain
- W
- = Total number of words / terms in the information unit, and
- K
- = Total number of terms in Seed Table and Growth Table of the Knowledge Grain.
Der Faktor 10x dient nur dazu, die Zahlen in einen leichter handhabbaren Bereich zu transformieren. Durch die Modulo-Operation wird nur der ganzzahlige Teil des Rechenwertes als Endergebnis verwendet. X wird experimentell im Zuge der Erprobung des Verfahrens bestimmt. Der bevorzugte Anfangswert von x ist 5.The factor 10 x only serves to transform the numbers into a more easily handled range. The modulo operation uses only the integer part of the calculated value as the final result. X is experimentally determined in the course of the trial of the method. The preferred initial value of x is 5.
In
Nach
der Berechnung des Information Pointer Strength (IPS) wird dieser
Wert mit dem Information Pointer Strength Threshold des betreffenden
Knowledge Grain verglichen. Ist der IPS mindestens so hoch wieder
vorgegebene Threshold, so ist damit eine Zugehörigkeit der Informationseinheit
zu diesem Wissensgebiet, repräsentiert
durch das Knowledge Grain, festgestellt. Es wird ein Information
Pointer abgespeichert (siehe auch
Die Ausgestaltung dieses Information Pointers ist bevorzugt jedoch nicht notwendigerweise bidirektional und gewichtet. Dies bedeutet, er deutet vom betrachteten Information Grain zum betrachteten Knowledge Grain und vice versa. Zusammen mit dem Pointer wird bevorzugt eine Gewichtung abgespeichert, die für beide Richtungen gleich aber auch unterschiedlich sein kann. In der Anfangsphase wird die Gewichtung für beide Richtungen identisch sein. Als Gewichtungswert wird der Information Pointer Strength verwendet.The However, this embodiment of Pointers is not preferred necessarily bidirectional and weighted. This means he points from the considered information grain to the considered knowledge grain and vice versa. A weighting is preferred with the pointer stored for both directions may be the same but also different. In In the initial phase, the weighting becomes identical for both directions be. The weight value is the Pointer Strength information used.
In
Hieraus
werden entsprechend der oben und in
Wie
in
Eine mögliche Ausführungsform des Verfahrens kann sein, die Begriffe der Thesaurustabellen nicht mit allen Tabellen aller Knowledge Grains zu vergleichen, sondern nur mit einem eingeschränkten Kreis von Knowledge Grains. Dies kann zum Beispiel dadurch erreicht werden, dass nur die prominentesten Begriffe der Thesaurustabelle mit den Namen der Knowledge Grains oder mit den Begriffen der Seed-Tabellen der Knowledge Grains auf Ähnlichkeit überprüft werden. Erreicht man mit dieser verkürzten Überprüfung eine Mindestübereinstimmung, so wird der oben beschriebene vollständige Vergleich der Begriffe zwischen diesen Grains durchgeführt.A possible embodiment of the method may not be the terms of the thesaurus tables to compare all tables of all Knowledge Grains, but only with a limited Circle of Knowledge Grains. This can be achieved, for example become that only the most prominent terms of the thesaurus table with the names of the knowledge grains or with the terms of the seed tables The knowledge grains are checked for similarity. If you reach with this shortened review one Minimum match, this is the complete comparison of the concepts described above performed between these grains.
Als Ergebnis der oben beschriebenen Berechnung der Information Pointer besitzen danach die Information Grains eine Information Pointer Table, deren gewichtete Pointer auf die verbundenen Knowledge Grains verweisen. Die Knowledge Grains wiederum enthalten danach ebenfalls eine Information Pointer Table, deren gewichtete Pointer auf die verbundenen Information Grains verweisen. Damit ist eine gewichtete Beziehung zwischen der Informationseinheit und einem Wissensgebiet hergestellt. Selbstverständlich ist es möglich, dass von einer Informationseinheit Beziehungen zu mehreren verschiedenen Wissensgebieten hergestellt werden. Genauso selbstverständlich sind Beziehungen von einem Wissensgebiet zu mehreren Informationseinheiten möglich.When Result of the calculation of the information pointer described above After that, the information grains have an information pointer Table, whose weighted pointer to the associated Knowledge Grains refer. In turn, the Knowledge Grains will also be included an information pointer table whose weighted pointers to the Associated Information Grains Direct. This is a weighted one Relationship between the information unit and a knowledge area produced. Of course is it possible that from one information unit relationships to several different ones Be prepared knowledge areas. Just as natural Relationships from one knowledge area to several information units possible.
c) Erzeugung der Grund-Wissensbeziehungenc) Generation of basic knowledge relationships
Aufnahme neuer Begriffe in den Growth Table eines Knowledge GrainInclusion of new Terms in the Growth Table of a Knowledge Grain
Überschreitet bei der Betrachtung der Informationskorrelation zwischen einem Information Grain und einem Knowledge Grain der Information Pointer Strength (IPS) den Growth Storage Threshold des Knowledge Grain, dann werden die A in der Thesaurustabelle des Information Grain am häufigsten vorkommenden Begriffe in die Growth Table des Knowledge Grain aufgenommen. Die Berechnung von A wird unten im Text beschrieben. Kommen mehrere Begriffe gleich häufig vor und können nicht alle in die Growth Table aufgenommen werden, so wählt ein Zufallsgenerator die aufzunehmenden Begriffe unter den häufigsten aus.exceeds considering the information correlation between information Grain and a Knowledge Grain of Information Pointer Strength (IPS) the Growth Storage Threshold of the Knowledge Grain, then the most common in the thesaurus table of the Information Grain occurring terms in the Growth Table of the Knowledge Grain. The calculation of A is described below in the text. Come several Terms equally common before and can not all are included in the Growth Table, so vote Random generator the items to be included among the most common out.
Die
Anzahl (A) der aufzunehmenden Begriffe richtet sich dabei in einer
bevorzugten Ausführungsform nach
folgender Formel:
Wobei:
- N
- = Anzahl der Begriffe in der Thesaurustabelle des Information Grain und
- W
- = Gesamtanzahl der Wörter/Begriffe in der Informationseinheit ist.
- N
- = Number of terms in the thesaurus table of the Information Grain and
- W
- = Total number of words / terms in the information unit.
Löschung von Begriffen aus dem Growth Table eines Knowledge GrainDeletion of terms from the Growth Table of a Knowledge Grain
Wird
ein Begriff des Growth Table innerhalb von einer bestimmten Anzahl
von Vergleichen mit Thesaurustabellen verschiedener Information
Grains nicht in mindestens einer der Thesaurustabellen gefunden,
so wird er aus dem Growth Table des Knowledge Grain gelöscht. Die
Anzahl (V) der Vergleiche wird im Growth Deletion Threshold festgelegt
und richtet sich dabei in einer bevorzugten Ausführungsform nach folgender Formel:
- P
- = Gesamtanzahl der Information Grains und
- Q
- = Gesamtanzahl der Knowledge Grains ist.
- P
- = Total number of information grains and
- Q
- = Total Number of Knowledge Grains.
Berechnung der Knowledge Pointer, Methode 1Calculation of the Knowledge Pointer, method 1
Die
Knowledge Pointer stellen einen wesentlichen Teil der Wissenskorrelationen
dar und repräsentieren
die Beziehungen zwischen Wissensgebieten (Knowledge Grains) untereinander.
Es sind bidirektionale, gewichtete Verweise, die in einer bevorzugten
Ausführungsform
wie folgt berechnet werden (siehe auch
Ausgehend von einem Knowledge Grain betrachtet das Verfahren die zu diesem Ausgangs-Knowledge Grain gehörenden Information Pointer (IP) nacheinander. Beginnend mit dem ersten Information Pointer wird im zugehörigen Information Grain das Vorhandensein weiterer Information Pointer überprüft. Wenn mindestens ein weiterer Pointer, der ja zu einem anderen Knowledge Grain, dem Ziel-Knowledge Grain weist, vorhanden ist, so wird der Knowledge Pointer Strength für diese Assoziationskette berechnet. Die Berechnung wird bevorzugt nach folgender Rechenvorschrift durchgeführt.outgoing from a Knowledge Grain, the procedure looks at this Output Knowledge Grain belonging Information Pointer (IP) in succession. Starting with the first Information Pointer is in the associated information Grain the Presence of further information Pointer checked. If at least one more Pointer, yes to another Knowledge Grain, the target Knowledge If Grain points, the Knowledge Pointer becomes Strength for this Calculated association chain. The calculation is preferred after following calculation rule.
Die Summe der Gewichtungen der beteiligten Information Pointer dividiert durch die Anzahl der durchlaufenen Knoten minus eins ergibt den Knowledge Pointer Strength (Jedes Information Grain und jedes Knowledge Grain zählen als je ein Knoten, Ausgangs-Grain und Ziel-Grain zählen mit).The Sum of the weights of the involved information pointer divided by the number of nodes passed minus one gives the Knowledge Pointer Strength (Each Information Grain and each Knowledge Grain count as one node each, starting grain and target grain count).
Entsprechend dieser Rechenvorschrift werden alle möglichen Verbindungen via Information Pointer zwischen den beiden betrachteten Knowledge Grains berechnet.Corresponding This calculation rule will be all possible connections via information Pointer calculated between the two considered Knowledge Grains.
Wenn der höchste berechnete Knowledge Pointer Strength mindestens so hoch ist, wie jeder der Knowledge Pointer Strength Threshold-Werte der beteiligten Knowledge Grains, so ist damit eine Assoziation zwischen den beteiligten Knowledge Grains festgestellt. Es wird ein Knowledge Pointer abgespeichert. Die Ausgestaltung dieses Knowledge Pointer ist bevorzugt bidirektional und gewichtet. Dies bedeutet, er deutet vom betrachteten Ausgangs-Knowledge Grain zum betrachteten Ziel-Knowledge Grain und vice versa. Zusammen mit dem Pointer wird eine Gewichtung abgespeichert, die für beide Richtungen gleich aber auch unterschiedlich sein kann. In der Anfangsphase wird die Gewichtung für beide Richtungen identisch sein. Als Gewichtungswert wird der höchste berechnete Knowledge Pointer Strength verwendet.If the highest calculated Knowledge Pointer Strength is at least as high as each of the Knowledge Pointer Strength Threshold values involved Knowledge Grains, so it is an association between the involved Knowledge Grains detected. A knowledge pointer is stored. The design of this knowledge pointer is preferably bidirectional and weighted. This means that it points to the considered source knowledge Grain to the considered target knowledge grain and vice versa. Together the pointer stores a weighting for both Directions can be the same but also different. In the initial phase is the weighting for be identical in both directions. The weighting value will be the highest calculated Knowledge Pointer Strength used.
Die vorstehend beschriebene Berechnung der Knowledge Pointer Strength wird für jedes Knowledge Grain durchgeführt. Als Ergebnis dieser Berechnungen besitzen danach die Knowledge Grains eine Knowledge Pointer Table, deren gewichtete Pointer auf die verbundenen Knowledge Grains verweisen. Damit sind gewichtete Beziehung zwischen Wissensgebieten untereinander hergestellt. Selbstverständlich ist es möglich, dass von einen Knowledge Grain Beziehungen zu mehreren verschiedenen Wissensgebieten hergestellt werden. Genauso selbstverständlich ist es möglich, dass Wissensgebiete keine Assoziation via Knowledge Pointer untereinander besitzen.The Knowledge Pointer Strength calculation described above is performed for each Knowledge Grain. As a result of these calculations, the Knowledge Grains then have a Knowledge Pointer Table whose weighted pointers point to the connected Knowledge Grains. This creates weighted relationships between knowledge areas. Of course, it is possible for a Knowledge Grain to establish relationships with several different areas of knowledge. It is equally possible that knowledge domains are not associated via Knowledge Poin own each other.
Das folgende Beispiel soll die Berechnung eines Knowledge Pointer verdeutlichen: The following example illustrates the calculation of a Knowledge Pointer:
Ausgehend vom Knowledge Grain (KG) A führt der Information Pointer (IP) zum Information Grain (IG) 1. Von dort führt ein weiterer Pointer zum Knowledge Grain (KG) B. Daher wird nun ein Knowledge Pointer (KP), KG A <–> KG B, in beiden betroffenen Knowledge Grains gespeichert, der die Gewichtung (200 + 100)/(3 – 1) = 150 bekommt.outgoing from the Knowledge Grain (KG) A leads the Information Pointer (IP) to the Information Grain (IG) 1. From there introduces Another pointer to the Knowledge Grain (KG) B. Therefore, now a Knowledge Pointer (KP), KG A <-> KG B, in both cases Knowledge Grains saved the weight (200 + 100) / (3 - 1) = 150 gets.
Gemäss dem oben beschriebenen Verfahren werden alle möglichen Assoziationsketten zwischen zwei Knowledge Grains berechnet. Der Knowledge Pointer mit der höchsten Gewichtung wird in den beteiligten Knowledge Grains gespeichert, wenn die Gewichtung des Pointers mindestens die Knowledge Pointer Strength Thresholds der beteiligten Knowledge Grains erreicht. Anschließend wird die gleiche Prozedur mit allen weiteren Knowledge Grains durchgeführt.According to the above All possible chains of association are described calculated between two Knowledge Grains. The Knowledge Pointer with the highest Weighting is stored in the involved knowledge grains, if the weight of the pointer is at least the Knowledge Pointer Strength Thresholds of participating Knowledge Grains reached. Subsequently, will the same procedure with all other Knowledge Grains.
Gemäß
Schließlich sind
sämtliche
Information Pointer und Knowledge Pointer des Informations- und
Assoziationsnetzwerkes berechnet. In
Ab einer bestimmte Größe des Netzwerkes kann es notwendig sein, nicht mehr alle Knowledge Pointer berechnen zu lassen.From a certain size of the network It may not be necessary to calculate all Knowledge Pointers anymore allow.
In
einer bevorzugten Ausführungsform
beschränkt
sich das Verfahren dann darauf, nur die Information Pointer zu verfolgen,
die die jeweils J höchsten
Gewichtungen haben, wobei die Zahl J als globale Variable oder in
Tabellenform festgelegt wird oder vom Verfahren selbstständig, in
Abhängigkeit
von der Anzahl der vorhandenen Knoten in einer bevorzugten Ausführungsform
nach folgender Formel berechnet wird:
- P
- = Gesamtanzahl der Information Grains
- Q
- = Gesamtanzahl der Knowledge Grains
- y
- wird experimentell im Zuge der Erprobung des Verfahrens bestimmt.
- P
- = Total number of information grains
- Q
- = Total number of Knowledge Grains
- y
- is determined experimentally in the course of testing the process.
Ein möglicher bevorzugter Anfangswert von y ist 5.One potential preferred initial value of y is 5.
In
einer weiteren bevorzugten Ausführungsform
ist die Suchtiefe (S) auf eine maximale Anzahl von Knoten beschränkt. Die
Anzahl der jeweils zu durchsuchenden Knoten wird entweder in einer
globalen Variable festgelegt oder vom Verfahren selbstständig, in
Abhängigkeit
von der Anzahl der vorhandenen Knoten, zum Beispiel mit folgender
Formel, berechnet:
- C
- = Konstante; zum Beispiel 3000
- R
- = Anzahl der vorhandenen Knoten
- C
- = Constant; for example 3000
- R
- = Number of existing nodes
Eine weitere bevorzugte Ausführungsform verwendet eine Mischform aus beiden vorgenannten Ausführungsformen.A further preferred embodiment uses a hybrid form of both aforementioned embodiments.
Berechnung der Knowledge Pointer, Methode 2Calculation of the Knowledge Pointer, method 2
Eine weitere bevorzugte Ausführungsform der Berechnung der Knowledge Pointer ist wie folgt charakterisiert.A further preferred embodiment The calculation of the Knowledge Pointer is characterized as follows.
Es werden entsprechend den unter "Information Grain Erstellung – Zweite Phase" beschriebenen Verfahren die Seed und Growth Tables eines Knowledge Grains nacheinander mit den Seed und Growth Tables aller anderen Knowledge Grains verglichen. Dies wird für jedes Knowledge Grain durchgeführt. Das Verfahren berechnet dabei den jeweiligen Knowledge Pointer Strength (KPS).It will be made in accordance with the "Information Grain Creation - Second Phase "described Process the Seed and Growth Tables of a Knowledge Grain one after the other compared with the Seed and Growth Tables of all other Knowledge Grains. This will be for every knowledge grain performed. The method calculates the respective Knowledge Pointer Strength (KPS).
Nach der Berechnung des Knowledge Pointer Strength (KPS) wird dieser Wert mit dem Knowledge Pointer Strength Threshold des betreffenden Knowledge Grains verglichen. Ist der KPS mindestens so hoch wie der Threshold, so ist damit eine Korrelation dieser Wissensgebiete, repräsentiert durch die beiden Knowledge Grains, festgestellt. Es wird ein Knowledge Pointer abgespeichert. Die Ausgestaltung dieses Knowledge Pointers ist bevorzugt bidirektional und gewichtet. Dies bedeutet, er deutet vom ersten betrachteten Knowledge Grain zum zweiten betrachteten Knowledge Grain und vice versa. Zusammen mit dem Pointer wird eine Gewichtung abgespeichert, die für beide Richtungen gleich aber auch unterschiedlich sein kann. In der Anfangsphase wird die Gewichtung für beide Richtungen identisch sein. Als Gewichtungswert wird der Knowledge Pointer Strength verwendet.To The calculation of the Knowledge Pointer Strength (KPS) becomes this Value with the Knowledge Pointer Strength Threshold of the respective Knowledge Grains compared. Is the KPS at least as high as the threshold, so it is a correlation of these fields of knowledge, represents through the two Knowledge Grains, noted. It becomes a knowledge Pointer saved. The design of this knowledge pointer is preferably bidirectional and weighted. This means he is pointing looked at from the first considered knowledge grain to the second Knowledge Grain and vice versa. Together with the pointer becomes a weighting stored for both directions may be the same but also different. In In the initial phase, the weighting becomes identical for both directions be. The weight value used is the Knowledge Pointer Strength.
d) Assoziationsfindung, Ergebnisdarstellung und Interaktion mit Benutzernd) association finding, Presentation of results and interaction with users
Generell gilt für alle in diesem Abschnitt "Assoziationsfindung, Ergebnisdarstellung und Interaktion mit Benutzern" beschriebenen Teilverfahren, dass eine "holografische Hierarchie" der betrachteten Knowledge Grains ein wesentliches Merkmal des erfindungsgemäßen Verfahrens ist. Der Begriff "holografische Hierarchie" soll folgende Eigenschaft des durch das erfindungsgemäßen Verfahren erzeugten Informations- und Assoziationsnetzwerkes (I + A-Netzwerk) verdeutlichen.As a general rule applies to all in this section "Association finding, Presentation of results and interaction with users ", that a "holographic Hierarchy "the considered knowledge Grains an essential feature of the method according to the invention is. The term "holographic Hierarchy "should following property of the information generated by the method according to the invention and association network (I + A network).
Der Eintrittspunkt in das I + A-Netzwerk geschieht in einer bevorzugten Form über ein Knowledge Grain. Dieses Grain sei für diese Anfrage per Definition das hierarchisch oberste. Die Knowledge Pointer dieses Grains verweisen nun auf verbundene Wissensgebiete, -untergebiete oder auch übergeordnete Wissensstrukturen. Alle diese verbundenen Knowledge Grains sind in Betrachtung dieser Anfrage jedoch untergeordnet und hierarchisch, über die Knowledge Pointer, mit dem Eintrittspunkt verbunden und erlauben dadurch einen iterativen Frage-Antwort-Dialog mit dem Benutzer, der zu einer Eingrenzung der Ursprungsfrage und zu immer präziseren Antworten führt.Of the Entry point into the I + A network happens in a preferred Shape over a knowledge grain. This grain is for this request by definition the hierarchically highest. The Knowledge Pointers refer to this grain now on related knowledge areas, sub-areas or higher-level ones Knowledge structures. All of these related Knowledge Grains are however, subordinated and hierarchical in consideration of this request, on the Knowledge Pointer, connected to the entry point and allow thereby an iterative question-answer dialogue with the user leading to a delimitation of the origin question and to more and more precise Answers leads.
Stellt man nun eine neue Anfrage an das I + A-Netzwerk, so ist nunmehr der neue Eintrittspunkt das hierarchisch oberste Knowledge Grain. Dies bedeutet, dass sich die Hierarchie des Netzwerkes mit der gestellten Frage verändert. Da dies keine statische Hierarchie ist und der Eintrittspunkt an mindestens jedem Knowledge Grain liegen kann und es sich dabei aber immer um das gleich Netzwerk handelt, wird diese Hierarchie als "holografisch" bezeichnet.provides Now you have a new request to the I + A network, so now the new entry point is the hierarchically highest knowledge grain. This means that the hierarchy of the network with the asked Question changed. Since this is not a static hierarchy and the entry point can be at least any knowledge grain and it can be always the same as the network, this hierarchy is called "holographic".
Es ist also möglich, den Eintrittspunkt in das Netzwerk, also z.B. die erste gestellte Frage an einem beliebigen Knowledge Grain zu wählen. In diesem Punkt unterscheidet sich das vorliegende Verfahren grundlegend von den sogenannten neuronalen Netzen.It is possible, the entry point into the network, e.g. the first one asked Question on any Knowledge Grain to choose. In this point differs The present method is fundamentally different from the so-called neural Networks.
Darstellung der direkten Wissensbeziehungen (KG – KG)Representation of the direct Knowledge Relations (KG - KG)
In einer bevorzugten Ausführungsform können alle Wissensbeziehungen, repräsentiert durch die Knowledge Pointer zwischen Knowledge Grains, die einen Minimal Association Score (MAS) überschreiten, dem Benutzer als Ergebnis präsentiert werden. Der Assoziation Score wird grundsätzlich dadurch berechnet, indem die Summe der Gewichtungen der in der betrachteten Assoziationskette durchlaufenen Pointer dividiert wird durch die Anzahl der durchlaufenen Pointer. Der Grenzwert MAS kann dabei sowohl vom Benutzer direkt als auch vom Programm in Abhängigkeit von verschiedenen anderen Parametern, wie zum Beispiel Rechenleistung der verwendeten Hardware, Anzahl der vorhandenen Knowledge Grains und Information Grains, gewählt werden. Die Ergebnispräsentation kann dabei auf alle technisch machbare Weise erfolgen, zum Beispiel durch Ausgabe in Schriftform, gedruckt oder auf einem Bildschirm, graphisch, gesprochen, als Datei etc..In a preferred embodiment, all knowledge relationships represented by the Knowledge Pointers between Knowledge Grains that exceed a Minimal Association Score (MAS) can be presented to the user as a result. The association score is basically calculated by dividing the sum of the weights of the pointers passed in the considered association chain by the number of pointers passed through. The limit value MAS can be selected both by the user directly and by the program as a function of various other parameters, such as, for example, the computing power of the hardware used, the number of available knowledge grains and information grains. The presentation of the results can be done in all technically feasible ways, for example by output in writing, printed or on a screen, graphically, spoken, as a file etc.
In einer weiteren bevorzugten Ausführungsform muss die Gewichtung jedes einzelnen der betrachteten Pointer einen Minimal Pointer Score (MPS) überschreiten, damit die Assoziation in die Ergebnisdarstellung mit aufgenommen werden kann. Dies bedeutet, dass alle Pointer einer Informationskette diesen MPS überschreiten müssen. Der Wert für den MPS kann als globale Variable festgelegt werden oder in Abhängigkeit vom betrachteten Knowledge Grain sein oder vom Verfahren selbstständig in Abhängigkeit von weiteren Verfahrensparametern berechnet werden.In a further preferred embodiment the weighting of each of the considered pointers must be one Exceed minimum pointer score (MPS), so that the association is included in the results presentation can be. This means that all pointers are an information chain exceed this MPS have to. The value for The MPS can be set as a global variable or depending on be considered by the Knowledge Grain or by the procedure independently in dependence be calculated by other process parameters.
Berechnung und Darstellung der indirekten Informationsbeziehungen (KG – IG – KG – IG; KG – KG – IG)Calculation and presentation indirect information relations (KG - IG - KG - IG; KG - KG - IG)
Indirekte Informationsbeziehungen sind Assoziationen zwischen einem Knowledge Grain und einem nicht direkt über einen Information Pointer damit verbundenen Information Grain. Die Verbindung zwischen dem betrachteten Knowledge Grain und dem Information Grain verläuft dabei über mindestens einen Zwischenknoten.indirect Information relations are associations between a knowledge Grain and not directly over an information pointer associated with information Grain. The Connection between the observed knowledge grain and the information Grain is running over it at least one intermediate node.
Zur Berechnung der Informationskette dieser indirekten Beziehungen berechnet das Verfahren die Gewichtung aller Relationen zwischen einem Knowledge Grain und allen Information Grains. Dazu wird die Summe der Pointer-Gewichtungen zwischen dem Anfangspunkt und dem Endpunkt der Informationskette dividiert durch die Anzahl der benutzten Pointer. Dies wird für alle Knowledge Grains durchgeführt. Anschließend können die Assoziationen, die einen Gewichtungswert M überschreiten, dem Benutzer als Ergebnis präsentiert werden. Die Annahme des Gewichtungswertes M und die Art der Ergebnisdarstellung ist entsprechend wie unter Punkt "Darstellung der direkten Wissensbeziehungen (KG – KG)" beschrieben.to Calculation of the information chain of these indirect relationships is calculated the method is the weighting of all relations between a knowledge Grain and all information Grains. This is the sum of the pointer weights between the starting point and the end point of the information chain divided by the number of used pointers. This will be for all knowledge Grains performed. Subsequently can the associations that exceed a weighting value M, the user be presented as a result. The assumption of the weighting value M and the type of result representation is the same as under "Presentation of direct knowledge relationships (KG - KG) ".
Bei umfangreichen Netzwerken kann die Suchtiefe S wie unter Punkt "Berechnung der Knowledge Pointer, Methode 1" beschränkt werden.at The search depth S can be determined as described under point "Calculation of the Knowledge Pointer, Method 1 "be limited.
In einer weiteren bevorzugten Ausführungsform muss jeder einzelne der betrachteten Pointer einen Minimal Pointer Score (MPS) überschreiten, damit die Assoziation in die Ergebnisdarstellung mit aufgenommen werden kann. Dies bedeutet, dass alle Pointer einer Informationskette diesen MPS überschreiten müssen. Der Wert für den MPS kann als globale Variable festgelegt werden oder in Abhängigkeit vom betrachteten Knowledge Grain sein oder vom Verfahren selbstständig in Abhängigkeit von weiteren Verfahrensparametern berechnet werden.In a further preferred embodiment Every single one of the considered pointers has to have a minimal pointer Exceed score (MPS), so that the association is included in the results presentation can be. This means that all pointers are an information chain exceed this MPS have to. The value for The MPS can be set as a global variable or depending on be considered by the Knowledge Grain or by the procedure independently in dependence be calculated by other process parameters.
Bearbeitung direkter Benutzeranfragenprocessing direct user requests
Direkte Benutzeranfragen an das erfindungsgemäße System sind möglich. Die Benutzeranfrage, bevorzugt in natursprachlicher Form, wird bevorzugt wie folgt bearbeitet.direct User requests to the system according to the invention are possible. The User request, preferably in natural language form, is preferred edited as follows.
Unter Ausnutzung von Standarddatenbanktechniken werden die Begriffe der Anfrage mit a) den Bezeichnungen der Knowledge Grains, b) mit den Begriffen der Seed Tables und Growth Tables der Knowledge Grains und c) mit den Ursprungsinformationsinhalten der Information Grains verglichen. Dieser Abfrageprozess kann bevorzugt hierarchisch gemäß oben beschriebener Reihenfolge ablaufen, d.h. wenn es Knowledge Grains gibt, deren Bezeichnung mit Begriffen der Anfrage übereinstimmen, so bilden diese Knowledge Grains und die über die darin abgespeicherten Pointer mit den Knowledge Grains verbundenen Assoziationsketten den eingeschränkten, sekundären Suchraum für die Benutzeranfrage.Under Exploitation of standard database techniques will be the terms of Request with a) the names of the Knowledge Grains, b) with the Terms of the Seed Tables and Growth Tables of the Knowledge Grains and c) the source information contents of the information grains compared. This query process may preferably hierarchically according to the above Sequence, i. if there are knowledge grains whose Designation match with terms of the request, so form these Knowledge Grains and the over the pointers stored in it are linked to the Knowledge Grains Association chains the limited, secondary Search space for the user request.
Ergibt sich keine hinreichende Übereinstimmung mit Bezeichnungen der Knowledge Grains, so wird der Suchraum der Anfrage auf die Begriffe der Seed und Growth Tables aller Knowledge Grains erweitert. Es werden die Knowledge Grains und die damit verbundenen Information Grains, die die N höchsten Übereinstimmungen zwischen Anfrage und Begriffen der Seed und Growth Tables haben, als Ergebnis angezeigt. Die Zahl N kann als globale Variable festgelegt, vom Benutzer eingeben oder vom AAA-Verfahren selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden.results there is no sufficient agreement with terms of the Knowledge Grains, the search space of the Request on the terms of Seed and Growth Tables of all Knowledge Grains expanded. It will be the Knowledge Grains and the associated Information Grains, which are the N highest matches between request and terms of seed and growth tables have displayed as result. The number N can be set as a global variable, enter by the user or by the AAA method itself depending calculated from other process parameters.
Ergibt sich auch hierbei keine befriedigende Antwort, so wird der Suchraum auf alle Ursprungsinformationseinheiten ausgedehnt. Die Assoziationsketten, die mit den Ursprungsinformationseinheiten verbunden sind, die die N höchsten Übereinstimmungen mit der Anfrage besitzen, werden als Ergebnis angezeigt. Auch hierbei kann die Zahl N als globale Variable festgelegt, vom Benutzer eingeben oder vom erfindungsgemäßen System selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden.results If there is no satisfactory answer, then the search space will be extended to all source information units. The chains of association, which are connected to the source information units that the N highest matches with the request are displayed as the result. Also here can set the number N as a global variable, to be entered by the user or from the system according to the invention even in dependence calculated from other process parameters.
Diese hierarchische Suche kann in einer weiteren bevorzugten Ausführungsform mit der Berücksichtigung der Pointer-Gewichtungen kombiniert werden. Dabei wird die Suche bevorzugt zu solchen Netzwerkelementen fortgeführt, die über hoch gewichtete Pointer mit dem Ausgangsnetzwerkelement verbunden sind. Dabei werden in jedem Suchschritt die N am höchsten gewichteten Pointer weiter verfolgt, wobei die Zahl N als globale Variable festgelegt, vom Benutzer eingeben oder vom erfindungsgemäßen System selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden kann.These Hierarchical search may be in another preferred embodiment with the consideration the pointer weights be combined. The search is preferred to such network elements continued the above highly weighted pointers connected to the output network element are. In each search step, the N are the highest weighted Pointer, where the number N is set as a global variable, Enter by the user or the system according to the invention itself depending can be calculated from other process parameters.
Frage-Antwort-DialogQuestion-answer dialogue
Eine typische, bevorzugte Interaktion zwischen Benutzer und erfindungsgemäßen System geschieht über einen Frage-Antwort Dialog. Der Benutzer stellt eine Frage, das System erzeugt eine bevorzugt natursprachliche Abfrage, die gemäß der unter "Bearbeitung direkter Benutzeranfragen" beschriebenen hierarchischen Reihenfolge an das Informations- und Assoziationsnetzwerk (I + A-Netzwerk) gestellt wird. Dabei werden die Zwischenergebnisse als Teilantworten ausgegeben, die mit einer Frage nach weiterer Eingrenzung der Ursprungsfrage des Benutzers verbunden wird. Der Benutzer kann einen oder mehrere der in der Teilantwort aufgeführten Begriffe als Eingrenzung benutzen oder neue, zusätzliche Fragebegriffe einführen. Mit der eingegrenzten Frage wird der hierarchische Suchpfad weiter durchlaufen. Nach einer oder mehreren Eingrenzungen wird das Verfahren zu einer limitierten Anzahl von Knowledge Grains gelangt sein. Nunmehr folgt die Eingrenzung auf Ebene der Information Pointer. Das erfindungsgemäße Verfahren sucht mit der eingegrenzten Frage in den Thesaurustabellen der durch Information Pointer verbundenen Information Grains und stellt die Ergebnisse wieder als Teilantwort dem Benutzer zur Verfügung. Dieser kann wiederum eine weitere Eingrenzung des Fragebereichs durchführen.A typical, preferred interaction between user and system according to the invention happens over a question-answer dialog. The user asks a question that System generates a preferably natural language query, which according to the under "processing direct User Requests " hierarchical order to the information and association network (I + A network). Here are the intermediate results issued as partial answers, with a question for further Delimitation of the original question of the user is connected. Of the User can have one or more of the terms listed in the partial answer use as a delimitation or introduce new, additional query terms. With the limited question will continue through the hierarchical search path. After one or more constraints, the process becomes one limited number of knowledge grains have arrived. Now follows the limitation at the information pointer level. The inventive method search with the limited question in the thesaurus tables Information Pointer related information Grains and provides the Results again as a partial answer to the user. This in turn can further narrow the scope of the question.
Dieser Frage-Antwort-Dialog führt iterativ zu einer Verfeinerung und Spezifizierung der Ursprungsfrage. Allgemein gesagt führt dieser Dialog dazu, dass (zur Zeit) unbeantwortbare Fragen durch Interaktion mit dem erfindungsgemäßen Verfahren in beantwortbare Teilfragen zerlegt werden und die Antworten auf diese Teilfragen dann gegeben werden.This Question-answer dialog leads iteratively to a refinement and specification of the original question. Generally speaking this dialogue allows for (at the moment) unanswerable questions Interaction with the method according to the invention in answerable Sub-questions are decomposed and the answers to these sub-questions then be given.
e) Plastizität des Informations- und Assoziationsnetzwerkese) plasticity of the information and association network
Autonome Erzeugung von Knowledge GrainsAutonomous generation of Knowledge Grains
In einer bevorzugten Ausführungsform ist das erfindungsgemäße Verfahren und System in der Lage Knowledge Grains selbsttätig zu erzeugen.In a preferred embodiment is the inventive method and system able to generate Knowledge Grains automatically.
Erhält ein Information Grain keine Information Pointer zu den vorhandenen Knowledge Grains, so erzeugt das erfindungsgemäße Verfahren bzw. System automatisch einen neuen Knowledge Grain, bestehend aus den wesentlichen Bestandteilen des Information Grain und berechnet den Information Pointer zwischen diesen beiden Netzwerkelementen. Als wesentliche Bestandteile werden die N-häufigsten Begriffe der Thesaurustabelle des Information Grain in die neue Seed Tabelle des Knowledge Grain übernommen, wobei die Zahl N als globale Variable festgelegt, vom Benutzer eingeben oder vom System selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden kann.Receives an information Grain no information pointer to the existing Knowledge Grains, Thus, the inventive method generates or system automatically a new Knowledge Grain consisting of the essential components of the information Grain and calculated the information pointer between these two network elements. As essential components become the N-most frequent terms of the Thesaurus table of the Information Grain into the new seed table of the Knowledge Grain, where the number N is set as a global variable, entered by the user or depending on the system itself can be calculated from other process parameters.
In einer weiteren bevorzugten Ausführungsform kann das erfindungsgemäße Verfahren bzw. System vorhandene Knowledge Grains in neue Knowledge Grains aufspalten. Dies wird durchgeführt, wenn eine bestimmte Anzahl N an Knowledge Pointern und/oder Information Pointer bei einem Knowledge Grain überschritten wird. Die Zahl N kann als globale Variable festgelegt, vom Benutzer eingeben oder vom erfindungsgemäßen Verfahren bzw. System selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden. Dann kann zum Beispiel für jeden Begriff, der im Seed Table oder im Growth Table vorkommt, bestimmt werden, zu wie viel und welchen Information Grains eine Übereinstimmung mit einem Begriff von deren Thesaurustabellen besteht. Es wird eine Clusteranalyse der Begriffs-Information Grain Relationen durchgeführt und das ursprüngliche Knowledge Grain entsprechend den Clustern in neue Knowledge Grains aufgespalten. Das ursprüngliche Knowledge Grain erhält neue Knowledge Pointer, die zu den aus ihm hervorgegangenen Grains verweisen und die Begriffe der Seed Table sind die Namen der neuen Knowledge Grains. Als Namen werden die Begriffe mit den höchsten Relationswerten der Clusteranalyse verwendet. Abschließend werden die Information Pointer der neuen Grains neu berechnet.In a further preferred embodiment, the inventive method or system can split existing knowledge grains into new knowledge grains. This is done when a certain number N of Knowledge Pointers and / or Information Pointers are exceeded on a Knowledge Grain. The number N can be defined as a global variable, entered by the user or calculated by the method or system according to the invention itself as a function of other method parameters. Then, for example, for each term that appears in the Seed Table or the Growth Table, it can be determined to what extent and what information Grains a match with a notion of their thesaurus tables. A cluster analysis of the term information Grain Relations is performed and the original Knowledge Grain is split into new Knowledge Grains according to the clusters. The original Knowledge Grain receives new Knowledge Pointers that reference the Grains it has spawned, and the Seed Table Terms are the names of the new Knowledge Grains. Be as a name used the terms with the highest relational values of cluster analysis. Finally, the information pointers of the new grains are recalculated.
4.5.2 Autonome Löschung von Knowledge Grains4.5.2 Autonomous deletion of Knowledge Grains
In einer weiteren bevorzugten Ausführungsform ist es möglich, Knowledge Grains auch zu löschen. Dies bedeutet im wesentlichen die Umkehrung der zuvor beschriebenen Aufspaltung. Dies kann notwendig sein, wenn die Zahl N der von dem betrachteten Knowledge Grain ausgehenden Information Pointer und/oder Knowledge Pointer einen Mindestwert unterschreitet. Die Zahl N kann als globale Variable festgelegt, vom Benutzer eingeben oder vom erfindungsgemäßen Verfahren selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden kann. Die Begriffe der Seed Table und Growth Table des zu löschenden Grains werden in den Growth Table des Knowledge Grains aufgenommen, das den am höchsten gewichteten Knowledge Pointer zu diesem Grain besitzt. Die Information Pointer werden neue berechnet.In a further preferred embodiment Is it possible, Also to delete Knowledge Grains. This essentially means the reversal of the previously described splitting. This may be necessary if the number N is that of the one considered Knowledge Grain Outgoing Information Pointer and / or Knowledge Pointer falls below a minimum value. The number N can be global Set variable, enter by the user or by the method according to the invention even in dependence can be calculated from other process parameters. The terms the Seed Table and Growth Table of the grain to be deleted are in the Growth Table of the Knowledge Grains, which is the highest weighted Knowledge Pointer to this Grain owns. The information pointer new ones are calculated.
Verarbeitung von Feed-Back von außerhalb des erfindungsgemäßen Verfahrensprocessing from feed back from outside the method according to the invention
Ein wesentlicher Aspekt des erfindungsgemäßen Verfahrens ist die Möglichkeit, Rückmeldungen von außerhalb aufzunehmen. Rückmeldungen verstärken oder schwächen Verknüpfungen zwischen Grains.One An essential aspect of the method according to the invention is the possibility feedback from outside take. feedback strengthen or weaken connections between grains.
Dazu werden in einer bevorzugten Ausführungsform alle Pointer einer betrachteten Assoziationskette gemäss der Rückmeldung von außerhalb des erfindungsgemäßen Verfahrens mit einem Bonus oder Malus versehen. Bonus und Malus können ein Faktor sein, der als globale Variable festgelegt, vom Benutzer eingeben oder vom erfindungsgemäßen Verfahren selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden kann. Es können auch Absolutwerte als Bonus und Malus verwendet werden, die ebenfalls wie vorbezeichnet vom Benutzer oder Verfahren intern erzeugt werden können. Bonus und Malus können für Information Pointer und Knowledge Pointer gleich aber auch unterschiedlich sein. Sie können auch in Abhängigkeit von einer eventuellen Wertigkeit (siehe Kapitel "Mögliche Verfahrensverfeinerungen") des Grains gewählt werden. Bonus- und Maluswerte können mit jeder Rückmeldung verändert werden. Werden Pointer einer Assoziationskette mehrfach durch positive Rückmeldung gestärkt, so wird dies als Bahnung bezeichnet.To are in a preferred embodiment all pointers of a considered association chain according to the feedback from outside the method according to the invention with a bonus or penalty. Bonus and penalty can be one To be a factor set by the user as a global variable or from the method according to the invention even in dependence can be calculated from other process parameters. It can too Absolute values are used as bonus and penalty, too as previously described are generated internally by the user or process can. Bonus and penalty can for information Pointer and Knowledge Pointer but also be different. You can also in dependence of a possible value (see chapter "Possible Process refinement ") of the grain. Bonus and penalty values can with every feedback changed become. Are pointers of an association chain multiply positive feedback strengthened, this is what is referred to as "routing".
In einer bevorzugten Ausführungsform werden die Bonus- und Maluswerte separat mit der Gewichtung eines Pointers gespeichert, damit eine bessere Nachvollziehbarkeit der Assoziationsgewichtung gewährleistet ist.In a preferred embodiment the bonus and penalty values are separated with the weight of a Pointers stored, so that better traceability of the Association weighting guaranteed is.
Es ist zu beachten, dass eine Neuinformation einer schon vom erfindungsgemäßen Verfahren benutzten Datenbank ebenfalls ein Feed-Back von außen sein kann (Update einer Datenbank).It It should be noted that a new information of a already by the inventive method used database also be a feed back from the outside can (update a database).
Mit der Benutzerrückmeldung "reift" ein einmal in Gang gesetztes erfindungsgemäßes System. Es wird in einem späteren Reifezustand möglich sein, dass das Verfahren Konzepte, Hypothesen und Modelle erzeugt, indem Assoziationsketten mit hohen Gewichtungsfaktoren aufgezeigt werden. Diese Hypothesen können mit Hilfe der Rückmeldung von außerhalb des erfindungsgemäßen Systems überprüft und bewertet werden. Weiterhin können dadurch Widersprüche in vorhandenen Hypothesen und Modellen aufgezeigt werden.With the user feedback "matures" once in progress set inventive system. It will be in a later Ripe state possible be that the process produces concepts, hypotheses, and models by showing association chains with high weighting factors become. These hypotheses can with the help of the feedback from outside the system according to the invention checked and evaluated become. Furthermore you can this contradictions be shown in existing hypotheses and models.
f) Verfahrensdetailsf) process details
Ein direkter Zugriff auf und Suche in Ursprungsinformation beziehungsweise Information Grains ist möglich. Dies wird durch Standard-Datenbankverfahren gewährleistet.One direct access to and search in source information respectively Information Grains is possible. This is ensured by standard database procedures.
Bei der Präsentation von Ergebnissen können Daten, die aus gesicherten Quellen stammen, als Fakten gekennzeichnet dargestellt werden. Bei anderen Ergebnissen, die zum Beispiel auf Assoziationsketten beruhen, können Wahrscheinlichkeitswerte, die die Richtigkeit des Ergebnisses abschätzen, mit ausgegeben werden. Diese Wahrscheinlichkeitswerte können sich in einer bevorzugten Ausführungsform anhand der Gewichtungen der Pointer berechnen lassen. Dazu nimmt man zum Beispiel die höchste im Gesamtnetzwerk vorkommende Pointergewichtung und nimmt an, dass diese Gewichtung eine 95% Richtigkeit repräsentiert. Der Richtigkeitswert des betrachteten Pointers wird nun im Verhältnis dazu berechnet.at the presentation of results Data derived from trusted sources, identified as facts being represented. For other results, for example Can be based on association chains Probability values, which estimate the correctness of the result, with be issued. These probabilities can change in a preferred embodiment calculated using the weights of the pointers. Adds to that for example, the highest in the overall network occurring pointer weighting and assumes that this weighting represents a 95% correctness. The correctness value of the considered pointer is now calculated in relation to it.
Eine weitere bevorzugte Ausführungsform ist, über die Rückmeldungen von außerhalb des Systems einen Erfahrungswert für die Richtigkeit bei gegebenen Pointergewichtungen aufzubauen.A further preferred embodiment is over the feedback from outside of the system given an empirical value for the correctness Build pointer weights.
Das Verfahren kann eine Korrelation zwischen positiver Rückmeldung (richtige Antwort) und Pointergewichtung berechnen und diese für die Wahrscheinlichkeitsbestimmung der Richtigkeit zukünftiger Antworten verwenden.The method may have a correlation between positive feedback (correct answer) and pointer calculate weighting and use it to determine the probabilities of correctness of future answers.
Durch die Verknüpfung aller Glieder einer Assoziationskette über Pointer ist eine intrinsische Dokumentation gewährleistet. Die Begründung für das Aufzeigen einer Assoziation sind zu jeder Zeit für jeden Benutzer nachvollziehbar, da über die Pointer die Assoziationskette sowohl vorwärts als auch rückwärts nachvollzogen werden kann.By The link all members of an association chain via pointers is intrinsic Documentation guaranteed. The reasoning for the Showing an association are traceable at any time for each user, over there the pointers traced the chain of association both forward and backward can be.
Mögliche Verfahrensverfeinerungen Grain-WertigkeitsfaktorPossible process refinements Grain quality factor
In einer bevorzugten Ausführungsform wird für jedes Grain ein Wertigkeitsfaktor eingeführt, der die Wichtigkeit und Richtigkeit der durch das Grain repräsentierten Information anzeigt. Dieser Wertigkeitsfaktor fließt in die Berechnung der Assoziationskettengewichtung mit ein. Eine bevorzugte Berechnung dieses Wertigkeitsfaktors kann zum Beispiel durch die Addition aller Gewichtungen der von diesem Grain ausgehenden Information Pointer und anschließende Division durch die Anzahl der Information Pointer geschehen. Bei Knowledge Grains wird sowohl dieser Quotient für die Information Pointer als auch der Quotient für die Knowledge Pointer berechnet. Die Summe der Wertigkeitsfaktoren eines Knowledge Grain können entweder getrennt bewertet werden oder es wird der Mittelwert der beiden Quotienten gebildet.In a preferred embodiment is for Each grain introduced a weighting factor, the importance and Indicates correctness of the information represented by the grain. This weighting factor flows in the calculation of the association chain weighting. A For example, preferred calculation of this weighting factor by adding all the weights of the information coming from that grain Pointer and subsequent Division done by the number of information pointers. At Knowledge Grains will use both this quotient for the information pointer also the quotient for calculates the knowledge pointer. The sum of the weighting factors of a knowledge grain either be evaluated separately or it will be the mean of the formed two quotients.
In
einer weiteren bevorzugten Ausführungsform
wird die Anzahl der Pointer zur Bildung des Wertigkeitsfaktors des
Grains herangezogen. Es wird bevorzugt folgende Formel angewendet:
- W
- = Wertigkeitsfaktor des betrachteten Grains
- N
- = Anzahl der Pointer des betrachteten Grains
- W
- = Weighting factor of the considered grain
- N
- = Number of pointers of the considered grain
DistanzgewichtungDistance weighted
In einer bevorzugten Ausführungsform wird eine Distanzgewichtung der Assoziationen berechnet. Dies soll berücksichtigen, dass Assoziationsketten über N Grains hinweg um so unwahrscheinlicher werden, je mehr Grains in dieser Kette verbunden sind, wobei die Distanzgewichtung als globaler Faktor festgelegt, vom Benutzer eingeben oder vom erfindungsgemäßen System bzw. Verfahren selbst in Abhängigkeit von anderen Verfahrensparametern berechnet werden kann.In a preferred embodiment a distance weighting of the associations is calculated. This should consider, that chains of association over The more Grains, the more unlikely they become are connected in this chain, the distance weighting as set global factor, enter by the user or the system according to the invention or process itself depending can be calculated from other process parameters.
5.3 Analogieschlüsse5.3 Analogies
In einer bevorzugten Ausführung kann das Verfahren in einem späteren Reifezustand selbstständig Analogieschlüsse durchführen, indem es intern Assoziationsketten miteinander vergleicht. Dies kann zum Beispiel durch Rückverfolgung von Begriffsverwandtschaften der verschiedenen Seed Tables und Growth Tables der Knowledge Grains geschehen oder durch Vergleich aller von einem Information Grain ausgehenden Assoziationsketten.In a preferred embodiment can the procedure in a later Maturity automatically perform analogies by: it internally compares chains of associations. This can be for Example by tracing of Conceptual Affinities of Different Seed Tables and Growth Tables of Knowledge Grains happen or by comparison of all chains of information emanating from an information grain.
5.4 "Mutation" und "Kreativität"5.4 "Mutation" and "Creativity"
In einer bevorzugten Ausführungsform können durch Zufallsgeneratoren ausgewählte schwache oder nicht vorhandene Knowled ge Pointer verstärkt oder erzeugt werden. Dies führt zu neuen Assoziationsketten. Diese Ketten werden durch die Rückmeldung von außerhalb des erfindungsgemäßen Verfahrens auf sinnvolle und nicht sinnvolle Neuassoziationen selektiert. Eine weitere Selektion kann durch den Abgleich mit den Ursprungsinformationen erfolgen. Ein weiteres Mutationsprinzip kann die Veränderung der Wertigkeitsfaktoren der Knowledge Grains sein. Von entscheidenden Bedeutung ist bei allen Mutationen die Überprüfung der Richtigkeit durch Rückmeldungen von außerhalb des erfidnungsgemäßen Verfahrens bzw. System.In a preferred embodiment can selected by random number generators weak or nonexistent Knowled ge pointers reinforced or be generated. this leads to to new chains of association. These chains will be through the feedback from outside the method according to the invention selected for meaningful and meaningless new associations. A Further selection can be done by matching with the source information respectively. Another mutation principle may be the change of the weighting factors of the Knowledge Grains. Of decisive Importance of all mutations is checking for correctness feedback from outside the erfidnungsgemäßen method or system.
Mögliche RealisierungsformenPossible forms of realization
Das erfindungsgemäße Verfahren kann als Software, die auf optische und/oder magnetische Datenträger speicherbar ist, auf Computern realisiert werden.The inventive method can be stored as software on optical and / or magnetic disk is to be realized on computers.
Das Verfahren kann sowohl auf lokalen Computern als auch auf vernetzten Computern realisiert werden. Die vernetzten Computer können auch über Intra- oder Internet verbunden sein.The Procedures can be used both on local computers as well as on networked ones Computers are realized. The networked computers can also be accessed via intra- or Internet connected.
In einer weiteren bevorzugten Anwendungsform können die Algorithmen zur Generierung der Pointer und/oder die Algorithmen zur Berechnung der Assoziationskettengewichtung und/oder die Algorithmen in einem applikationsspezifischen Chip (ASIC) realisiert werden. Dieser ASIC wird auf einer Erweiterungsplatine in den Computer eingebracht.In In another preferred embodiment, the algorithms for generating the pointer and / or the algorithms for the calculation of the association chain weighting and / or the algorithms in an application specific chip (ASIC) can be realized. This ASIC will be on an expansion board introduced into the computer.
Eine weitere bevorzugte Anwendungsform ist die Realisierung in autonom agierenden Maschinen (Robotern). Dieser Roboter ist dann in der Lage, selbstständig assoziative Schlussfolgerungen durchzuführen.A Another preferred embodiment is the realization in autonomous operating machines (robots). This robot is then in the Location, independent to make associative conclusions.
Anwendungsgebieteapplication areas
Ein bevorzugte Anwendung für das erfindungsgemäße Verfahren ist die Informationsverarbeitung auf dem Gebiet der molekularen Biologie, einschließlich Biochemie, Genetik, Genomik, Proteomik, etc. Hier werden die zur Verfügung stehenden Datensammlungen und Datenbanken, einschließlich der Veröffentlichungen und Forschungsberichte als Ursprungsinformation in das Verfahren aufgenommen. Da speziell auf diesem Gebiet die Zunahme der Information überexponientiell verläuft, wird es unumgänglich sein, die Verarbeitung dieser Information und die Neu-Wissensgenerierung aus dieser Information heraus zu automatisieren. Das vorliegende Verfahren ist dazu in der Lage.One preferred application for the inventive method is the information processing in the field of molecular Biology, including Biochemistry, genetics, genomics, proteomics, etc. Here are the to disposal stationary data collections and databases, including the Publications and Research reports included as origin information in the process. Especially in this field, the increase of information is overexponient runs, it becomes inevitable be, the processing of this information and the generation of new knowledge to automate this information. The present Method is capable of doing so.
Selbstverständlich kann das vorliegende Verfahren genau so auf alle wissenschaftlichen Forschungsgebiete angewendet werden.Of course you can the present method applies equally to all scientific fields of research be applied.
Ein Spezialfall der wissenschaftlichen-technischen Anwendungsgebiete besteht in der Möglichkeit mit Hilfe des vorgestellten Verfahrens Simulationen komplex vernetzter Verfahrene durchzuführen.One Special case of scientific-technical fields of application exists in the possibility with the help of the presented method simulations complex networked To carry out the procedure.
Ein weiteres Anwendungsgebiet des vorgestellten Verfahrens liegt in der unternehmensweiten Informationsverarbeitung. Große Unternehmen besitzen eine nicht mehr zu überschauende Vielfalt von Einzelinformationen, Datensammlungen, Datenbanken, persönlichem Wissen etc. Als Ursprungsinformation in das vorgestellte System bzw. Verfahren eingegeben, wird es möglich aus dieser Information Wissen zu erzeugen, beziehungsweise neue Assoziationen und Relationen aufzuzeigen.One Another application of the presented method is in company-wide information processing. Large companies have a not to be overlooked Variety of individual information, data collections, databases, personal Knowledge etc. As source information in the presented system or procedure, it becomes possible from this information To generate knowledge, or new associations and relations show.
Ein Spezialfall der unternehmensweiten Anwendung ist der Einsatz in Verfahrenen zur Bearbeitung von technischen Kundenanfragen ("technical hotline"). Das Verfahren ermöglicht in der Anfangsphase den automatisierten Aufbau einer Antwortbiblio thek und in einer späteren Phase die zumindest teilweise vollautomatische Beantwortung der Anfragen. Dazu werden die Informationen über die zu betreuenden Produkte als Information Grain abgelegt und die Initialantworten erzeugen Knowledge Grains. Nach kurzer Zeit hat sich ein Assoziationsgeflecht aufgebaut, dass eine zielgerichtete Dokumentation der Anfragen und schließlich eine automatisierte Beantwortung ermöglicht.One Special case of enterprise-wide application is the use in Procedures for handling technical customer requests ("technical hotline"). The procedure allows in the initial phase, the automated construction of a response library and in a later one Phase at least partially fully automatic answering the Requests. This information about the products to be supported filed as information Grain and generate the initial answers Knowledge Grains. After a short time, there is an association network built that a targeted documentation of requests and after all allows an automated answer.
In
Claims (25)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10291392T DE10291392B4 (en) | 2001-02-15 | 2002-02-15 | Method, system and data carrier for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10107497 | 2001-02-15 | ||
DE10107497.2 | 2001-02-15 | ||
PCT/EP2002/001628 WO2002080096A2 (en) | 2001-02-15 | 2002-02-15 | Production of correlations, interactions and knowledge from scanned data records |
DE10291392T DE10291392B4 (en) | 2001-02-15 | 2002-02-15 | Method, system and data carrier for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10291392D2 DE10291392D2 (en) | 2003-12-24 |
DE10291392B4 true DE10291392B4 (en) | 2007-08-16 |
Family
ID=7674414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10291392T Expired - Fee Related DE10291392B4 (en) | 2001-02-15 | 2002-02-15 | Method, system and data carrier for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets |
Country Status (3)
Country | Link |
---|---|
AU (1) | AU2002308281A1 (en) |
DE (1) | DE10291392B4 (en) |
WO (1) | WO2002080096A2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0987639A1 (en) * | 1998-09-15 | 2000-03-22 | Canon Research Centre France S.A. | Management of a table of links between documents stored on a computer server and ordering and transfer of documents in a network |
WO2000072256A2 (en) * | 1999-05-24 | 2000-11-30 | Ipcentury Ag | Neuronal network for computer-assisted knowledge management |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594837A (en) * | 1993-01-29 | 1997-01-14 | Noyes; Dallas B. | Method for representation of knowledge in a computer as a network database system |
US5855011A (en) * | 1996-09-13 | 1998-12-29 | Tatsuoka; Curtis M. | Method for classifying test subjects in knowledge and functionality states |
DE19914326A1 (en) * | 1999-03-30 | 2000-10-05 | Delphi 2 Creative Tech Gmbh | Procedure for using fractal semantic networks for all types of databank applications to enable fuzzy classifications to be used and much more flexible query procedures to be used than conventional databank structures |
WO2001008096A1 (en) * | 1999-07-27 | 2001-02-01 | Prevail Corporation | Knowledge management system |
CA2381460A1 (en) * | 1999-08-06 | 2001-02-15 | James S. Wiltshire, Jr. | System and method for classifying legal concepts using legal topic scheme |
-
2002
- 2002-02-15 DE DE10291392T patent/DE10291392B4/en not_active Expired - Fee Related
- 2002-02-15 WO PCT/EP2002/001628 patent/WO2002080096A2/en not_active Application Discontinuation
- 2002-02-15 AU AU2002308281A patent/AU2002308281A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0987639A1 (en) * | 1998-09-15 | 2000-03-22 | Canon Research Centre France S.A. | Management of a table of links between documents stored on a computer server and ordering and transfer of documents in a network |
WO2000072256A2 (en) * | 1999-05-24 | 2000-11-30 | Ipcentury Ag | Neuronal network for computer-assisted knowledge management |
Also Published As
Publication number | Publication date |
---|---|
AU2002308281A1 (en) | 2002-10-15 |
WO2002080096A2 (en) | 2002-10-10 |
DE10291392D2 (en) | 2003-12-24 |
WO2002080096A3 (en) | 2003-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE602004003361T2 (en) | SYSTEM AND METHOD FOR GENERATING REFINEMENT CATEGORIES FOR A GROUP OF SEARCH RESULTS | |
DE69810457T2 (en) | SYSTEM AND METHOD FOR DYNAMICALLY PROCESSING AN INDEX FOR GENERATING A QUERY SET | |
DE3650417T2 (en) | Information recording and retrieval system. | |
DE69333422T2 (en) | Finding strings in a database of strings | |
DE202017007517U1 (en) | Aggregate characteristics for machine learning | |
EP1183619B1 (en) | Situation-dependent operating semantic n-order network | |
DE112010000947T5 (en) | Method for completely modifiable framework data distribution in the data warehouse, taking into account the preliminary etymological separation of said data | |
DE68927086T2 (en) | Data unification system and method | |
DE10035043A1 (en) | Building multi-dimensional indexing structure for use with linear optimising requests involves forming two convex envelopes of input data sets, some representing envelope apex points | |
DE102019212421A1 (en) | Method and device for identifying similar documents | |
DE10149693A1 (en) | Objects in a computer system | |
DE102021109468A1 (en) | HARDWARE ACCELERATOR WITH ANALOG-CONTENT ADDRESSABLE STORAGE (A-CAM) FOR DECISION TREE COMPUTING | |
WO2021104608A1 (en) | Method for producing an engineering proposal for a device or plant | |
EP1166228A2 (en) | Method for using fractal semantic networks for all kinds of data base appliances | |
EP3901713B1 (en) | Method and device for operating a technical system with optimal model | |
DE10291392B4 (en) | Method, system and data carrier for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets | |
DE19908204A1 (en) | Fractal n-th order network for handling complex structures | |
EP1516234A2 (en) | Information generation system for product formation | |
WO2020126217A1 (en) | Method, arrangement and use for producing a response output in reply to voice input information | |
EP3637354A1 (en) | Method for operating an electronic apparatus having an optimum program code | |
EP4390808A1 (en) | Method and system for handling product-specific information for a product system | |
DE102022211634A1 (en) | Orchestrator-based research and development system and method for its operation | |
EP4160446A1 (en) | Capability analysis of a component within an industrial automation system | |
DE112022005144T5 (en) | Automated design of process automation systems | |
DE102020212317A1 (en) | System for providing data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law |
Ref document number: 10291392 Country of ref document: DE Date of ref document: 20031224 Kind code of ref document: P |
|
8139 | Disposal/non-payment of the annual fee | ||
8170 | Reinstatement of the former position | ||
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |