Nothing Special   »   [go: up one dir, main page]

DE60120822T2 - Meta-Dokument und Verfahren zum Verwalten von Meta-Dokumenten - Google Patents

Meta-Dokument und Verfahren zum Verwalten von Meta-Dokumenten Download PDF

Info

Publication number
DE60120822T2
DE60120822T2 DE60120822T DE60120822T DE60120822T2 DE 60120822 T2 DE60120822 T2 DE 60120822T2 DE 60120822 T DE60120822 T DE 60120822T DE 60120822 T DE60120822 T DE 60120822T DE 60120822 T2 DE60120822 T2 DE 60120822T2
Authority
DE
Germany
Prior art keywords
document
service
meta
want
document service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60120822T
Other languages
English (en)
Other versions
DE60120822D1 (de
Inventor
James Shanahan
Gregory Grefenstette
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Application granted granted Critical
Publication of DE60120822D1 publication Critical patent/DE60120822D1/de
Publication of DE60120822T2 publication Critical patent/DE60120822T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Description

  • Diese Erfindung betrifft im Allgemeinen die Verwaltung und Verwendung von Dokumenten, und im Besonderen betrifft die Erfindung die Verwaltung und Verwendung von Dokumenten, die als unabhängige „Agents" agieren und Informationsabforderungen generieren und Antworten suchen, bereitstellen und packen.
  • Wissensverwaltung durch Dokumentenverwaltung ist ein wichtiger Teil des Wissensschaffens- und -teilensprozesses. Ein typisches Modell des Wissensschaffens und -teilens ist zyklisch und besteht aus drei Hauptschritten: Synthetisieren (Suchen, Sammeln, Erfassen und Assimilieren), Teilen (Präsentieren, Publizieren/Verteilen) und Bereitstellen (Dokumentennutzung zur Entscheidungsfindung und für innovative Kreativität vereinfachen). Gegenwärtig werden Dokumente als statische Objekte betrachtet, die neue Inhalte nur dann erhalten, wenn sie von einem autorisierten Benutzer bearbeitet werden. Damit das Dokument neue Informationen erlangen kann, muss ein Benutzer die Entscheidung getroffen haben, das Dokument zu lesen und zu verändern oder es mit einem Programm zu bearbeiten, das den Inhalt des Dokuments verändert (beispielsweise durch Hinzufügen von Hyperlinks).
  • Diese Betrachtungsweise eines Dokuments als passiver Informationsspeicher führt zu der aktuellen Situation, in der die meisten Computer ungenutzt sind und Dokumente auf Festplatten lagern, sofern nicht ein Benutzer am Bildschirm sitzt und das System bedient. Anstatt zu versuchen, etwas Sinnvolles zu tun oder eine Vorhersage zu versuchen, was der Benutzer möglicherweise im Zusammenhang mit einem Dokument sehen möchte, liegen Dokumente brach und tun auf inaktiven Computern gar nichts.
  • Sowohl agentbasierte Systeme als auch inhaltsbasierte Bereitstellungssysteme ermöglichen eine gewisse Informationsverwaltung ohne Zutun des Benutzers. Ein Agent ist ein Softwareprogramm, das einen Dienst ausführt, wie beispielsweise den Benutzer daran zu erinnern, dass eine bestimmte Tätigkeit an einem bestimmten Tag ausgeführt werden muss, oder eingehende Daten zu überwachen und einen Alarm auszulösen, wenn eine Mitteilung eingegangen ist, oder in elektronischen Netzwerken nach Informationen su chen. Ein intelligenter Agent ist in der Lage, über Informationen, die er gefunden hat, Entscheidungen zu treffen. Beide Systeme betrachten jedoch Dokumente als feststehende und statische Dateneinheiten.
  • Viele Produkte stellen verschiedene Lösungen für individuelle Aspekte des Gesamtproblems der Wissensverwaltung bereit: antizipatorische Dienste, unstrukturierte Informationsverwaltung und Visualisierung von Informationen und Wissen. So ist beispielsweise Watson, ein Programm von InfoLab der University of Northwestern, ein Programm, das arbeitet, während ein Benutzer ein Dokument erstellt. Während der Benutzer arbeitet, stellt Watson Informationen bereit, aus denen der Benutzer für weitere Untersuchungen auswählen kann. Die von Watson bereitgestellten Informationen stammen von einem einzigen Dienstanbieter, und Watson speichert die bereitgestellten Informationen in einem mit Watson verknüpften Speicher.
  • Onlinedienste wie Amazon.com bieten zBubbles an, das in einer Menüleiste oben im Browserfenster erscheint. Die zBubble bewegt sich zusammen mit dem/der Benutzer/in durch das Internet, während er/sie einkauft, und weist ihn/sie auf die besten Angebote und Produkte in der Umgebung hin. Der Dienst „What's related" von Netscape funktioniert mit dem Browser; er begleitet den/die Benutzer/in beim Surfen, bietet dabei nützliche Informationen über die betrachteten Seiten und schlägt verwandte Seiten vor. „Parabolic Tree" von Inxight ist ein Beispiel für ein System, das unstrukturierte Informationen organisiert und sie in einem intuitiven Format präsentiert: dem hyperbolischen Baum (Hyperbolic Tree). Alle diese Dienste behandeln Dokumente als statische Objekte.
  • Verschiedene Produkte wie beispielsweise kommerzielle Suchmaschinen liefern unstrukturierte Informationen wie beispielsweise Webseiten, Dokumente, E-Mails und dergleichen (deren Inhalt aus Text, Bildern, Video oder Ton bestehen kann). Typische Verwaltungsdienste für unstrukturierte Informationen enthalten: Suchen und Bereitstellen; Navigieren und Browsen; Extrahieren des Inhalts, Themenidentifikation, Kategorisierung, Zusammenfassen und Indexierung; Organisieren von Informationen durch automatisches Verlinken und Erstellen von Taxonomien; Erstellen von Benutzerprofilen durch Verfolgen, was ein Benutzer liest, worauf er zugreift oder was er erstellt; Erstellen von Gemeinschaften und dergleichen.
  • Fredriksson, M. und Svahnberg, M: „Fargo: Technical Description", University College von Karlskrona/Ronneby, 1997, offenbart das Konzept von aktiven Dokumenten, die eine Reihe von Eigenschaften besitzen, einschließlich einer Behältereigenschaft, in dem das Dokument selbst sowie Attribute des Dokuments wie beispielsweise Titel, Autoren und Erstellungsdatum enthalten sind, einer Aktionseigenschaft, die etwas Nützliches tut, und einer Ereigniseigenschaft, die, wenn sie ein Ereignis erhält, dieses an die Aktionseigenschaft weiterleitet. Es besteht ein Bedarf, die Fähigkeiten intelligenter Dokumente dieser Art zu erweitern.
  • Das Patent US-A-5999929 beschreibt die Bereitstellung einer Webseite mit Hilfe eines Browsers, die Webseite enthält bestimmte Links. Ein Linkabfrage-Daemon initiiert danach die Bereitstellung von damit im Zusammenhang stehenden Informationen aus einem Link-Empfehlungssystem für einige der Links auf der angezeigten Webseite. Die Informationen im Zusammenhang mit dem Link werden anschließend einem Bediener angezeigt, der somit auf Webseiten zugreifen kann, die den im Zusammenhang stehenden Links entsprechen.
  • In Übereinstimmung mit einem ersten Aspekt der vorliegenden Erfindung umfasst ein System zum Erlangen von Informationen mit Bezug auf ein Dokument, das Informationen enthält, folgende Teile:
    ein Meta-Dokument, umfassend das Dokument und eine Reihe von Dokumentendienstabforderungen, die dem Dokument zugeordnet sind, wobei ein Dokumentendienst einen Prozess zum Verwenden eines Teils des Informationsinhaltes als Ausgangspunkt zum Erhalten anderer Informationen mit Bezug auf diesen Inhalt umfasst; und
    ein Steuerprogramm zum Auswählen einer Dokumentendienstabforderung aus der Reihe, zum Initialisieren und Verwalten der Datenkommunikation mit einem Dienstanbieter, um den ausgewählten Dokumentendienst zu erfüllen, dadurch gekennzeichnet, dass das Steuerprogramm eingerichtet ist, das Meta-Dokument periodisch für Dokumentendienstabforderungen aufzurufen, eine Dokumentendienstabforderung aus der Reihe von Dokumentendienstabforderungen auszuwählen, und die Datenkommunikation mit einem Dienstanbieter zu initiieren und zu verwalten, um die ausgewählte Dokumentendienstab forderung zu erfüllen, und jedwede Ergebnisse der ausgewählten Dokumentendienstabforderung in das Meta-Dokument zu integrieren.
  • In Übereinstimmung mit einem zweiten Aspekt der vorliegenden Erfindung enthält ein Verfahren zum Erlangen von Informationen mit Bezug auf ein Dokument, das Informationen enthält, folgende Schritte:
    das Zuordnen einer Reihe von Dokumentendienstabforderungen zu dem Dokument, wobei ein Dokumentendienst einen Prozess zum Verwenden eines Teils des Informationsinhalts als Ausgangspunkt zum Erhalten weiterer Informationen mit Bezug auf diesen Inhalt umfasst, und
    Veranlassen, dass ein Steuerprogramm eine Dokumentendienstabforderung aus der Reihe auswählt und die Datenkommunikation mit einem Dienstanbieter initiiert und verwaltet, um die ausgewählte Dokumentendienstabforderung zu erfüllen; dadurch gekennzeichnet, dass das Steuerprogramm das Meta-Dokument periodisch für Dokumentendienstabforderungen aufruft, eine Dokumentendienstabforderung aus der Reihe von Dokumentendienstabforderungen auswählt und die Datenkommunikation mit einem Dienstanbieter initiiert und verwaltet, um die ausgewählte Dokumentendienstabforderung zu erfüllen, und jedwede Ergebnisse der ausgewählten Dokumentendienstabforderung in das Meta-Dokument integriert.
  • Ein System entsprechend der Erfindung beseitigt die Nachteile früherer Systeme, indem es Dokumente als aktive Agents im Wissensschaffens- und -teilensprozess betrachtet. Ein Meta-Dokument entsprechend der Erfindung ist ein aktiver Agent im Wissensschaffens- und -teilensprozess und arbeitet ohne Benutzerintervention, es sucht und sammelt Informationen und fügt diese dem Originaldokument hinzu. Da das Meta-Dokument keine Benutzerintervention benötigt, um dem Dokument Wissen hinzuzufügen, kann es arbeiten, während sich der Computer im Leerlauf befindet.
  • Ein Dokumentendienst ist ein Prozess, der einen Teil des Dokumenteninhaltes als Ausgangspunkt verwendet, um weitere Informationen mit Bezug auf diesen Inhalt zu erhalten. Ein Steuerprogramm aktiviert und verwaltet die Dokumentendienstabforderungen, indem es die Erfüllung eines ausgewählten Dokumentendienstes von einem Dienstan bieter abfordert, den Status der Dokumentendienstabforderungen aktualisiert und jedwede Ergebnisse aus einem erfüllten Dokumentendienst integriert.
  • Vorzugsweise wird die Reihe von Dokumentendienstabforderungen aus einer Gruppe von vorher zusammengestellten Dokumentendienstabforderungen ausgewählt. Wenn die Reihe von Dokumentendienstabforderungen auf einem Thema oder Kontext basiert, wird sie „Persönlichkeit" genannt. Das Wort Persönlichkeit wird verwendet, weil das Anwenden unterschiedlicher Reihen von Dokumentendienstabforderungen auf dasselbe Dokument auch unterschiedliche Ergebnisse hervorrufen wird (das heißt, unterschiedliche Links und Verbindungen), genau so, wie Personen mit unterschiedlichen Persönlichkeiten auf dieselbe Situation unterschiedlich reagieren. Beispiele für ausgewählte Persönlichkeiten sind TechWatch (Technik-Überwachung), Scientific (Wissenschaftlich), Patent Attorney (Patentanwalt), Fiction Reader (Romanleser). Je nach intendiertem Thema oder Kontext können jedoch viele unterschiedliche Arten von Persönlichkeiten erstellt werden.
  • Dokumentendienstabforderungen können asynchron aktiviert werden, in vielen Fällen kann jedoch eine gewisse Zeitspanne erforderlich sein, um eine Dokumentendienstabforderung zu erfüllen. Einige Dokumentendienste können sich nach Beendigung abschalten, andere können von Zeit zu Zeit oder periodisch reaktiviert werden. Das Steuerprogramm kann den Zeitplan für die Aktivierung der Dokumentendienstabforderungen festlegen. Alternativ dazu kann ein Benutzer eine Aktivierungszeit oder einen Zeitplan für eine Dokumentendienstabforderung im Vorfeld auswählen.
  • Das Meta-Dokument, das Steuerprogramm und die Dienstanbieter können sich am selben Ort oder an verschiedenen Orten befinden. In einigen Fällen kann sich das Steuerprogramm im Meta-Dokument selbst befinden. In diesem Beispiel muss das Steuerprogramm durch einen externen Dienst initiiert werden, wie beispielsweise dann, wenn der Benutzer das Meta-Dokument öffnet, oder es kann so eingestellt sein, dass es das Meta-Dokument periodisch initiiert. In einem Ausführungsbeispiel befindet sich das Steuerprogramm auf einem Meta-Dokumentenserver, der Schreibzugriffsrechte auf alle aktivierten Meta-Dokumente hat. Ein Systemadministrator für den Server startet das Steuerprogramm und hält es in Betrieb.
  • Das System kann zusätzlich zu einer Liste vorher ausgewählter Persönlichkeiten eine Liste verfügbarer Dokumentendienstabforderungen zum Auswählen durch den Benutzer enthalten. Typischerweise wählt das Steuerprogramm einen Dienstanbieter aus, um den ausgewählten Dokumentendienst zu erfüllen, jedoch kann auch der Benutzer bevorzugte Dienstanbieter für die Erfüllung spezieller Dokumentendienste festlegen. Alternativ dazu können Dienstanbieter ihre Verfügbarkeit für das System zur Bereitstellung bestimmter Dokumentendienste registrieren lassen.
  • Mit der Erfindung werden Dokumente von einer Push-Technologie, wobei Inhaltselemente in einer von einem Benutzer festgelegten Reihenfolge und Geschwindigkeit an das Dokument gesendet werden, zu einer Pull-Technologie umgewandelt, wobei das Dokument jedes Element individuell anfordert. Anstatt eine auf den Benutzer ausgerichtete Ansicht eines Dokuments oder einer Dokumentensammlung zu erstellen, stellt die Erfindung eine auf das Dokument ausgerichtete Metapher bereit, die wir „Dokumentenseele" nennen, und für die man davon ausgeht, dass jedes Dokument eine „Seele" besitzt, in der Form, dass die Dokumentenseele danach strebt, unter dem Blickwinkel des dem Dokument eigenen Inhaltes ein Abbild der Welt zu erschaffen.
  • Statische Dokumente bestehen im Allgemeinen aus dem Inhalt und Metadaten wie beispielsweise Größe, Eigentümer, Datum der Erstellung durch den Eigentümer und dergleichen. Das Meta-Dokument der Erfindung erweitert diese traditionelle Ansicht von einem Dokument unter dem Blickwinkel der auf das Dokument ausgerichteten Metapher, nämlich der Dokumentenseele, um verschiedene anthropomorphe und intelligente Verhaltensweisen. Diese Verhaltensweisen (die durch Aktivierung bestimmter Dokumentendienstabforderungen bereitgestellt werden) enthalten: die Fähigkeit, seine Inhalte zu verstehen und zu beschreiben, die Fähigkeit zu kommunizieren, die Fähigkeit zu lernen und sich an veränderte Umgebungen/Situationen anzupassen, und die Fähigkeit, dem Benutzer bei der Inhaltserstellung behilflich zu sein. Diese Verhaltensweisen (die durch die Reihe von Dokumentendienstabforderungen implementiert werden) verwandeln ein Dokument von einer Ansammlung statischer Daten in einen intelligenten Dokumentassistenten mit verschiedenen Verantwortlichkeiten gegenüber seinen Autoren und gegenüber den Gesellschaften von Dokumenten, in denen es existiert. Wenn die Verhaltensweisen, das heißt, die Reihe von Dokumentendienstabforderungen, die dem Dokument zugeordnet sind, so ausgewählt wurden, dass sie ein gemeinsames Thema haben, dann wird das Meta-Dokument, um bei der Metapher zu bleiben, zu einer Dokumentenseele mit einer besonderen Persönlichkeit.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist eine schematische Darstellung eines Meta-Dokuments entsprechend der Erfindung;
  • 2 ist eine schematische Darstellung eines Systems entsprechend der der Erfindung;
  • 3 ist ein Diagramm eines Systems entsprechend der Erfindung; und
  • 4 ist ein Diagramm eines Meta-Dokuments und seiner entsprechenden Darstellung als DOM-Baum.
  • In 1 ist ein Blockdiagramm eines Meta-Dokuments oder einer Dokumentenseele 100 dargestellt. Das Meta-Dokument 100 umfasst einen Inhaltsteil 10, der ein von einem Benutzer erstelltes oder von einem Benutzer erhaltenes Dokument ist, und eine Reihe 20 von einer oder mehreren Dokumentendienstabforderungen 12. Innerhalb des Bezugssystems Dokumentenseele wird das Dokument als das Ergebnis eines Wissenskristallisierungsprozesses betrachtet, der sich über die gesamte Lebensdauer des Dokuments hinweg erstreckt. Typischerweise beginnt das Leben eines Dokuments mit einem Brennpunkt und einem Ziel, was dabei behilflich ist, die Abtastphase zu richten und zu verfeinern. Die Abtastphase besteht aus Handlungen wie beispielsweise dem Suchen, Sammeln, Assimilieren und Organisieren von Informationen, die sich als für das Dokument von Bedeutung erweisen könnten. Diese Aktionen werden durch die Aktivierung von einer oder mehreren Dokumentendienstabforderungen 12 ausgelöst. Dokumentendienstabforderungen 12 können aktiviert werden, während der Benutzer ein Meta-Dokument 100 erstellt oder daran arbeitet, oder wenn der Benutzer das Meta-Dokument 100 nicht bearbeitet, so dass er von nicht genutzter Rechenzeit profitieren kann. Wenn die Dokumentendienstabforderungen 12 aktiviert sind oder werden, während der Benutzer am Dokument arbeitet, dann kann die Dokumentenseele etwas über die Vorlieben des Benutzers lernen.
  • Dokumentendienstabforderungen 12 können durch ein Steuerprogramm oder durch den Benutzer aktiviert werden.
  • Der nächste Schritt im Zyklus betrifft das Teilen der Informationen mit anderen. Dies besteht typischerweise darin, die im vorigen Schritt gesammelten Informationen in einem Format auszuformulieren/zu verfeinern (das bedeutet, die gesammelten Informationen wieder in den Inhaltsteil 10 des Meta-Dokuments zu integrieren), das für den Benutzer (Person, Gemeinschaft, Suchmaschine) von Nutzen ist, und sie zu veröffentlichen. Der letzte Schritt im Zyklus beschäftigt sich mit der Unterstützung, wobei das Meta-Dokument vordefinierte Dienste für den Benutzer ausführt. So kann das Dokument beispielsweise eine aktuelle Karte der Orte führen, an denen das Dokument in Form von anderen Dokumenten in der Welt existiert.
  • In Bezug auf 2 wird ein oder werden mehrere Meta-Dokumente 100 mit einer Reihe von Dokumentendienstabforderungen ausgerüstet, die das Meta-Dokument 100 unter der Steuerung eines Steuerprogramms oder eines Steuerprogramm-Daemons 200 ausübt, das/der das Meta-Dokument in Übereinstimmung mit einem vorher festgelegten Zeitplan reaktiviert. Das Steuerprogramm (oder der Daemon) 200 kann in einen Softwaremechanismus implementiert sein, der auf die Reihe 20 von Dokumentendienstabforderungen 12 in einem Meta-Dokument 100 zugreift, auswählt, welche Abforderungen 12 abgearbeitet werden, Dienstanbieter 210 zur Erfüllung dieser Abforderungen aufruft und die Ergebnisse wieder in das Originaldokument 10 integriert. Beim Reaktivieren zeigt das Meta-Dokument seine aktuelle Liste von Dokumentendienstabforderungen 20 für das Steuerprogramm an. Der Daemon 200 wählt die zu erfüllende Dokumentendienstabforderung 12 entsprechend den dem System zur Verfügung stehenden Ressourcen (beispielsweise Dienstanbieter, die eine spezielle Dokumentendienstabforderung erfüllen oder ausführen können) aus. Das Erfüllen einer Dokumentendienstabforderung bedeutet, auf einen Dienstanbieter 210 zuzugreifen, der einen Prozess (oder ein Programm) ausführt, der/das Zugriff auf den Dokumenteninhalt und seine Umgebung hat. Dieser Prozess endet dadurch, dass dokumentspezifisches Wissen und möglicherweise neue Dokumentendienstabforderungen 12 generiert werden, die dem Meta-Dokument 100 durch das Steuerprogramm 200 hinzugefügt werden.
  • Sowohl die Dokumentendienstabforderungen des Meta-Dokuments als auch das daraus resultierende Wissen können als XML-Metadaten dargestellt werden, die dem Dokument am Ende jedes Reaktivierungszyklus hinzugefügt werden. In einem Ausführungsbeispiel werden die Dokumentendienstabforderungen des Meta-Dokuments als XML-Felder ausgedrückt: <WANT> ... </WANT>. So kann ein Dokumentendienst beispielsweise wie folgt ausgedrückt werden: <WANT> who-am-i </WANT>.
  • Um diese Dokumentendienstabforderung zu erfüllen, ruft der Daemon einen „who-am-i"(Wer bin ich)-Prozess auf. Dieser Prozess verwendet den Dokumenteninhalt und seine Umgebung als Eingangsdaten. So kann der „who-am-i"-Prozess beispielsweise den Dateinamen des Dokuments ausgeben und zusätzliche Dokumentendienstabforderungen auslösen, um in Erfahrung zu bringen, wer das Dokument erstellt hat und wo es sich befindet. Der Daemon markiert den ersten Dokumentendienst als erfüllt oder löscht ihn aus dem Dokument und fügt das zusätzliche Wissen ein, das von dem Prozess ausgegeben wurde, der den Dokumentendienst erfüllt hat. In diesem Fall werden dem Ausgangsdokument folgende drei Zeilen hinzugefügt:
    <MYNAME> xerox.txt </MYNAME>
    <WANT> who-made-me <WANT>
    <WANT> where-am-i </WANT>
  • In jedem Reaktivierungszyklus kann ein Meta-Dokument neue Metadaten und neue Dokumentendienstabforderungen als Funktion von bereits ausgeführten Dokumentendienstabforderungen erhalten. Einige Dokumentendienstabforderungen können Metadaten hinzufügen und dieselbe Dokumentendienstabforderung replizieren. Einige Dokumentendienstabforderungen können Metadaten löschen, sobald sie erfüllt wurden. Im Allgemeinen entsprechen Dokumentendienstabforderungen Diensten, die dem Dokument Metadaten hinzufügen, basierend auf der Existenz des Dokuments als Datei innerhalb eines Dateisystems; basierend auf dem Inhalt des Dokuments, so, wie es ursprünglich erstellt wurde; und basierend auf dem Inhalt der Metadaten, die dem Dokument durch einen anderen Prozess hinzugefügt wurden. Wenn das Dokument selbst oder sein Ort verändert werden, kann es sein, dass das Wissen im Dokument regene riert oder geändert werden muss. Manches Wissen, wie beispielsweise die Beziehung der Inhalte des Dokuments zu anderen Dateien im Intranet oder zu im Internet gefundenen Dokumenten, muss unter Umständen periodisch aktualisiert werden, möglicherweise durch eine <WANT> continuous-education <WANT>-Dokumentendienstabforderung.
  • Dokumentenseelen bieten durchgehende Lösungen für auf Dokumenten basierendes Wissensschaffen und -teilen. Wird einem Dokument eine „Seele" hinzugefügt, kann das Dokument dem Benutzer beim Erlangen, Teilen und Verwenden von Wissen behilflich sein; die Dokumentenseele erstellt eine Ansicht des Dokuments von der Welt im Gegensatz zur allgemeinen Ansicht wie beispielsweise in aktuellen Webportalen. Dokumentenseelen können so erstellt werden, dass sie eine Persönlichkeit besitzen. Jede Persönlichkeit codiert eine Sammlung von Dokumentendiensten, mit denen das Dokument unabhängig für seinen Autor oder Leser agieren, die Informationsbedürfnisse sowohl des Schreibers als auch des Lesers des Dokuments antizipieren und das Dokument aktuell und mit dem Rest der Informationswelt verknüpft halten kann. Eine Persönlichkeit ist eine vorher festgelegte Reihe von Dokumentendienstabforderungen. Ein Dokument kann beispielsweise eine wissbegierige Persönlichkeit und damit eine Reihe von Dokumentendienstabforderungen erhalten, um weitere Informationen über im Dokumenteninhalt vorhandene Konzepte oder Biographien von im Inhalt erwähnten Personen zu finden, es kann eine polyglotte Persönlichkeit erhalten und Übersetzungen für die Wörter, Termini und Sätze suchen, die im Dokument enthalten sind, es kann eine Privatpersönlichkeit erhalten, die darauf bedacht ist, die Metadaten des Dokuments für andere Dokumente unsichtbar zu halten, es kann eine wissenschaftliche Persönlichkeit erhalten und nach Online-Versionen der im Dokumenteninhalt genannten Aufsätze suchen, oder es kann eine genealogische Persönlichkeit erhalten und nach Dokumenten suchen, die denselben Inhalt haben wie es selbst.
  • Innerhalb des Bezugssystems der Dokumentenseele wird das Dokument als das Ergebnis eines Wissenskristallisierungsprozesses betrachtet, der über die gesamte Lebensdauer des Dokuments anhält. Typischerweise beginnt das Leben einer Dokumentenseele mit einem Brennpunkt und einem Ziel, wodurch die Synthesephase besser ausgerichtet und verfeinert werden kann. Während der Synthesephase antizipiert die Dokumentenseele die Informationsbedürfnisse des Schreibers, entweder unabhängig (über eine vorher festgelegte Reihe von Dokumentendienstabforderungen) oder durch das Befolgen spezieller oder benutzerdefinierter Anweisungen. Die Dokumentenseele führt die manchmal ermüdenden Aufgaben des Suchens, Sammelns und Organisierens von für den Dokumenteninhalt relevanten Informationen durch, um dadurch die Assimilierung von Fachgebieten zu erleichtern, Vorschläge unterbreiten zu können und die Kreativität/den Erfindungsreichtum zu unterstützen.
  • Das System der Dokumentenseelen stellt verschiedene Dienste bereit, die den Benutzer beim Formulieren/Verfeinern der im vorherigen Schritt gesammelten Informationen in ein Format unterstützen, das für den Leser (Person, Gemeinschaft, Suchmaschine) von Nutzen ist, und sie schließlich zu veröffentlichen (für eine Gruppe, einen wissenschaftlichen Indexierungsdienst und dergleichen).
  • Das System der Dokumentenseelen stellt verschiedene Dienste bereit, die für die Besitzer oder Leser von Dokumenten agieren, indem sie beispielsweise das Informationsnetz eines Unternehmens oder der Welt (WWW) aus der Dokumentenperspektive überwachen und den Leser über den aktuellen Zustand der Dinge auf dem Laufenden halten. Dies kann als Mittel zur Unterstützung verschiedener Prozesse betrachtet werden: Assimilieren des Dokuments, Auslösen von Innovationen oder Entscheidungsfindung und dergleichen. Darüber hinaus kann dies als Mittel eingesetzt werden, um das Interesse an einem Dokument zu wecken, wobei das Dokument sich selbst bewirbt. Dokumente, die innerhalb des Systems der Dokumentenseelen leben, können beispielsweise verfügbare Rechenzeit von Computern, verfügbare Netzwerkbandbreite und internetbasierte Ressourcen nutzen, um die Bedürfnisse des Benutzers zu antizipieren und zu befriedigen.
  • Die Dokumentendienstabforderung kann als Metadaten an ein Dokument angehängt werden. Es gibt unterschiedliche Standards zum Anfügen von Metadaten, beispielsweise können DOM (Document Object Model) und XML (eXtended Markup Language) genutzt werden. Das Steuerprogramm der Dokumentenseele ruft die Meta-Dokumente ab, entschlüsselt die Codierung für jedes Meta-Dokument, erkennt Dokumentendienstabforderungen, wählt mit einem parametrierbaren Auswahlverfahren eine Dienstanforderung aus, initiiert die Kommunikation mit einem (möglicherweise Dritt-)Dienstanbieter, der diese Anfrage auszuführen bereit ist, überwacht den Dienstanbieter und sendet Parame ter an ihn, empfängt die Ausgangsdaten von diesem Dienstanbieter und integriert die erhaltenen Ergebnisse der Dienstabforderung als Metadaten in das Meta-Dokument. Auch andere Funktionen können in das System der Dokumentenseelen implementiert werden: ein Koordinierungssystem, das die gleichzeitige Ausführung der für das Steuerprogramm beschriebenen Funktionen regelt, ein Visualisierungs- und Interaktionssystem, mit dem verschiedene Stufen der Anzeige von und Interaktion mit durch Metadaten erweiterten Dokumenten möglich ist, und ein Lernsystem, das durch Beobachtung der Benutzerinteraktionen lernt.
  • Einige Dokumentendienstabforderungen können viel Zeit in Anspruch nehmen (beispielsweise das Auffinden aller Namen von Unternehmen auf einer Seite und Zugreifen auf alle Internetseiten, auf denen zwei dieser Namen zusammen genannt werden). Andere Dokumentendienste können nur periodisch erfüllbar sein (beispielsweise das Auffinden des Schlusskurses einer Aktie). Andere Dokumentendienste können Metadaten und zusätzliche Dokumentendienstabforderungen ausgeben. Die von aufeinander folgenden Abfragen erzeugten Dokumentendienste definieren die Dokumentenseele genauer.
  • Ein Meta-Dokument hat Zugriff auf eine gewisse Menge ungenutzter Bandbreite, die aktuell auf Rechnern verschwendet wird. Anstatt untätig in einem beliebigen Ordner zu liegen, folgt ein Meta-Dokument einem durch seine Persönlichkeit (Reihe von Dokumentendienstabforderungen) festgelegten Pfad, wenn es von einem Steuerprogramm aktiviert wird, das mit einem Dienstanbieter kommuniziert, um den Dokumentendienst zu erfüllen, und greift auf das lokale Dateisystem, eine Datenbank oder das Internet zu, um neue Verbindungen zwischen seinen Inhalten und seiner Umgebung zu erstellen.
  • Die Größe von Meta-Dokumenten nimmt in dem Maße zu, in dem Metadaten und neue Inhalte erzeugt und neue Verbindungen hergestellt werden. Speicherplatz wird zunehmend zu einer vernachlässigbaren Größe. Aktuelle Entwicklungen besagen, dass in zehn Jahren ein Terabyte Speicherplatz nur noch etwa 120 USD kosten wird, dieser Platz wäre ausreichend, um den gesamten Text der amerikanischen Library of Congress zu speichern. Meta-Dokumente können auch ungenutzte Prozessorzeit nutzen. Man schätzt, dass im Jahr 1999 die weltweit existierenden Hunderte von Millionen Computern nur etwa 10% der Zeit aktiv waren. Ebenso wird die Bandbreite im Internet immer weiter erhöht, damit Bilder und Videos in Echtzeit übertragen werden können. Die meisten Meta-Dokumente werden nur damit beschäftigt sein, Text durch das Internet zu bewegen, und dafür nur einen kleinen Bruchteil des Platzes benötigen, der bereitgestellt wurde, um Bilder aufzunehmen.
  • Beispiel: Umwandlung eines Dokumentes von Dritten in ein Meta-Dokument
  • Es ist 17:00 Uhr. Ein Benutzer hat soeben von einem Kollegen über E-Mail ein Dokument über ein neues Unternehmen erhalten. Der Benutzer wirft einen schnellen Blick darauf. Da der Benutzer von dem Unternehmen noch nichts gehört hat und die Namen der Personen auch nicht erkennt, klickt er das Dokument an und zieht es auf das Symbol für die Dokumentenseele „TechWatch-Persönlichkeit" auf seinem Bildschirm, schaltet das Licht aus und verlässt das Büro für diesen Tag.
  • Währenddessen hat das empfangene Dokument eine TechWatch-Persönlichkeit erhalten und ist dadurch zu einem Meta-Dokument geworden. Es beginnt damit, Informationen über dieses Unternehmen zu sammeln, die den Benutzer interessieren könnten. Das Meta-Dokument des Benutzers wird durch das Zuordnen der TechWatch-Persönlichkeit aktiv, es hat somit eine Reihe von unerfüllten Dokumentendienstabforderungen erworben, die in dieser Persönlichkeit definiert sind. Ein Steuerprogramm beginnt damit, dieses Meta-Dokument aufzurufen und aus der Liste der nicht erfüllten Dokumentenabforderungen eine auszuwählen. Eine Abforderung besteht darin, alle Unternehmensnamen, Produkte und Personen zu identifizieren, die in diesem Dokument erwähnt werden. Die Abforderung wird an einen Dokumentendienstanbieter wie beispielsweise eine Form des ThingFinder von Inxight weitergeleitet. Wenn diese Abforderung erfüllt ist, platziert der Dokumentenanalysator XML-Tags um die identifizierten Elemente und erstellt Listen von Personen, Produkten und Unternehmen. Eine darauf folgende Dokumentenabforderung verwendet diese Metadaten, um im Internet nach Homepages der genannten Unternehmen zu suchen. Diese Abforderung wiederum gibt URLs zu den Webseiten der Unternehmen aus, die ebenfalls als Metadaten oder als neuer Dokumenteninhalt (als Fußnote oder Referenz) gespeichert werden.
  • Ein anderer Dienstanbieter verwendet diese URLs, erstellt eine neue Dokumentendienstabforderung und findet Organigramme dieser Unternehmen im Internet, ein weite rer Dienstanbieter, der auf eine andere Dokumentendienstabforderung reagiert, sucht nach aktuellen Aktienkursen für jedes der Unternehmen. Ein anderer Dienstanbieter, der auf eine andere Dokumentendienstabforderung reagiert, sucht nach offenen Stellen in jedem Unternehmen. Ein anderer Dienstanbieter, der auf eine andere Dokumentendienstabforderung reagiert, sucht Pressemitteilungen, die von einem der Unternehmen herausgegeben wurden und in denen ein anderes der Unternehmen aus der Liste erwähnt wird. Ein anderer Dienstanbieter, der auf eine andere Dokumentendienstabforderung reagiert, beginnt damit, Patentdatenbanken nach Patenten der Unternehmen zu durchsuchen. Ein anderer Dienstanbieter, der auf eine andere Dokumentendienstabforderung reagiert, sucht nach den Konkurrenten des Unternehmens.
  • Andere Dokumentendienstabforderungen suchen nach Verbindungen zwischen den genannten Personen, Dienste werden ausgelöst, die ihre Homepages finden sollen, Patente, die sie publiziert haben, ihre Lebensläufe und Pressemitteilungen, in denen sie erwähnt werden. Ein anderer Dienst wählt Namenspaare aus und sucht nach Websites, in denen beide Personen erwähnt werden. Um Informationen über auf der Seite identifizierte Produkte bereitzustellen, werden ähnliche Dienste kontaktiert.
  • Wenn der Benutzer am nächsten Morgen wieder ins Büro kommt, öffnet er das Meta-Dokument, und alle Dienste, die geantwortet haben, haben im Dokument neue Links, neue Grafiken wie beispielsweise Graphen oder Bilder, und dergleichen erstellt. Wenn der Benutzer auf ein Element klickt, erhält er eine Liste der Informationen, die das Meta-Dokument über Nacht über sich selbst herausgefunden hat. Die Arbeit des Benutzers wurde durch das Meta-Dokument selbst vorbereitet. Wenn der Benutzer beschließt, dass das Meta-Dokument aktiv bleiben soll, könnten schon morgen neue Informationen gefunden werden.
  • Persönlichkeiten. Persönlichkeiten, das heißt, vorher festgelegte Sammlungen von Dokumentendienstabforderungen, stellen im Wissensverwaltungszyklus eine praktische Abkürzung dar. Das Wort Persönlichkeit wird, wie oben ausgeführt, verwendet, weil das Anwenden unterschiedlicher Reihen von Dokumentendienstabforderungen auf denselben Inhalt auch unterschiedliche Links und Verbindungen hervorrrufen wird, genau so, wie Personen mit unterschiedlichen Persönlichkeiten auf dieselbe Situation unterschiedlich reagieren.
  • Ein Endbenutzer liest oder schreibt ein Dokument. Der Benutzer wählt einen Teil oder das gesamte Dokument mit herkömmlichen Auswahlmitteln aus. (Alternativ dazu kann das gesamte Dokument auch immer vorher ausgewählt werden.) Der Benutzer weist dem ausgewählten Teil des Dokuments eine Persönlichkeit zu, das heißt, ein Paket vorher ausgewählter Dokumentendienstabforderungen. Um eine Persönlichkeit zuzuweisen, wählt der Benutzer sie mit einem herkömmlichen Auswahlmechanismus wie beispielsweise einem Pulldown-Menü oder einer Popup-Tabelle aus, in der die Persönlichkeiten aufgelistet oder durch unterscheidbare Symbole dargestellt sind. Wenn die Persönlichkeiten dem Benutzer zur Auswahl präsentiert werden, dann kann der Endbenutzer sich in einem bevorzugten Ausführungsbeispiel der Erfindung anzeigen lassen, welche Dokumentendienstabforderung in dem Persönlichkeits-Paket enthalten ist. Wenn ihm die Dokumentendienstabforderungen angezeigt werden, kann der Benutzer unerwünschte Dienstabforderungen deaktivieren oder deaktivierte Abforderungen aktivieren. Der Benutzer kann darüber hinaus auf eine Darstellung der Dokumentendienstabforderung klicken, um sich anzeigen zu lassen, welche Dokumentendienstanbieter diese Dokumentendienstabforderung erfüllen können. In einem bevorzugten Ausführungsbeispiel der Erfindung ist einer der Dokumentendienstanbieter als Standardanbieter eingestellt. Die Standardauswahl kann vom Benutzer durch Auswählen eines Alternativ-Dokumentendienstanbieters übergangen werden.
  • Alternativ dazu kann der Benutzer das Dokument eingeben, indem er ein Gerät zum Scannen und ein Deckblatt verwendet, auf dem beschrieben ist, welche Persönlichkeit auf das Dokument angewendet werden soll.
  • Sobald eine Persönlichkeit (oder Persönlichkeiten, wenn mehr als eine Persönlichkeit ausgewählt wurde) zugewiesen ist, wird der Koordinator/das Steuerprogramm für die Dokumentenseelen darüber benachrichtigt (durch den Prozess, der den Auswahlprozess verwaltet), dass dem Dokument eine Persönlichkeit zugewiesen wurde. Von diesem Moment an beginnt der Koordinator/das Steuerprogramm für die Dokumentenseelen, das Dokument periodisch aufzurufen. Bei jedem Aufruf werden unerfüllte Dokumentendienstabforderungen, die dem Dokument durch Auswahl einer Persönlichkeit zugeordnet sind, vom Koordinator/dem Steuerprogramm für die Dokumentenseelen erkannt. Der Koordinator/das Steuerprogramm für die Dokumentenseelen wählt eine zu erfüllen de Dokumentendienstabforderung aus und findet den standardmäßig oder benutzerspezifisch eingestellten Dokumentendienst, der diesen Dienst für diesen Benutzer erfüllt. Der Koordinator/das Steuerprogramm für die Dokumentenseelen initiiert dann die Kommunikation mit einem ausgewählten Dokumentendienstanbieter, er überwacht die zum Bereitstellen des Dienstes benötigten Dokumentdaten und sendet diese Daten mit bekannten Datentransferprotokollverfahren an den Dokumentendienstanbieter.
  • Wenn der Dokumentendienstanbieter die Dienstabforderung erfüllt, informiert der Dienstanbieter den Koordinator/das Steuerprogramm für die Dokumentenseelen und sendet ihm dabei jedwede Ergebnisse im Zusammenhang mit der Dienstabforderung als Daten mit standardmäßigen Datentransferprotokollverfahren zu. Beispiele für die Daten, die ein Dokumentendienst bereitstellen kann, sind unter anderem die folgenden; jede Person mit gewöhnlicher Erfahrung auf dem Gebiet der Datenübertragung und des Packens kann leicht weitere nennen:
    • 1) der Dienstanbieter kann den URL zu einer Ergebnisseite zurücksenden, die der Dienstanbieter erstellt hat;
    • 2) der Dienstanbieter kann eine XML- oder HTML-Seitezurücksenden; die mit den Dienstergebnissen innerhalb der markierten Seite erstellt wurde;
    • 3) der Dienstanbieter kann einen beliebigen Teil des Originaldokumenteninhaltes mit neuen HTML-Links zurücksenden, die sich auf einige der Informationen des Originalinhaltes beziehen
    • 4) zusätzlich zu den Daten, die in (3) zurückgesendet wurden, kann der Dienstanbieter eine Reihe XML- oder HTML-Seiten zurücksenden, auf die die neu eingefügten Links verweisen;
    • 5) der Dienstanbieter kann in den Inhalten des Originaldokuments Nebeninformationen bereitstellen, in denen sich Informationen befinden, die zu den Originalinhalten in einer Beziehung stehen, so können beispielsweise Hypertext, Bilder, neuer Text und dergleichen in diese Nebeninformationen eingefügt worden sein.
  • Der Koordinator/das Steuerprogramm für die Dokumentenseelen verwaltet die von den Dienstanbietern zurückgelieferten Informationen und ordnet die Ergebnisse dem Originaltext zu und stellt damit eine neue Ansicht des Dokuments entsprechend der Dienstabforderung bereit. In einem bevorzugten Ausführungsbeispiel der Erfindung stellt jedwede Dienstabforderung mindestens eine neue Ansicht des Inhaltes des Originaldokuments bereit, in der Form, dass ein Blickwinkel einfach eine neue Version des Dokuments ist, in die andere Hypertext-Links eingefügt sind, oder eine komplett neu geschriebene Form des Originaldokuments.
  • Der Benutzer kann auf jeden der Dokumentendienst-spezifischen Blickwinkel des Dokuments zugreifen, dem er zu einem beliebigen Zeitpunkt eine Persönlichkeit zugeordnet hat. Dieser Zugriff kann über herkömmliche Computer-basierte Visualisierungsmittel wie beispielsweise Browser oder durch Anzeige der abgeforderten Blickwinkel auf einem herkömmlichen Drucker erfolgen. Wenn die Dokumentendienstabforderung noch nicht erfüllt ist, wird der Benutzer über den Status informiert.
  • Der Benutzer kann darüber hinaus durch Anzeigen aller verfügbaren Dokumentendienste und Auswählen derjenigen Dokumentendienstabforderung, die die neue Persönlichkeit bilden wird, mit herkömmlichen Mitteln, wie beispielsweise Markieren von Kontrollkästchen, eine neue Persönlichkeit erstellen. Sobald alle Auswahlen einschließlich der Auswahl der spezifischen Dienstanbieter, die jeder Dokumentendienstabforderung zugeordnet werden sollen, getroffen wurden, gibt der Endbenutzer einen Namen für die neue Persönlichkeit an, wodurch die Persönlichkeit für diesen speziellen Benutzer oder für jeden anderen Benutzer, dem der ursprüngliche Endbenutzer Zugriffsrechte gewährt hat, für die Anwendung auf ein anderes Dokument zur Verfügung steht.
  • Einem Dritt-Dokumentendienstanbieter kann vom Koordinator/dem Steuerprogramm für die Dokumentenseelen das Recht gewährt werden, sich selbst als neuen Dokumentendienstanbieter für einen neuen oder einen bestehenden Dienst vorzuschlagen. Im ersten Fall folgt der Dritt-Dokumentendienstanbieter einem Registrierungsprotokoll, wie beispielsweise dem Zugreifen auf eine Internetseite und dem Ausfüllen eines Formulars, das beschreibt, welcher Dienst ausgeführt werden wird, welche Eingangsdaten der Dienst vom Koordinator/dem Steuerprogramm für die Dokumentenseelen benötigt, um aufgerufen werden zu können, und welches Datentransferprotokoll benutzt werden muss. Das Protokoll kann bekannte Transaktionsverfahren zum Bezahlen des Dienstes enthalten. Für den zweiten Fall eines Dokumentendienstanbieters, der einen bestehenden Dienst bereitstellt, erhält der Dritt-Dokumentendienstanbieter Zugriff auf das bereits bestehende Datentransferprotokoll und wird als möglicher neuer Dienstanbieter für den bestehenden Dienst registriert.
  • Muster-Persönlichkeiten. Es kann eine große Anzahl unterschiedlicher Persönlichkeiten definiert werden. Beispiele für einige wenige werden im Folgenden ausgeführt.
  • TechWatch-Persönlichkeit (z. B. für Marktforschungszwecke). Ein Meta-Dokument mit einer Technologie-Überwachungs-Persönlichkeit könnte folgende Dokumentendienstabforderungen enthalten: Identifiziere die Produkte an sich (z. B. über den ThingFinder von Inxight); identifiziere Unternehmensnamen, Namen von Personen; baue Organisations-Diagramm auf; erstelle Organigramm; versuche, Unternehmens-Homepage für das Dokument zu finden; versuche, Wettbewerber zu finden; suche Lernprogramme über Konzepte; suche White Papers; ruf die Aktiengeschichte von Unternehmensnamen ab; suche zu besetzende Stellen; suche Pressemitteilungen und Geschäftsberichte; suche Konferenzen, auf denen die im Dokument genannten Konzepte thematisiert werden; suche Patente heraus, die den genannten Personen und Unternehmen gehören; finde die Büroadresse des Hauptsitzes oder die Adressen der Zweigstellen heraus; stelle Wegbeschreibung zum Unternehmen bereit; baue Patentdatenbank um die im Dokument genannten Konzepte herum auf; erstelle URLs, in denen das Unternehmen oder das Produkt genannt wird; identifiziere andere von dem Unternehmen angebotene Produkte; ruf den Wetterbericht für den Hauptsitz ab; überprüfe, ob Namen für Websites bereits registriert oder noch frei sind.
  • Wissenschaftliche Persönlichkeit: Ein Meta-Dokument mit einer wissenschaftlichen Persönlichkeit könnte folgende Dokumentendienstabforderungen enthalten: identifiziere Konzepte; identifiziere zentralen Themenbereich; erstelle Zusammenfassungen (quantitativ, ungerichtet, gerichtet); suche Onlineversionen vom Dokument; isoliere Bibliographie; suche Homepages aller Autoren; suche Homepages aller zitierten Autoren; suche Onlineversionen der zitierten Aufsätze; suche Lernprogramme über Konzepte; suche Konferenzen, auf denen die Konzepte im Dokument thematisiert werden; erforsche Patente zum Thema; suche/erstelle BibTeX-Version von zitierten Stellen; suche andere Aufsätze, die mehrere der Autoren gemeinsam/einzeln geschrieben haben; suche Aufsätze mit benachbarten Konzepten von anderen Autoren; publiziere Aufsatz auf verschiedenen Websites (wie beispielsweise ISI Index, Yahoo); bewirb den Aufsatz in einer Gemeinschaft (wie beispielsweise KnowledgePump, Newsgroup).
  • Patentanwalts-Persönlichkeit: Ein Meta-Dokument mit einer Patentanwalts-Persönlichkeit könnte folgende Dokumentendienstabforderungen enthalten: suche andere Patente von denselben Erfindern; suche andere Patente mit demselben internationalen Patentcode; suche alle Patente, die sich auf dieses beziehen; identifiziere die Konzepte der Beschreibung; identifiziere die Konzepte aus den Ansprüchen; suche andere Patente mit denselben Konzepten; suche die Homepages aller Erfinder; suche die Homepage des Anmelders; suche alle Referenzen auf von den Erfindern publizierte Aufsätze; versuche, alle mit dem Anmelder, den Erfindern und den Konzepten in Zusammenhang stehenden Produkte zu identifizieren; suche weitere Aufsätze, die von den Autoren allein oder gemeinsam geschrieben wurden; suche Aufsätze, die dem Stand der Technik entsprechen.
  • Romanleser-Persönlichkeit: Ein Meta-Dokument mit einer Romanleser-Persönlichkeit könnte folgende Dokumentendienstabforderungen enthalten: identifiziere die Namen der Protagonisten; verbinde Protagonistennamen mit Erscheinung im Buch; suche Ortsnamen; suche Zeit; verlinke Ortsnamen mit Karten im WWW; verlinke Ortsnamen mit Fotos; suche Straßennamen; fertige Karte der Straßennamen an.
  • Prozessanwalts-Persönlichkeit: Ein Meta-Dokument mit einer Prozessanwalts-Persönlichkeit könnte folgende Dokumentendienstabforderungen enthalten: identifiziere Personen; suche Ortsnamen; erstelle Zeitplan; ordne Ereignisse dem Zeitplan zu; suche Straßennamen, fertige Karte der Straßennamen an.
  • Zum Implementieren eines Meta-Dokumentensystems können verschiedene Architekturen verwendet werden. Eine solche Architektur könnte folgende Dienste enthalten: Unterstützung komplexer koordinierter Dienste, dynamische Dienste für das Hinzufügen/Aktualisieren/Löschen, verteilten Mehrfachzugriff und Visualisierung der Ergebnisse in intuitiver Form. Es wurden mehrere verschiedene Meta-Dokumentsysteme implementiert.
  • Beispiel: Ein einfaches Dokumentenseelen-System mit einer generischen Persönlichkeit. In diesem Beispiel wurde ein Meta-Dokument erstellt, indem einem normalen Textdokument eine generische Persönlichkeit hinzugefügt wurde. Der Originaltext ist im Folgenden aufgeführt:
    „Das Kopiererhersteller-Unternehmen Xerox Corp. baut einen internet-basierten Unternehmenszweig auf, der unter Umständen ausgegliedert und als Einzelunternehmen verkauft werden könnte. Das Unternehmen mit Hauptsitz in Stamford, Conn., teilte mit, dass der Business Development Chief, Michael Miron, den Vorsitz über die am Donnerstag vorgestellte neue Internet Business Group haben wird. Xerox teilte mit, dass der Unternehmensteil Risikokapital und Partnerschaften außerhalb des Mutterunternehmens suchen wird."
  • Der erste Schritt, den diese Systemversion unternimmt, ist das Isolieren des Originaldokuments in INNATE-Tags und das Zuordnen einer generischen Persönlichkeit zu dem Dokument und dem Paket zugeordneter Dienste.
    <INNATE> Das Kopiererhersteller-Unternehmen Xerox Corp. baut einen internetbasierten Unternehmenszweig auf, der unter Umständen ausgegliedert und als Einzelunternehmen verkauft werden könnte. Das Unternehmen mit Hauptsitz in Stamford, Conn., teilte mit, dass der Business Development Chief, Michael Miron, den Vorsitz über die am Donnerstag vorgestellte neue Internet Business Group haben wird. Xerox teilte mit, dass der Unternehmensteil Risikokapital und Partnerschaften außerhalb des Mutterunternehmens suchen wird.
    </INNATE>
    <PERSONALITY> generic </PERSONALITY>
    <!SERVICE NAME, StartTime, MaxFinishTime, EndTime SERVICE>
    <SERVICE> NAME="FindConcepts", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="FindNames", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="FindLinksConcept", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="DetermineLanguage", 0:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="GenerateSummary", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="GetStockTrends", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    ...
    und dergleichen.
  • Nachdem eine Reihe von Abforderungen wie beispielsweise FindConcepts [Suche Konzepte], FindOrganisations [Suche Unternehmen] und dergleichen ganz oder teilweise erfüllt ist, ist das folgende mit Markups versehene Dokument entstanden:
    <INNATE> Das Kopiererhersteller-Unternehmen Xerox Corp. baut einen internetbasierten Unternehmenszweig auf, der unter Umständen ausgegliedert und als Einzelunternehmen verkauft werden könnte. Das Unternehmen mit Hauptsitz in Stamford, Conn., teilte mit, dass der Business Development Chief, Michael Miron, den Vorsitz über die am Donnerstag vorgestellte neue Internet Business Group haben wird. Xerox teilte mit, dass der Unternehmensteil Risikokapital und Partnerschaften außerhalb des Mutterunternehmens suchen wird.
    </INNATE>
    <PERSONALITY> generic </PERSONALITY>
    <SERVICE> NAME="FindConcepts", 10:49:24 01/06/00, 10:49:24 01/08/00, 10:50:04 01/06/00</SERVICE>
    <SERVICE> NAME="FindNames", 10:49:24 01/06/00, 10:49:24 01/08/00, 10:50:01 01/06/00</SERVICE>
    <SERVICE> NAME="FindLinksConcept", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="DetermineLanguage", 10:49:24 01/06/00, 10:49:24 01/08/00, 10:50:01 01/06/00</SERVICE>
    <SERVICE> NAME="GenerateSummary", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="FindOrganisations", 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <SERVICE> NAME="GetStockTrends\ 10:49:24 01/06/00, 10:49:24 01/08/00, "Started" </SERVICE>
    <LANGUAGE> German </LANGUAGE>
    <CONCEPT>Risikokapital </CONCEPT>
    <CONCEPT>Unternehmensteil </CONCEPT>
    <CONCEPT>Stamford </CONCEPT>
    <CONCEPT>kürzliche Gewinneinbrüche </CONCEPT>
    <CONCEPT>Partnerschaften </CONCEPT>
    <CONCEPT>Internet-basierter Unternehmenszweig </CONCEPT>
    <CONCEPT> und dergleichen </CONCEPT>
    <ORG-KNOWN> neue Internet Business Group </ORG-KNOWN>
    <ORG-KNOWN> Xerox Corp. </ORG-KNOWN>
    ...
    und dergleichen.
    <CONNECTION>QUERY="(Risikokapital) + NEAR + (Xerox + Corp.)", AltaVista,
    CONNECTION_LIST=[http://www.scribe.fool.com/Evening-News/1998/EveningNews980617.htm,
    http://foolwest.fool.com/EveningNews/1998/EveningNews980921.htm,
    http://search, fool.com/EveningNews/1998/EveningNews980921.htm.
    http://foolwest.fool.com/EveningNews/1998/EveningNews980617.htm]
    </CONNECTION>
    und dergleichen.
    <STOCK_PRICES> COMPANY="Xerox Corp",
    Figure 00230001
    </STOCK_PRICES>
  • Beispiel. CLF-basiertes System der Dokumentenseelen. Das System der Dokumentenseelen kann über CLF (Coordination Language Facility), einem objektbasierten verteilten Anwendungsentwicklungswerkzeug, implementiert werden. In Anhang A, „Überblick über CLF", wird ein Überblick über CLF gegeben. CLF kann die meisten der oben dargelegten Dienste für die generische Dokumentenpersönlichkeit realisieren. CLF kann darüber hinaus folgende zusätzliche Dienste enthalten:
    Dokumentumwandlungen, das bedeutet, Dienste zum Umwandeln des Dokumenteninhaltes (beispielsweise durch das Benutzerprofil, den Arbeitskontext und dergleichen qualifiziert) in Nominalphrasen, Namen, Zusammenfassung, Dokumentensprache.
  • Inhaltsverbindungen basierend auf Nominalphrasen, Namen und dergleichen, das heißt, Suchen nach Konferenz-/Zeitschriftenaufsätzen beispielsweise mit Hilfe von Calliope, Suche nach Gruppen, Personen, die in diesem Bereich tätig sind, Suche nach Webressourcen mit Hilfe einer Suchmaschine, Suche nach Lernprogrammen, Suche nach Patenten,
    Anzeigen von Komponenten wie beispielsweise Dokumentenkonzepte mit Hyperlinks zusammen mit den gefundenen Webressourcen
    Erzeugen von verschiedenen Ansichten des Dokuments mit der Anzeigeeinrichtung Knowledge Visualiser: eine Leseransicht, die das Dokument so anzeigt, dass darin verschiedene Namen und Nominalphrasen mit verschiedenen Websites verlinkt sind, die mit diesen Konzepten verbunden sind (festgestellt durch die Suchmaschine und den bibliographischen Onlinedienst Calliope); eine detaillierte Ansicht, die den gesamten Inhalt des Dokuments und mit Markup ausgezeichnete Metadaten, die mit Diensten und ihren Ergebnissen in Beziehung stehen, anzeigt; eine Schreiberansicht, mit der der Schreiber des Dokuments den Text editieren kann.
  • Sicherheit – Benutzerzugriff (Administration): ermöglicht das Anlegen neuer Benutzer und der dazugehörigen Schlüsselwortprofile. Kann darüber hinaus Benutzerdokumente verfolgen und dergleichen.
  • Verfügbarkeit von Dokumenten im Netzwerk über HTTP-Protokoll: Das System ist HTTP-kompatibel und ermöglicht es Benutzern, sich anzumelden, Dokumente und ihre Seelen von jedem Punkt in der Welt zu erstellen, zu verändern und zu verfolgen.
  • Im Folgenden werden die Hauptobjekte (Teilnehmer) im CLF-Implementsystem und ihre jeweilige Hauptrolle im System aufgeführt und in 3 dargestellt. Hinweis: Im Folgenden meint die Benennung Dienste immer CLF-Dienste, diese sind logische Gruppierungen von Objektattributen zu Prädikaten.
  • Persönlichkeit 302 stellt Informationsspeicher von Diensten bereit, die der Benutzer auswählen kann, um eine Persönlichkeit festzulegen oder eine bereits bestehende Persönlichkeit zu verfeinern, und verwendet CLF-Dienste wie beispielsweise „DocService(PersonalityID, docService, order)" und verschiedene CLF-Regeln. UserManager [Benutzerverwalter] 308 verfolgt Benutzer und ihre Dokumente im System und verwendet CLF-Dienste wie beispielsweise „user(Userld, Password, DocumentID)" und verschiedene CLF-Regeln. Die DocumentManager [DokumentenVerwalter] 310 und 312 verwalten Dokumente mit derselben Persönlichkeit, indem sie verschiedene Banken und CLF-Regeln verwenden wie beispielsweise „document(id, content)", „personality(id, personality)", „version(id, versionNumber)", „creator(id, creator)", „ServiceData(id, action, state, data)", „ServiceDetails(id, when, state, LatestDateOfCompletion)". Der ServiceProvider [Dienstanbieter] 304 führt Dienste für ein Meta-Dokument 100 aus, beispielsweise „generate summary", „Build DocuMap", „getConcepts", „getConceptWebLinks" und dergleichen, CommandWrapper(content, data): [Befehls-Wrapper] ein CLF-Dienst zum Umhüllen bestehender Software wie beispielsweise dem Nominalphrasenextraktor von MLTT, AltaVista, Calliope und dergleichen; YellowPages(DocumentService, provider): verfolgt die Liste der Dokumentendienstabforderungen und möglicher Dienstanbieter. Der View-Constructor [AnsichtenKonstruktor] 306 erstellt verschiedene Ansichten des Dokuments unter Verwendung der Dokumentdaten (Inhalte, Metadaten und dergleichen).
  • Die oben aufgeführten Dienste (das heißt, die Persönlichkeitsdienste) werden als CLF-High-Level-IF-THEN-Regeln wie beispielsweise die folgende ausgeführt:
    IF'Document(documentName, Creator) AND
    'GenericPersonality(documentName, StartTime, MustFinish, EndTime) AND
    printRes(documentName, "IntrospectionDetails ", StartTime, "AFTER", res)
    THEN
    StartWant(documentName, "inProgress", 'Concept', StartTime,MustFinish, 'notFinishedYet')
    StartWant(documentName, "inProgress", 'Name', StartTime,MustFinish, 'notFinishedYet')
    StartWant(documentName, "inProgress", 'Summary', StartTime,MustFinish, 'notFinishedYet')
    StartWant(documentName, "inProgress", 'Language', StartTime,MustFinish, notFinishedYet')
    und dergleichen.
  • Diese Regel überwacht die Verfügbarkeit von Meta-Dokumenten im System, denen die Persönlichkeit „GenericPersonality" [generische Persönlichkeit] zugeordnet wurde. Sobald ein Dokument erkannt wird, das diese Kriterien erfüllt, werden verschiedene Dokumentendienste mit verschiedenen Zeitbeschränkungen gestartet. Das Koordinatorobjekt 314 koordiniert die Dokumentendienstabforderungen, die durch Regeln realisiert werden, die dem herkömmlichen Zwei-Phasen-Commit-Protokoll von Transaktionssystemen entsprechen.
  • Meta-Dokumente oder Dokumentenseelen können innerhalb eines Dokumentenformats als XML ausgedrückt werden, das das Dokument mit Tags auszeichnet, die die Dokumentenabforderungen/-dienste, ihre Ergebnisse und ihren Status (erfüllt, nicht erfüllt oder erneuerbar) und möglicherweise den Code zum Realisieren dieser Dienste (beispielsweise CLF-IF-THEN-Regeln) beschreiben. XML ist zwar zum Speichern und Transportieren von Dokumenten über verschiedene Systeme hinweg gut geeignet, zum Verarbeiten von Dokumenten ist es jedoch ein aufwändiges Format. Das World Wide Web-Konsortium, W3C, definiert derzeit eine Reihe von Schnittstellen für strukturierte Dokumente, die „Document Object Model" (DOM) genannt werden und zur Darstellung von Meta-Dokumenten in einem Meta-Dokumentensystem verwendet werden können. Das DOM stellt XML-Dokumente als Bäume aus Knoten dar, bei denen jeder Knoten ein XML-Element darstellt. Darüber hinaus definiert es einen Standardsatz von Operationen zum Navigieren und Modifizieren der Dokumentstruktur und der Dokumenteninhalte.
  • Ein Meta-Dokument zeigt seine Dokumentendienstabforderungen durch spezifische Knoten im DOM-Baum auf, und DOM-Operationen ermöglichen das Abfragen und Modifizieren der Inhalte und Metadaten des Dokuments durch eine Schnittstelle in Programmform. 4 zeigt ein Dokument 400 und seine Darstellung in Form eines DOM-Baumes 410. Knoten 1 stellt die Wurzel des Dokuments dar, Knoten 2 den ersten Abschnitt, Knoten 4 den ersten Absatz des ersten Abschnittes, und so fort. Die in den zweiten Absatz des zweiten Abschnitts eingefügte und im Dokument durch Fettdruck 412 dargestellte (obwohl möglicherweise für den Leser des Dokuments unsichtbare) Dokumentenabforderung wird im DOM-Baum durch Knoten 10 (414) dargestellt.
  • Die grundlegende Zuordnungsfunktion zwischen DOM- und XML-Darstellungen von Dokumenten ist trivial: jeder Knoten in einem DOM-Baum wird durch ein XML-Start-Tag, gefolgt von den „Inhalten" des Knotens, gefolgt von einem entsprechenden XML-Ende-Tag, dargestellt. Diese Zuordnungsfunktion wird rekursiv angewendet, wenn der Inhalt eines Knotens eine Reihe von untergeordneten (Kind-)Knoten ist. Parser (zum Umwandeln der Text-XML-Darstellung eines Dokuments in einen DOM-Baum) und verschiedene Interpreter wie beispielsweise Pretty-Printers (zum Umwandeln von DOM-Bäumen in XML-Zeichenketten oder in jedwede andere, vom Menschen einfacher lesbare Form) sind von vielen verschiedenen Quellen verfügbar.
  • Wenn eine neue Abforderung in ein Dokument entweder durch den Autor oder als Ergebnis der Verarbeitung einer anderen Abforderung, eingefügt wird, wird in den DOM-Baum ein entsprechender Abforderungsknoten eingefügt. Abforderungsknoten repräsentieren Tags im Dokument, und zwar dergestalt, dass auch sie nicht Teil des sichtbaren Inhalts des Dokuments sind. Sowohl XML als auch DOM behandeln Metadaten und Inhaltsdaten auf exakt dieselbe Weise. In XML wird jedes Element, sei es sichtbarer In halt oder Metadaten, durch ein Start-Tag (mit optionalen Attributen), die jeweiligen Inhalte und ein End-Tag dargestellt. Dasselbe gilt für das DOM, in dem Elemente durch Knoten dargestellt werden. Es ist die Druckfunktion, die schließlich den Ausschlag gibt, was für den Leser eines Dokuments sichtbar und was unsichtbar ist.
  • In seiner einfachsten Form kann das Meta-Dokumentsystem, wenn es DOM verwendet, mit einem „Dokumentenseelen-Daemon" oder Steuerprogramm implementiert werden, um jedes Dokument über seine Dom-Schnittstelle zu manipulieren. Der Dokumentenseelen-Daemon scannt die DOM-Struktur, erkennt nicht erfüllte Abforderungen, wählt die nächste zu bearbeitende Abforderung aus, sucht einen Dienst, der die Abforderung erfüllen kann, ruft den Dienst auf und stellt die Ergebnisse bereit, fügt die Ergebnisse in die DOM-Struktur ein und wiederholt das Ganze für die nächste Abforderung. Wenn man berücksichtigt, dass die Antwortzeit für eine bestimmte Abforderung sehr lang sein kann – insbesondere, wenn diese die Suche nach Informationen im Internet involviert – dann ist es ein besserer Ansatz, so viele unerfüllte Abforderungen wie möglich zur selben Zeit aktiv sein zu lassen und zuzulassen, dass das entsprechend ausgestattete Dokument auf jedwede neue Information reagieren kann, sobald diese Information verfügbar ist.
  • Komplikationen treten auf, wenn es Abhängigkeiten zwischen Abforderungen gibt. Beispielhaft wird ein Meta-Dokument mit einer TechWatch-Persönlichkeit betrachtet. Es könnte beispielsweise Abforderungen zum Sammeln von Pressemitteilungen von allen Unternehmen, die im Dokument genannt werden, enthalten. Es könnte jedoch darüber hinaus auch eine Abforderung enthalten, alle genannten Unternehmen zu entfernen, die einen Umsatz von weniger als 20 Millionen US-Dollar haben. Wenn diese Abforderungen asynchron und zur gleichen Zeit ausgeführt werden, läuft man Gefahr, Pressemitteilungen von Unternehmen zu erhalten, die im Dokument gar nicht genannt wurden. Zum Lösen dieses Problems kann das Konzept der Koordinierung aus dem Bereich der koordinierten Softwaresysteme genutzt werden.
  • Ein koordiniertes Softwaresystem besteht aus einer Reihe von unabhängigen Untersystemen und einer Reihe von Regeln, die beschreiben, wie das System auf Veränderungen sowohl in seiner Umgebung als auch im Zustand von jedem seiner Untersysteme reagieren soll. Die Untersysteme werden typischerweise in verschiedenen Systemen gleichzeitig verwendet, und jedes System wird im Sinne seines Koordinations-Regelsatzes definiert. Untersysteme und Regelsatzkoordinatoren wurden dafür entworfen, Abhängigkeiten zwischen laufenden Verarbeitungsprozessen, wie im Beispiel oben beschrieben, zu handhaben. Der Ansatz eines koordinierten Systems ist ein sehr wirksames Mittel zum Herstellen neuer Systeme aus bestehenden Teilen, insbesondere in Situationen, in denen die Untersysteme einander unbekannt sind, wie dies beispielsweise bei vielen öffentlich verfügbaren Diensten der Fall ist, die zur Verwendung mit dem Meta-Dokumentensystem vorgesehen sind. Das Koordinierungsmodell der Dokumentenseelen folgt dem CLF(Coordination Language Facility)-Modell des XRCE.
  • Bei Dokumentenseelen werden sowohl Dokumentendienstabforderungen als auch Meta-Dokumente (die möglicherweise als DOM-Bäume dargestellt werden) als unabhängige Untersysteme betrachtet. Der Koordinator für die Dokumentenseelen 314 enthält Regeln, die beschreiben, wie in entsprechend ausgestatteten Dokumenten unterschiedliche Anforderungen durch die Anrufung verschiedener Dienste erfüllt werden können, wie Probleme mit konkurrierenden (und möglicherweise widerstreitenden) Ergebnissen von Diensten gehandhabt werden und wie Ergebnisse schließlich wieder in das Dokument eingefügt werden.
  • Der Koordinator 314 reagiert sofort auf neue Informationen und Situationen. Beispielsweise kann ein Meta-Dokument das Einfügen eines Links in die Informationsseite eines neuen Produktes abgefordert haben, jedoch ist noch gar keine Informationsseite verfügbar, wenn die Abforderung erstmalig aktiviert wird. In diesem Fall hält der Koordinator die Abforderung aktiv und reagiert sofort, wenn eine Informationsseite erkannt wird.
  • Das Meta-Dokumentsystem liefert drei Elemente, die zum Erreichen eines Wissensschubs erforderlich sind: den Plan, die Inhalte und die Gemeinschaft. Die einem Dokument verliehene Persönlichkeit antizipiert, in welchem Kontext das Dokument verwendet werden wird. Die von dieser Persönlichkeit gestarteten Dokumentendienstabforderungen analysieren und nutzen die Inhalte des Dokuments. Die Verlinkung des Inhalts mit lokalen Datenbanken und dem Internet schließlich erschafft die Gemeinschaft um das Dokument herum.
  • Anhang A: Überblick über CLF
  • Die Coordination Language Facility; CLF, ein objektbasiertes, verteiltes Anwendungsentwicklungswerkzeug, wurde von der Gruppe Coordination Technologies des XRCE (Xerox Research Center, Grenoble) entwickelt. CLF geht von einem Objektmodell unabhängiger Agents aus, die anspruchsvollere Interaktionen ausführen können als die im herkömmlichen Objektparadigma. Herkömmlicherweise hat das objektorientierte Paradigma direkte Interaktion mit Objektattributen/-ressourcen über Zugrifts/Veränderungsfunktionen bereitgestellt (Einbindungsprinzip). Dieses Paradigma, obgleich sehr hilfreich und erfolgreich, stößt beim Programmieren in sehr großen verteilten Umgebungen wie beispielsweise dem Internet an seine Grenzen, so dass hier anspruchsvollere Grundelemente für die Objekt-Interaktion benötigt werden als die vom herkömmlichen Objektmodell bereitgestellten. Zum Erfüllen dieser Anforderung wurden verschiedene Modelle für die Objekt-Interoperation und -koordination vorgeschlagen und entwickelt. CLF ist ein Beispiel für ein derartiges Modell. Innerhalb des CLF-Bezugssystems wird der Zugriff auf Objekte und ihre Attributwerte nicht nur über direkte Zugriffsverfahren (herkömmliches Zugreifen/Verändern), sondern auch über assoziativen Zugriff (das heißt, durch Musterabgleich) ermöglicht.
  • Im CLF-Paradigma werden Agents als Ressourcenverwalter betrachtet, die zwei Arten von Operationen akzeptieren: Einfügen und Entfernen von Ressourcen. Darunter liegt eine Client-Server-Architektur, bei der die Client-Objekte (die sowohl Objekte als auch Regeln sein können, siehe unten) versuchen, Ressourcen in ein Server-Objekt einzufügen oder diese daraus zu entfernen. Auf die von einem CLF-Objekt (Server) verwalteten Ressourcen kann über herkömmliche, öffentlich verfügbare Zugreifen/Verändern-Verfahren oder über das CLF-Protokoll zugegriffen werden. Das CLF-Protokoll bietet über Prädikate assoziativen Zugriff auf Ressourcen. Ein Prädikat wird durch einen Prädikatnamen gekennzeichnet, und ein Argumententupel kann instanziiert sein oder auch nicht. Prädikate können als natürliche Gruppierungen von Attributwerten betrachtet werden. Betrachtet sei beispielsweise das Prädikat ConceptLink, das von einem Server-Objekt veröffentlicht wird. Dieses Prädikat gruppiert Informationen über WWW-Links mit einem Konzept (Nominalphrase), das in einem Dokument vorhanden ist. Die Prädikatsignatur könnte etwa so aussehen: „ConceptLink(Concept, Document_ID, WWWLink, ProviderOf Link)", wobei ConceptLink der Prädikatname ist, Concept ist die im Dokument vorhandene und durch die Document_ID identifizierte Nominalphrase, WWWLink kennzeichnet den URL zu einer für das Konzept als relevant betrachteten Website, ProviderOfLink ist der Name des Dienstanbieters, der den Link identifiziert hat (wie beispielsweise AltaVista oder Yahoo). Links zu einem Konzept wie beispielsweise „Fuzzy Logic" in einem „InterestingThings" benannten Dokument könnten über das folgende Muster bereitgestellt werden, bei dem Konzept auf „Fuzzy Logic" und Document_ID auf „InterestingThings" instanziiert ist: ConceptLink("Fuzzy Logic", Document_ID, WWWLink, ProviderOfLink).
  • In der CLF-Terminologie werden die öffentlichen Prädikate eines Objekts die Dienste eines Objekts genannt. Diese werden in der Schnittstelle des Objekts aufgelistet. In der Praxis delegieren Dienste die Datenverwaltung an Ressourcenverwalter. Ressourcenverwalter unterstützen das CLF-Protokoll und bieten darüber hinaus einen Grad der Abstraktion, der die Dienste vom Datenmodell isolieren kann (das heißt, das Datenmodell könnte eine Datei, ein Datenbank-Verwaltungssystem, ein Aufruf an einen externen Dienst wie beispielsweise eine WWW-basierte Suchmaschine oder andere bestehende Systeme sein). Mit anderen Worten, Ressourcenverwalter stellen den Zugriff auf Ressourcen (gruppierte Attributwerte) bereit, die zu einem Server-Objekt gehören, und erlauben es Clients, diese über CLF-Protokoll-Operationen (im Folgenden umrissen) zu manipulieren. Innerhalb der aktuellen Ausführung von CLF werden verschiedene Ressourcenverwalter bereitgestellt, die direkt in Anwendungen eingesetzt oder weiter spezialisiert/verfeinert werden können (das heißt, Ressourcenverwalter sind Klassen, die direkt verwendet oder in weitere Unterklassen für Verhaltensweisen zur Veränderung der Reihenfolge eingeteilt werden können). Alternativ dazu können Ressourcenverwalter auch komplett neu erstellt werden.
  • Das CLF-Protokoll stellt eine Reihe von Operationen bereit, mit denen ein Client Ressourcen einfügen oder entfernen kann, auf die in einem Server-Objekt assoziativ zugegriffen werden kann. Dieses Protokoll unterstützt das herkömmliche Zwei-Phasen-Commit-Protokoll von Transaktionssystemen. Folgende Operationen werden derzeit vom CLF-Protokoll unterstützt: Insert, Inquire, Next, Kill, Check, Reserve und Confirm/Cancel [Einfügen, Abfragen, Folgendes, Stoppen, Überprüfen, Reservieren und Bestätigen/Abbrechen] – Mit der Operation „Insert" kann der Client ein Prädikat und ein vollständig instanziiertes Argumententupel in das Server-Objekt einfügen (beispielsweise eine Ressource erstellen). Mit der Operation „Inquire" kann der Client ein Server- Objekt bezüglich der Verfügbarkeit einer Ressource abfragen, die ein Prädikat und entsprechende instanziierte oder uninstanziierte Argumente erfüllen. Die Inquire-Operation liefert einen Strom von Aktions-IDs (oder Privilegien zum Entfernen oder Verbrauchen der entsprechenden Ressourcen) zurück. Während der Übertragungsphase reserviert der Client eine Aktions-ID. Akzeptiert der Server die Reservierung, wird aus dem Angebot ein für den Server bindender Auftrag, die Ressource auf Anfrage zu entfernen (das bedeutet, der Client verbraucht die Ressource). Der Client kann dann eine Bestätigung (Confirm) zum Server senden, wodurch der Client die Ressource verbraucht und der Server die Ressource löscht. Alternativ dazu kann der Client eine Abbruchanforderung (Cancel) zum Server senden, wodurch die reservierte Ressource in ihren anfänglichen, unreservierten Status zurückkehrt. Mit der Operation „Next" [Nächste] kann der Client die nächste Aktions-ID aus dem durch die Inquire-Operation zurückgelieferten Datenstrom abrufen.
  • Typische in CLF verfügbare Ressourcenverwalter sind beispielsweise File, TupleSpace, Database Management Systems (DBMS) und dergleichen. Unter CLF sind derzeit verschiedene Verfeinerungen dieser Basisklassen von Ressourcenverwaltern wie beispielsweise persistency [Fortdauern] verfügbar. Anwendungsspezifische Ressourcenverwalter können leicht von Anfang an definiert oder von bestehenden Klassen abgeleitet werden.
  • Um Verhaltensweisen zwischen Objekten innerhalb des CLF-Bezugssystems zu koordinieren, wird eine auf einer High-Level-IF-THEN-Regel basierende Koordinierungssprache bereitgestellt. Diese Sprache baut auf den High-Level-Prädikaten auf, die durch Objektschnittstellen verfügbar gemacht werden, wodurch der Benutzer komplexe koordinierte Aktivitäten transaktionsbasiert ausdrücken kann. IF-THEN-Regeln bestehen in CLF aus einer linken [left-hand side, LHS] und einer rechten [right-hand side, RHS]) Seite; die LHS besteht aus einer Liste von Prädikaten (mit instanziierten oder uninstanziierten Variablen), diese entsprechen Ressourcen, die verbraucht werden; die RHS besteht aus einer Liste von Prädikaten (mit instanziierten Variablen), diese entsprechen Ressourcen, die in ein Server-Objekt eingefügt werden. Von Regeln sagt man dann, dass sie feuern, wenn alle LHS-Prädikate erfüllt wurden und folglich das instanziierte Prädikat in Form einer Ressource in das entsprechende Objekt eingefügt wurde. Im Folgenden wird ein Beispiel für eine CLF-Regel vorgestellt, die verwendet werden könnte, um den Besitzer eines Dokuments darauf hinzuweisen, dass alle Dienste für ein Dokument erfüllt wurden:
    IF allServicesCompleted(Doc_ID) and 'docOwner(Doc, Owner) and 'userDetails(Owner, _,_, Email) THEN email(Email, "Hallo" + Owner + "Alle Dienste für" + Doc_ID + "wurden erfüllt.")
  • Hier sind die Prädikate auf der linken und der rechten Seite der Regeln lediglich Kurzschrift-Schnittstellen für die durch die von Objekten im System öffentlich zur Verfügung gestellten Dienste. Diese Schnittstellen können wie folgt definiert werden (in einer vereinfachten Version der CLF-Programmiersprache):
    AllServicesCompleted(Doc_ID): DocumentManager. AllServicesCompleted(Doc_ID)
    docOwner(Doc_ID, Owner): UsertManager. GetDocOwner (Doc_ID, Owner)
    userDetails(User, ID, Location, Email): UsertManager. GetDocOwner (User, ID, Location, Email)
    email(Email, Message): UsertManager.SendEmail(Email, Message)
  • Das Prädikat AllServicesCompleted [AlleDiensteErfüllt] beschreibt eine unäre Eigenschaft von Ressourcen, die das Objekt DocumentManager besitzt und die vom Dienst AllServicesCompleted öffentlich verfügbar gemacht wurde. Die Objektnamen, auf die in diesen Signaturen/Schnittstellen Bezug genommen wird, sind globale Namen, die vom Nameserverobjekt aufgelöst werden, das beim Systemstart generiert wird. Alle Objekte werden zum Zeitpunkt ihrer Erstellung beim Nameserver-Objekt registriert. Die den Dokumentendienstabforderungen zugeordneten Parameter entsprechen Eingangs- und Ausgangsparametern, wobei Eingangsparameter durch einfachen Text und Ausgangsparameter durch unterstrichenen Text dargestellt werden. Wenn die CLF-Schlussfolgerung versucht, die erste Bedingung (Prädikat allServicesCompleted) dieser Regel zu erfüllen, löst sie eine Inquire-Operation [Abfrage] für den AllServicesCompleted-Dienst des DocumentManager-Objekts aus. In diesem Fall ist Doc_ID eine freie Variable (das heißt, uninstanziiert), die mit jeder Ausführung der Next-Operation instanziiert werden wird. Wenn das Prädikat „AllServicesCompleted" zufriedenstellend erfüllt ist, beginnt die Schlussfolgerungs-Engine mit der Suche nach passenden Instanziierungen auf der linken Seite dieser Regel. Der Dienst „SendEmail" im Objekt „UsertManager" ist ein Beispiel für einen umhüllenden Wrapperdienst und einen E-Mailer (dies könnte einfach als Aufruf an das Betriebssystem realisiert werden). Wenn die E-Mail-Ressource eingefügt ist, wird dem Besitzer des Dokuments eine E-Mail geschickt.
  • Kurz gesagt, die Regel wird versuchen, Folgendes zu tun:
    Finde eine Ressource, die die Prädikate „AllServicesCompleted", „docOwner" und „userDetails" enthält. Im Fall von „AllServicesCompleted" ist die Ressource verbraucht (das bedeutet, sie wird aus dem Objekt gelöscht), wogegen die Ressourcen sowohl im Fall „docOwner" als auch „userDetails" nur zu Rate gezogen (das heißt, nicht verbraucht) werden.
  • Wenn alle Prädikate auf der linken Seite angemessen instanziiert wurden, „feuert" die Regel und fügt eine E-Mail-Ressource mit den entsprechenden Instanziierungen „Email" und „Owner" und „Doc_ID" ein. In CLF sind Regeln Ressourcen, die in Objekte eingefügt werden, die Koordinatorenobjekt heißen (es können mehrere Koordinatoren existieren). Koordinatoren koordinieren zwischen beliebigen CLF-Objekten.
  • CLF ist für ein Meta-Dokumentensystem eine gute Architektur, da es verteilt ist und dynamische Definitionen verwendet (dynamisches Hinzufügen/Löschen von Objekten und ihren Verhaltensweisen). Es kann mit HTTP interagieren. CLF bietet darüber hinaus eine sehr praktische, natürliche Trennung zwischen Aktionen, Daten und Datenverwaltung. CLF-Transaktionen können leicht Verhaltensweisen über Netzwerke hinweg koordinieren, da das System reaktiv ist.
  • Anhang B
  • Ein Muster-Meta-Dokument wird in verschiedenen Stufen der Veränderung gezeigt, wenn Dokumentendienstabforderungen implementiert und die Ergebnisse in das Meta-Dokument integriert werden.
    Schritt 0: Originaldokument
    [Bild]
  • Comparisonics ist eine revolutionäre Technologie zum Suchen von Audio- und Videodaten durch Geräusche und zum Visualisieren von Audiodaten durch Einfärben der Audio-Wellenform-Anzeige.
    ))) (((
    Sag mir, inwiefern Comparisonics bei folgenden Aktionen revolutionär ist:
    Audio-Editieren
    Video-Editieren
    Verwaltung von Mediadaten
    Andere Anwendungen
    ))) (((
    Wie kann ich Comparisonics testen?
    Durch Herunterladen des kostenlosen Comparisonics Audio-Players.
    Wie können Anwendungsprogramme Comparisonics nutzen?
    Über die Comparisonics-API.
    Informiere mich über die Comparisonics Corporation.
    ))) (((
  • Die Comparisonics-Technologie wurde auf der Tagung der Nationalen Vereinigung der Rundfunksender (National Association of Broadcasters, NAB) im April 1998 vorgestellt und von den Herausgebern des Magazins „Television Broadcast" zum Pick of the Show (interessantester Beitrag der Ausstellung) gewählt.
    ))) (((
  • Die Fähigkeit, ein bestimmtes gewünschtes Geräusch in einer Datenbank derartiger Geräusche aufzufinden, ist klar von weit reichendem wirtschaftlichem Wert. Der Durchbruch von Comparisonics in diesem Bereich ist ein sehr unterhaltsamer Zeitvertreib und besitzt darüber hinaus einen erheblichen potenziellen wirtschaftlichen Wert.
    – Dr. Harn M. Markowitz, Träger des Wirtschafts-Nobelpreises und Pionier der Computerwissenschaften, im Januar 1999
    ))) (((
    [Bild]
    Comparisonics-Anzeige der Wellenform eines Segmentes von „Songbird" von Kenny G
    ))) (((
    Copyright © 1999 Comparisonics Corporation. Alle Rechte vorbehalten.
  • Schritt 1: Konversion des Originaldokuments in ein Meta-Dokument, in diesem Fall dadurch, dass ihm eine Persönlichkeit zugewiesen wird. Die Persönlichkeit wird durch einen Dienstanbieter aktiviert (entweder ein Standard-Anbieter, auf den über den Dokumentenseelen-Daemon zugegriffen wird, der die Lebenden Dokumente steuert, oder ein auf jedwede Weise vom Dokumentenbesitzer spezifizierter anderer Anbieter).
    <?xml version="I.0" encoding="UTF-8" standalone="yes"?> PERSONALITY type='Techwatch" status="newborn">
    <INNATE>
    [Image]
  • Comparisonics ist eine revolutionäre Technologie zum Suchen von Audio- und Videodaten durch Geräusche und zum Visualisieren von Audiodaten durch Einfärben der Audio-Wellenformt-Anzeige.
    ))) (((
    Sag mir, inwiefern Comparisonics bei folgenden Aktionen revolutionär ist:
    Audio-Editieren
    Video-Editieren
    Verwaltung von Mediadaten
    Andere Anwendungen
    ))) (((
    Wie kann ich Comparisonics testen?
    Durch Herunterladen des kostenlosen Comparisonics Audio-Players.
    Wie können Anwendungsprogramme Comparisonics nutzen?
    Über die Comparisonics-API.
    Informiere mich über die Comparisonics Corporation.
    ))) (((
  • Die Comparisonics-Technologie wurde auf der Tagung der Nationalen Vereinigung der Rundfunksender (National Association of Broadcasters, NAB) im April 1998 vorgestellt und von den Herausgebern des Magazins Television Broadcast" zum Pick of the Show [interessantester Beitrag der Ausstellung] gewählt.
    ))) (((
  • Die Fähigkeit, ein bestimmtes gewünschtes Geräusch in einer Datenbank derartiger Geräusche aufzufinden, ist klar von weit reichendem wirtschaftlichem Wert. Der Durchbruch von Comparisonics in diesem Bereich ist ein sehr unterhaltsamer Zeitvertreib und besitzt darüber hinaus einen erheblichen potenziellen wirtschaftlichen Wert.
    – Dr. Harry M. Markowitz, Träger des Wirtschafts-Nobelpreises und Pionier der Computerwissenschaften, im Januar 1999
    ))) (((
    [Bild]
    Comparisonics-Anzeige der Wellenform eines Segmentes von „Songbird" von Kenny G
    ))) (((
    Copyright © 1999 Comparisonics Corporation. Alle Rechte vorbehalten.
    </INNATE>
    </PERSONALITY>
  • Schritt 2: Hier hat der Persönlichkeits-Dienst die einer TechWatch-Persönlichkeit zugeordneten Dokumentendienstabforderungen instanziiert. Die Dokumentendienstabforderungen laufen nun synchron oder asynchron, in einer festgelegten Reihenfolge oder ohne Reihenfolge über das Dokument. In "step2.xml" sind die 'Dokumentendienstabforderungen' (vom Persönlichkeitenserver bereitgestellt) alle von einander unabhängig, man würde jedoch wahrscheinlich einige Dokumentendienstabforderungen als festgelegte Reihe von Aktionen definieren.
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <PERSONALITY type="TechWatch">
    <UNFULFILLED-ACTION-LIST>
    <WANT> identifiziere Produkte </WANT>
    <WANT> identifiziere Unternehmen </WANT>
    <WANT> erstelle Organigramm </WANT>
    <WANT> suche Unternehmenshomepage </WANT>
    <WANT> suche Wettbewerber </WANT>
    <WANT> suche Lernprogramme </WANT>
    <WANT> suche White Papers </WANT>
    <WANT> Aktienkurse </WANT>
    <WANT> offene Stellen </WANT>
    <WANT> Pressemitteilungen </WANT>
    <WANT> themenverwandte Konferenzen </WANT>
    <WANT> im Besitz befindliche Patente </WANT>
    <WANT> Organigramm </WANT>
    <WANT> Unternehmensadresse </WANT>
    <WANT> Unternehmensfremde URLs, die Unternehmen erwähnen </WANT>
    <WANT> Wetterbericht Hauptsitz </WANT>
    <WANT> andere angebotene Produkte </WANT>
    </UNFULFILLED-ACTION-LIST>
    <INNATE>
    [Bild]
  • Comparisonics ist eine revolutionäre Technologie zum Suchen von Audio- und Videodaten durch Geräusche und zum Visualisieren von Audiodaten durch Einfärben der Audio-Wellenform-Anzeige.
    ))) (((
    Sag mir, inwiefern Comparisonics bei folgenden Aktionen revolutionär ist:
    Audio-Editieren
    Video-Editieren
    Verwaltung von Mediadaten
    Andere Anwendungen
    ))) (((
    Wie kann ich Comparisonics testen?
    Durch Herunterladen des kostenlosen Comparisonics Audio-Players.
    Wie können Anwendungsprogramme Comparisonics nutzen?
    Über die Comparisonics-API.
    Informiere mich über die Comparisonics Corporation.
    ))) (((
  • Die Comparisonics-Technologie wurde auf der Tagung der Nationalen Vereinigung der Rundfunksender (National Association of Broadcasters, NAB) im April 1998 vorgestellt und von den Herausgebern des Magazins „Television Broadcast" zum Pick of the Show [interessantester Beitrag der Ausstellung] gewählt.
    ))) (((
  • Die Fähigkeit, ein bestimmtes gewünschtes Geräusch in einer Datenbank derartiger Geräusche aufzufinden, ist klar von weit reichendem wirtschaftlichem Wert. Der Durchbruch von Comparisonics in diesem Bereich ist ein sehr unterhaltsamer Zeitvertreib und besitzt darüber hinaus einen erheblichen potenziellen wirtschaftlichen Wert.
    – Dr. Harn M. Markowitz, Träger des Wirtschafts-Nobelpreises und Pionier der Computerwissenschaften, im Januar 1999
    ))) (((
    [Bild]
    Comparisonics-Anzeige der Wellenform eines Segmentes von „Songbird" von Kenny G
    ))) (((
    Copyright © 1999 Comparisonics Corporation. Alle Rechte vorbehalten.
    </INNATE>
    </PERSONALITY>
  • Schritt 3: Hier wurde eines von den WANTs (Dokumentendienstabforderungen), nämlich „Unternehmensadresse" erfüllt. Metadaten wurden erstellt. Diese Dokumentendienstabforderung wurde von einem Dokumentenseelen-Daemon erfüllt, der:
    • 1. die Kontrolle über das Dokument erhielt,
    • 2. entsprechend einer nicht näher spezifizierten Strategie eine der Dokumentendienstabforderungen aus der Aktionsliste auswählte,
    • 3. einen nicht näher spezifizierten Dienstanbieter anrief, der den Dienst „Unternehmensadresse" für ein „TechWatch"-Dokument erfüllen konnte, und gab die bestehenden Metadaten und den <INNATE> ... </INNATE>-Teil des Dokuments an diesen Dienst weiter,
    • 4. die Ergebnisse <COMPANYADDRESS> ... </COMPANYADDRESS> von dem Dienst erhielt,
    • 5. <WANT> Unternehmensadresse </WANT> aus der Unfulfilled-Action-List [Liste der nicht erfüllten Aktionen] löschte,
    • 6. dem Eintrag <SATISFIED-WANT> einen Zeitstempel gab und dies in die Fulfilled-Action-List [Liste der erfüllten Aktionen] einfügte,
    • 7. das Dokument neu schrieb (möglicherweise mit Versionskontrolle) und
    • 8. die Kontrolle über das Dokument abgab.
  • Der Dienstanbieter kann ein internes Programm gewesen sein, das Webseiten sucht und decodiert. Es könnte ebenso auch ein ausgelagerter oder sogar menschlicher Dienst gewesen sein, der die erforderlichen Metadaten zurückgeliefert hat.
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <PERSONALITY type="TechWatch">
    <UNFULFILLED-ACTION-LIST>
    <WANT> identifiziere Produkte </WANT>
    <WANT> identifiziere Unternehmen </WANT>
    <WANT> erstelle Organigramm </WANT>
    <WANT> suche Unternehmenshomepage </WANT>
    <WANT> suche Wettbewerber </WANT>
    <WANT> suche Lernprogramme </WANT>
    <WANT> suche White Papers </WANT>
    <WANT> Aktienkurse </WANT>
    <WANT> offene Stellen </WANT>
    <WANT> Pressemitteilungen </WANT>
    <WANT> themenverwandte Konferenzen </WANT>
    <WANT> im Besitz befindliche Patente </WANT>
    <WANT> Unternehmensübersicht </WANT>
    <WANT> unternehmensfremde URLs, die Unternehmen erwähnen </WANT>
    <WANT> Wetterbericht Hauptsitz </WANT>
    <WANT> andere angebotene Produkte </WANT>
    </UNFULFILLED-ACTION-LIST>
    <FULFILLED-ACTION-LIST>
    <SATISFIED-WANT time="1999/10/23 19:10"> Unternehmensadresse </SATISFIED-WANT>
    </FULFILLED-ACTION-LIST>
    <COMPANYADDRESS>
    <NAME> Comparisonics Corporation </NAME>
    <STREET> P. O. Box 1960 </STREET>
    <CITY> Grass Valley </CITY>
    <STATE> California </STATE>
    <ZIP> 95945 </ZIP>
    <COUNTRY> USA </COUNTRY>
    <EMAIL> info@comparisonics.com </EMAIL>
    </COMPANYADDRESS>
    <INNATE>
    [Bild]
  • Comparisonics ist eine revolutionäre Technologie zum Suchen von Audio- und Videodaten durch Geräusche und zum Visualisieren von Audiodaten durch Einfärben der Audio-Wellenform-Anzeige.
    ))) (((
    Sag mir, inwiefern Comparisonics bei folgenden Aktionen revolutionär ist:
    Audio-Editieren
    Video-Editieren
    Verwaltung von Mediadaten
    Andere Anwendungen
    ))) (((
    Wie kann ich Comparisonics testen?
    Durch Herunterladen des kostenlosen Comparisonics Audio-Players.
    Wie können Anwendungsprogramme Comparisonics nutzen?
    Über die Comparisonics-API.
    Informiere mich über die Comparisonics Corporation.
    ))) (((
  • Die Comparisonics-Technologie wurde auf der Tagung der Nationalen Vereinigung der Rundfunksender (National Association of Broadcasters, NAB) im April 1998 vorgestellt und von den Herausgebern des Magazins „Television Broadcast" zum Pick of the Show [interessantester Beitrag der Ausstellung] gewählt.
    ))) (((
  • Die Fähigkeit, einen bestimmtes gewünschtes Geräusch in einer Datenbank derartiger Geräusche aufzufinden, ist klar von weit reichendem wirtschaftlichem Wert. Der Durchbruch von Comparisonics in diesem Bereich ist ein sehr unterhaltsamer Zeitvertreib und besitzt darüber hinaus einen erheblichen potenziellen wirtschaftlichen Wert.
    – Dr. Harry M. Markowitz, Träger des Wirtschafts-Nobelpreises und Pionier der Computerwissenschaften, im Januar 1999
    ))) (((
    [Bild]
    Comparisonics-Anzeige der Wellenform eines Segmentes von „Songbird" von Kenny G
    ))) (((
    Copyright © 1999 Comparisonics Corporation. Alle Rechte vorbehalten.
    </INNATE>
    </PERSONALITY>
  • Schritt 4: Hier sind einige weitere Aktionen erfüllt und einige neue „WANTs" entstanden. So fand beispielsweise der „suche Organigramm"-Server einen Präsidenten, einen CEO und ein Mutterunternehmen, jedoch keine Junior-Vorstandsmitglieder.
  • Dieser Dienst forderte einen neuen Dienst „suche Junior-Vorstandsmitglieder" (find junior officers) an.
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <PERSONALITY type='TechWatch">
    <UNFULFILLED-ACTION-LIST>
    <WANT> identifiziere Produkte </WANT>
    <WANT> identifiziere Unternehmen </WANT>
    <WANT> suche Unternehmenshomepage </WANT>
    <WANT> suche Wettbewerber </WANT>
    <WANT> suche Lernprogramme </WANT>
    <WANT> suche White Papers </WANT>
    <WANT> Aktienkurse </WANT>
    <WANT> offene Stellen </WANT>
    <WANT> themenverwandte Konferenzen </WANT>
    <WANT> Unternehmensübersicht </WANT>
    <WANT> unternehmensfremde URLs, die Unternehmen erwähnen </WANT>
    <WANT> Wetterbericht Hauptsitz </WANT>
    <WANT> andere angebotene Produkte </WANT>
    <WANT> suche Junior-Vorstandsmitglieder </WANT>
    </UNFULFILLED-ACTION-LIST>
    <FULFILLED-ACTION-LIST>
    <SATISFIED-WANT time="1999/10/23 19:10"> Unternehmensadresse </SATISFIED-WANT>
    <SATISFIED-WANT time="1999/10/24 00:10"> suche White Papers </SATISFIED-WANT>
    <SATISFIED-WANT time="1999/10/23 23:11"> im Besitz befindliche Patente </SATISFIED-WANT>
    <SATISFIED-WANT time="1999/10/23 22:16"> suche White Papers </SATISFIED-WANT>
    <SATISFIED-WANT time="1999/10/25 00:41"> suche Pressemitteilungen </SATISFIED-WANT>
    </FULFILLED-ACTION-LIST>
    <COMPANYADDRESS>
    <NAME> Comparisonics Corporation </NAME>
    <STREET> P. O. Box 1960 </STREET>
    <CITY> Grass Valley </CITY>
    <STATE> California </STATE>
    <ZIP> 95945 </ZIP>
    <COUNTRY> USA </COUNTRY>
    <EMAIL> info@comparisonics.com </EMAIL>
    </COMPANYADDRESS>
    <ORGCHART>
    <PARENT-ORG> <a href="http://www.gpsys.com"> Graham-Patten Systems </a> </PARENT-ORG>
    <CEO> <a href="http://www.isri.univ.edu/~rice/"> Dr. Stephen V. Rice </a> </CEO>
    <PRESIDENT> Dr. Stephen V. Rice </PRESIDENT>
    </ORGCHART>
    <WHITEPAPER>
    <a href="http:/www.comparisonics.com/WhitePaper.html"> Comparisonics White Paper </a>
    </WHITEPAPER>
    <PRESS_RELEASES>
    <RELEASE> <TITLE> Graham-Patten Launches Comparisonics Sound Matching Software </TITLE>
    <TEXT> <a href="http://www.gpsys.com/pr0406984.html">
    Text </a> </TEXT>
    <DATE> 6 Apr 1998 </DATE>
    </RELEASE>
    </PRESS-RELEASES>
    <PATENTS>
    <PATENT> <NUMBER> US4686689 </NUMBER>
    <TITLE> Phase-locked loop circuit </TITLE>
    <TEXT> <a href="http://www.patents.ibm.com/details?pn= US04686689 _">
    Text </a> </TEXT>
    <DATE> Aug 11, 1987 </DATE>
    </PATENT>
    </PATENTS>
    <INNATE>
    [Bild]
  • Comparisonics ist eine revolutionäre Technologie zum Suchen von Audio- und Videodaten durch Geräusche und zum Visualisieren von Audiodaten durch Einfärben der Audio-Wellenform-Anzeige.
    ))) (((
    Sag mir, inwiefern Comparisonics bei folgenden Aktionen revolutionär ist:
    Audio-Editieren
    Video-Editieren
    Verwaltung von Mediadaten
    Andere Anwendungen
    ))) (((
    Wie kann ich Comparisonics testen?
    Durch Herunterladen des kostenlosen Comparisonics Audio-Players.
    Wie können Anwendungsprogramme Comparisonics nutzen?
    Über die Comparisonics-API.
    Informiere mich über die Comparisonics Corporation.
    ))) (((
  • Die Comparisonics-Technologie wurde auf der Tagung der Nationalen Vereinigung der Rundfunksender (National Association of Broadcasters, NAB) im April 1998 vorgestellt und von den Herausgebern des Magazins „Television Broadcast" zum Pick of the Show [interessantester Beitrag der Ausstellung] gewählt.
    ))) (((
  • Die Fähigkeit, ein bestimmtes gewünschtes Geräusch in einer Datenbank derartiger Geräusche aufzufinden, ist klar von weit reichendem wirtschaftlichem Wert. Der Durchbruch von Comparisonics in diesem Bereich ist ein sehr unterhaltsamer Zeitvertreib und besitzt darüber hinaus einen erheblichen potenziellen wirtschaftlichen Wert.
    – Dr. Harn M. Markowitz, Träger des Wirtschafts-Nobelpreises und Pionier der Compu terwissenschaften, im Januar 1999
    ))) (((
    [Bild]
    Comparisonics-Anzeige der Wellenform eines Segmentes von „Songbird" von Kenny G
    ))) (((
    Copyright © 1999 Comparisonics Corporation. Alle Rechte vorbehalten.
    </INNATE>
    </PERSONALITY>

Claims (7)

  1. System zum Erlangen von Informationen mit Bezug auf ein Dokument, das Informationen enthält, umfassend: ein Meta-Dokument (100), das das Dokument und eine Reihe von mit dem Dokument verbundenen Dokumentendienstabforderungen enthält, wobei ein Dokumentendienst einen Prozess zum Verwenden eines Teils des Informationsinhaltes als einen Ausgangspunkt, um weitere Informationen mit Bezug auf diesen Inhalt zu erhalten, umfasst, und ein Steuerprogramm (220), eingerichtet, um eine Dokumentendienstabforderung aus der Reihe auszuwählen, die Datenkommunikation mit einem Dienstanbieter (210) zu initiieren und zu verwalten und um die ausgewählte Dokumentendienstabforderung zu erfüllen, dadurch gekennzeichnet, dass das Steuerprogramm eingerichtet ist, das Meta-Dokument periodisch für Dokumentendienstabforderungen aufzurufen, eine Dokumentendienstabforderung aus der Reihe von Dokumentendienstabforderungen auszuwählen und die Datenkommunikation mit einem Dienstanbieter zu initiieren und zu verwalten, um die ausgewählte Dokumentendienstabforderung zu erfüllen und jedwede Ergebnisse der ausgewählten Dokumentendienstabforderung in das Meta-Dokument zu integrieren.
  2. System nach Anspruch 1, wobei die Reihe von Dokumentendiensten einer vorgegebenen Sequenz von Aufrufen zu Dienstanbietern zum Extrahieren von Informationen aus anderen Dokumenten, Datenbanken und Datenspeichern und zum Suchen nach weiteren Informationen, die in Hinsicht auf jedwede aus anderen Dokumenten, Datenbanken und Datenspeichern extrahierten Informationen responsiv sind, folgt.
  3. System nach Anspruch 1 oder 2, wobei das Meta-Dokument bei Aufruf eingerichtet ist, um seine aktuelle Liste von Dokumentendienstabforderungen anzuzeigen.
  4. System nach einem der vorhergehenden Ansprüche, wobei die Dokumentendienstabforderungen einen Dienst abfordern, dessen Ergebnisse eine neue Dokumentendienstabforderung enthalten.
  5. Verfahren zum Erlangen von Informationen mit Bezug auf ein Dokument, das Informationen enthält, umfassend: Zuordnen einer Reihe von Dokumentendienstabforderungen zu dem Dokument (100), wobei ein Dokumentendienst einen Prozess zum Verwenden eines Teils des Informationsinhaltes als einen Ausgangspunkt, um weitere Informationen mit Bezug auf diesen Inhalt zu erhalten, umfasst, und Veranlassen, dass ein Steuerprogramm eine Dokumentendienstabforderung aus der Reihe auswählt und die Datenkommunikation mit einem Dienstanbieter initiiert und verwaltet, um die ausgewählte Dokumentendienstabforderung zu erfüllen, dadurch gekennzeichnet, dass das Steuerprogramm das Meta-Dokument periodisch für Dokumentendienstabforderungen aufruft, eine Dokumentendienstabforderung aus der Reihe von Dokumentendienstabforderungen auswählt und die Datenkommunikation mit einem Dienstanbieter initiiert und verwaltet, um die ausgewählte Dokumentendienstabforderung zu erfüllen und jedwede Ergebnisse der ausgewählten Dokumentendienstabforderung in das Meta-Dokument zu integrieren.
  6. Verfahren nach Anspruch 5, wobei die Ergebnisse aus dem ausgewählten Dokumentendienst eine neue mit dem Dokument verbundene Dokumentendienstabforderung enthalten.
  7. Verfahren nach Anspruch 6, wobei das Meta-Dokument bei Aufruf eingerichtet ist, um seine aktuelle Liste von Dokumentendienstabforderungen anzuzeigen.
DE60120822T 2000-04-07 2001-04-04 Meta-Dokument und Verfahren zum Verwalten von Meta-Dokumenten Expired - Lifetime DE60120822T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US543962 2000-04-07
US09/543,962 US7757168B1 (en) 2000-04-07 2000-04-07 Meta-document and method of managing

Publications (2)

Publication Number Publication Date
DE60120822D1 DE60120822D1 (de) 2006-08-03
DE60120822T2 true DE60120822T2 (de) 2007-06-21

Family

ID=24170235

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60120822T Expired - Lifetime DE60120822T2 (de) 2000-04-07 2001-04-04 Meta-Dokument und Verfahren zum Verwalten von Meta-Dokumenten

Country Status (4)

Country Link
US (2) US7757168B1 (de)
EP (1) EP1143356B1 (de)
JP (1) JP4849730B2 (de)
DE (1) DE60120822T2 (de)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7000194B1 (en) 1999-09-22 2006-02-14 International Business Machines Corporation Method and system for profiling users based on their relationships with content topics
US7757168B1 (en) 2000-04-07 2010-07-13 Xerox Corporation Meta-document and method of managing
US8176563B2 (en) * 2000-11-13 2012-05-08 DigitalDoors, Inc. Data security system and method with editor
US6842761B2 (en) * 2000-11-21 2005-01-11 America Online, Inc. Full-text relevancy ranking
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US6732090B2 (en) * 2001-08-13 2004-05-04 Xerox Corporation Meta-document management system with user definable personalities
US7284191B2 (en) 2001-08-13 2007-10-16 Xerox Corporation Meta-document management system with document identifiers
US7249034B2 (en) 2002-01-14 2007-07-24 International Business Machines Corporation System and method for publishing a person's affinities
WO2003060764A1 (fr) * 2002-01-16 2003-07-24 Fujitsu Limited Systeme de recherche d'informations
FR2844370B1 (fr) 2002-09-05 2008-05-09 Canon Kk Document electronique de description d'un service informatique
US7409452B2 (en) * 2003-02-28 2008-08-05 Xerox Corporation Method and apparatus for controlling document service requests from a mobile device
US9288000B2 (en) 2003-12-17 2016-03-15 International Business Machines Corporation Monitoring a communication and retrieving information relevant to the communication
US20060036451A1 (en) 2004-08-10 2006-02-16 Lundberg Steven W Patent mapping
US20060048042A1 (en) 2004-08-30 2006-03-02 Xerox Corporation Individually personalized customized report document system with user feedback
US20060048053A1 (en) 2004-08-30 2006-03-02 Xerox Corporation Individually personalized customized report document system
CN1783117A (zh) * 2004-11-29 2006-06-07 国际商业机器公司 一种协作系统和方法
US20110153509A1 (en) 2005-05-27 2011-06-23 Ip Development Venture Method and apparatus for cross-referencing important ip relationships
EP1913465A4 (de) * 2005-07-27 2010-09-22 Schwegman Lundberg & Woessner Patent-abbildung
US7831635B2 (en) * 2005-08-26 2010-11-09 Hewlett-Packard Development Company, L.P. Collecting information at a remote site
US8095876B1 (en) * 2005-11-18 2012-01-10 Google Inc. Identifying a primary version of a document
AR062609A1 (es) * 2006-08-30 2008-11-19 Thomson Global Resources Sistemas, metodos y sofware de flujo de trabajo con diseno centrado en el documento, basados en contenidos de los documentos, metadatos y contexto
KR100932896B1 (ko) 2006-12-08 2009-12-21 한국전자통신연구원 웹서비스 기반의 규칙 처리를 위한 디바이스 및 그 방법
US8161369B2 (en) * 2007-03-16 2012-04-17 Branchfire, Llc System and method of providing a two-part graphic design and interactive document application
US8020046B2 (en) * 2007-10-15 2011-09-13 International Business Machines Corporation Transaction log management
TWI351849B (en) * 2007-12-31 2011-11-01 Ind Tech Res Inst Apparatus and method for transmitting streaming se
US20100131513A1 (en) 2008-10-23 2010-05-27 Lundberg Steven W Patent mapping
US8230335B2 (en) * 2008-11-26 2012-07-24 Sap Ag Enhanced visual representations of company related data and generation of virtual business cards
US7984330B2 (en) * 2009-02-27 2011-07-19 Yahoo! Inc. Smart recovery of asynchronous processing
US9063932B2 (en) 2009-12-18 2015-06-23 Vertafore, Inc. Apparatus, method and article to manage electronic or digital documents in a networked environment
US8700682B2 (en) * 2009-12-24 2014-04-15 Vertafore, Inc. Systems, methods and articles for template based generation of markup documents to access back office systems
US20110173153A1 (en) * 2010-01-08 2011-07-14 Vertafore, Inc. Method and apparatus to import unstructured content into a content management system
US9384198B2 (en) 2010-12-10 2016-07-05 Vertafore, Inc. Agency management system and content management system integration
TW201235867A (en) * 2011-02-18 2012-09-01 Hon Hai Prec Ind Co Ltd System and method for searching related terms
US8731973B2 (en) 2011-04-19 2014-05-20 Vertafore, Inc. Overlaying images in automated insurance policy form generation
US9904726B2 (en) 2011-05-04 2018-02-27 Black Hills IP Holdings, LLC. Apparatus and method for automated and assisted patent claim mapping and expense planning
CN103164502A (zh) 2011-09-13 2013-06-19 吉菲斯股份有限公司 网络中的在线内容的管理
US8972385B2 (en) 2011-10-03 2015-03-03 Black Hills Ip Holdings, Llc System and method for tracking patent ownership change
US20130086093A1 (en) 2011-10-03 2013-04-04 Steven W. Lundberg System and method for competitive prior art analytics and mapping
EP2581842A1 (de) * 2011-10-13 2013-04-17 Gface GmbH Verfahren zum Erzeugen einer passwortbasierten benutzerdefinierten Webseite
FR2984560A1 (fr) * 2011-12-20 2013-06-21 Sagemcom Documents Sas Procede de gestion d'un document enrichi
US11461862B2 (en) 2012-08-20 2022-10-04 Black Hills Ip Holdings, Llc Analytics generation for patent portfolio management
GB2507722A (en) * 2012-09-28 2014-05-14 Barclays Bank Plc Document management system taking actions based on extracted data
US9767190B2 (en) 2013-04-23 2017-09-19 Black Hills Ip Holdings, Llc Patent claim scope evaluator
US11336648B2 (en) 2013-11-11 2022-05-17 Amazon Technologies, Inc. Document management and collaboration system
US9542391B1 (en) * 2013-11-11 2017-01-10 Amazon Technologies, Inc. Processing service requests for non-transactional databases
US9507814B2 (en) 2013-12-10 2016-11-29 Vertafore, Inc. Bit level comparator systems and methods
US9367435B2 (en) 2013-12-12 2016-06-14 Vertafore, Inc. Integration testing method and system for web services
US9747556B2 (en) 2014-08-20 2017-08-29 Vertafore, Inc. Automated customized web portal template generation systems and methods
US9600400B1 (en) 2015-10-29 2017-03-21 Vertafore, Inc. Performance testing of web application components using image differentiation

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5379423A (en) * 1988-09-28 1995-01-03 Hitachi, Ltd. Information life cycle processor and information organizing method using it
US5701451A (en) * 1995-06-07 1997-12-23 International Business Machines Corporation Method for fulfilling requests of a web browser
EP0786728B1 (de) * 1995-07-11 2011-02-09 Hitachi, Ltd. Dienstanbietungssystem
US6119101A (en) * 1996-01-17 2000-09-12 Personal Agents, Inc. Intelligent agents for electronic commerce
US5862325A (en) * 1996-02-29 1999-01-19 Intermind Corporation Computer-based communication system and method using metadata defining a control structure
US5973696A (en) 1996-08-08 1999-10-26 Agranat Systems, Inc. Embedded web server
US5999929A (en) 1997-09-29 1999-12-07 Continuum Software, Inc World wide web link referral system and method for generating and providing related links for links identified in web pages
US6070191A (en) * 1997-10-17 2000-05-30 Lucent Technologies Inc. Data distribution techniques for load-balanced fault-tolerant web access
JPH11259500A (ja) * 1998-03-11 1999-09-24 Nippon Telegr & Teleph Corp <Ntt> 情報蓄積・検索方法および情報蓄積・検索システム
JPH11296541A (ja) * 1998-04-14 1999-10-29 Fujitsu Ltd 構造化データ管理システム及び構造化データ管理プログラムを記録したコンピュータ読み取り可能な記録媒体
US6178430B1 (en) * 1998-05-11 2001-01-23 Mci Communication Corporation Automated information technology standards management system
US6240429B1 (en) * 1998-08-31 2001-05-29 Xerox Corporation Using attached properties to provide document services
US6567800B1 (en) * 1998-10-01 2003-05-20 At&T Corp. System and method for searching information stored on a network
US8006177B1 (en) * 1998-10-16 2011-08-23 Open Invention Network, Llc Documents for commerce in trading partner networks and interface definitions based on the documents
US6226675B1 (en) * 1998-10-16 2001-05-01 Commerce One, Inc. Participant server which process documents for commerce in trading partner networks
US6505219B1 (en) * 1999-01-27 2003-01-07 Xerox Corporation Process management system wherein process descriptions provide indices to document histories
US6493731B1 (en) * 1999-01-27 2002-12-10 Xerox Corporation Document management system for recording and viewing the history of document use
US6584466B1 (en) * 1999-04-07 2003-06-24 Critical Path, Inc. Internet document management system and methods
US7472349B1 (en) * 1999-06-01 2008-12-30 Oracle International Corporation Dynamic services infrastructure for allowing programmatic access to internet and other resources
JP2001075921A (ja) * 1999-09-03 2001-03-23 Fuji Xerox Co Ltd サービス処理装置およびサービス実行制御方法
EP1087306A3 (de) 1999-09-24 2004-11-10 Xerox Corporation Meta-Dokumente und entsprechendes Verwaltungsverfahren
US6772208B1 (en) * 1999-11-04 2004-08-03 International Business Machines Corporation Method and apparatus to restrict free hyperlinking by internet content distributors to web sites of original content producers
US6510432B1 (en) * 2000-03-24 2003-01-21 International Business Machines Corporation Methods, systems and computer program products for archiving topical search results of web servers
US7757168B1 (en) 2000-04-07 2010-07-13 Xerox Corporation Meta-document and method of managing
US6820075B2 (en) * 2001-08-13 2004-11-16 Xerox Corporation Document-centric system with auto-completion

Also Published As

Publication number Publication date
JP4849730B2 (ja) 2012-01-11
US8219904B2 (en) 2012-07-10
US20100235337A1 (en) 2010-09-16
EP1143356B1 (de) 2006-06-21
JP2001331511A (ja) 2001-11-30
EP1143356A3 (de) 2003-02-19
EP1143356A2 (de) 2001-10-10
DE60120822D1 (de) 2006-08-03
US7757168B1 (en) 2010-07-13

Similar Documents

Publication Publication Date Title
DE60120822T2 (de) Meta-Dokument und Verfahren zum Verwalten von Meta-Dokumenten
Byström et al. Conceptual framework for tasks in information studies
DE69527926T2 (de) Ein mit Rechner durchgeführtes Verfahren und System zur Informationswiederauffindung
DE60016772T2 (de) Verfahren und system für die publikation und revision von hierarchisch organisierten sätzen von statischen intranet- und internet-seiten
DE69622350T2 (de) Ein Geschichtsanzeigegerät
DE69625884T2 (de) Informationswiederauffindungssystem
Gries et al. Symbiota–A virtual platform for creating voucher-based biodiversity information communities
DE69729926T2 (de) Netzwerkbrowser
DE69835845T2 (de) Umgebung mit zwischen Mehreren geteilten Daten in der jede Datei unabhängige Sicherheitseigenschaften hat
DE69831307T2 (de) System und Verfahren zur Netzzugriffsverwaltung
DE69531599T2 (de) Verfahren und Gerät zum Auffinden und Beschaffen personalisierter Informationen
DE19718834B4 (de) Navigation in Hypermedien unter Verwendung weicher Hyperlinks
DE69527455T2 (de) Rechnersystem zum Verwalten von Informations-Resourcen
US20010039490A1 (en) System and method of analyzing and comparing entity documents
WO2009030288A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
EP1311989A2 (de) Verfahren zur automatischen recherche
DE10135445A1 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE10051021A1 (de) System, Verfahren und Computerprogramm zur Veröffentlichung interaktiver Web-Inhalte in einer statisch verknüpften Web-Hierarchie
Savolainen Pioneering models for information interaction in the context of information seeking and retrieval
Standing et al. Irradiating intranet knowledge: the role of the interface
EP1685505B1 (de) Datenverarbeitungssystem
EP1540540A1 (de) Publikationsverwaltungssystem für elektronische inhalte und verfahren
DE10215494A1 (de) Computersystem für das Wissensmanagement
Kazakos et al. Coastbase-The Virtual European coastal and marine data warehouse
Uehara et al. Enterprise model-based software architecture with server component integration

Legal Events

Date Code Title Description
8364 No opposition during term of opposition