Nothing Special   »   [go: up one dir, main page]

DE69228803T2 - Wartungs-vorrichtung und verfahren ausgelöst durch wissenbasiertemaschine - Google Patents

Wartungs-vorrichtung und verfahren ausgelöst durch wissenbasiertemaschine

Info

Publication number
DE69228803T2
DE69228803T2 DE69228803T DE69228803T DE69228803T2 DE 69228803 T2 DE69228803 T2 DE 69228803T2 DE 69228803 T DE69228803 T DE 69228803T DE 69228803 T DE69228803 T DE 69228803T DE 69228803 T2 DE69228803 T2 DE 69228803T2
Authority
DE
Germany
Prior art keywords
error
fault
replaceable
detected
report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69228803T
Other languages
English (en)
Other versions
DE69228803D1 (de
Inventor
David Grant Longmont Co 80503 Beal
Fletcher Lawrence Golden Co 80401 Hill
Nancy Rosann Golden Co 80403 Jurestovsky
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Storage Technology Corp
Original Assignee
Storage Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Storage Technology Corp filed Critical Storage Technology Corp
Publication of DE69228803D1 publication Critical patent/DE69228803D1/de
Application granted granted Critical
Publication of DE69228803T2 publication Critical patent/DE69228803T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2257Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Control Of Electric Motors In General (AREA)
  • Numerical Control (AREA)
  • General Factory Administration (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Description

    ERFINDUNGSGEBIET
  • Die vorliegende Erfindung betrifft wissensbasierte Systeme und speziell ein wissensbasiertes System zur Ausführung einer hochentwickelten maschinenausgelösten Wartungsfunktion für eine Vielzahl von Anlagen, von denen jede eine Reihe von Einheiten mit ersetzbaren Feldeinheiten enthält.
  • DAS PROBLEM
  • Auf dem Gebiet prozessorgesteuerter Kundenausrüstungen ist es problematisch, kostengünstige und zeitsparende Reparaturleistungen bereitzustellen. Normalerweise sind bei hochentwickelten prozessorgesteuerten Systemen ausgeklügelte Fehlerauswertungssysteme nötig, um in ihnen die ausgefallenen Betriebselemente zu erkennen. Zudem sind zur Bedienung dieser Fehlerauswertungssysteme hochqualifizierte Techniker erforderlich, die im typischen Fall mit einem Eilauftrag zum Kunden geschickt werden, wenn eine bestimmte Anlage bei ihm ausgefallen ist. Die schnelle Bereitstellung eines Technikers wird nötig, weil die Anlage des Kunden eine erhebliche finanzielle Investition darstellt und mitunter die Durchführung der Geschäftstätigkeit des Kunden vom weiterem Betrieb der Anlage abhängt. Daher sind zahlreiche Systeme zum Erfassen, Erkennen und sogar zur Vorhersage von Ausfällen bei komplizierten prozessorgesteuerten Kundenanlagen entwickelt worden.
  • Gegenwärtig gebräuchliche Fehlerauswertungseinrichtungen führen meist eine vorgegebene Reihe von Tests aus, mit denen die Funktionstüchtigkeit verschiedener Baugruppen oder Komponenten in der Anlage des Kunden überprüft wird. Diese Fehlerauswertungstests sind von den Ingenieuren des Herstellers geschrieben worden und befinden sich bereits in der Anlage des Kunden, wenn sie vom Hersteller geliefert oder von dem Techniker zum Kunden transportiert wird. Entweder werden diese Fehlerauswertungstests aktiviert, wenn ein Fehler in der Anlage des Kunden auftritt, oder aber sie laufen regelmäßig wie im Programm vorgesehen im Hintergrund in der Anlage ab. Normalerweise erkennen diese Tests, daß ein Fehler aufgetreten ist und versuchen, die Fehlerquelle zu isolieren, wodurch die Aufgabe für den Ingenieur vor Ort erleichtert wird, da die ausgefallene Einheit einer bestimmten ersetzbaren Feldeinheit (field replaceable unit - FRU) oder einer Baugruppe aus ersetzbaren Feldeinheiten zugeordnet wird. Darüber hinaus erzeugen existierende Fehlerauswertungssysteme ein Warnsignal, das das Auftreten eines Fehlers angibt, so daß sich der Kunde um den Besuch des Technikers kümmern kann. Einige Fehlerauswertungssysteme ermöglichen auch die direkte Meldung eines Defekts an den Wartungsdienst des Herstellers, ohne daß dies erst vom Kunden selbst getan werden muß. Bei allen vorhandenen Fehlerauswertungssystemen hängt die Effektivität des Systems von dem Testprogramm ab, das in der Anlage des Kunden vorprogrammiert ist. Die Handhabung des Wartungs- bzw. Fehlerauswertungssystems sowie die Bereitstellung von Wartungsleistungen an die Kunden ist eine sehr schwierige und kostspielige Aufgabe.
  • In WO-A-90105337 ist ein Verfahren und eine Vorrichtung zum Überwachen und Diagnostizieren der Funktionstüchtigkeit von Systemen offenbart. Dabei wird das Auftreten von Fehlern erfaßt und ein Modell des Systems verwendet, um so das System zu diagnostizieren und das ausgefallene Element zu identifizieren. Eine Vielzahl von Elementen, die zum Zeitpunkt des Defekts im System aktiv waren, werden allerdings nicht erfaßt.
  • LÖSUNG
  • Die oben beschriebenen Probleme werden durch die Merkmale gelöst, die in Anspruch 1 im Hinblick auf die Vorrichtung und in Anspruch 10 im Hinblick auf das Verfahren definiert sind. Zugleich wird durch das erfindungsgemäße wissensbasierte System, das in einer maschinenausgelösten Wartungsumgebung arbeitet, ein technischer Fortschritt auf diesem Gebiet erreicht und eine effiziente und schnelle Wartung der Kundenanlagen gewährleistet. Das wissensbasierte System ermöglicht die Funktion der Fehlerauswertung durch die Verwendung eines Experten- bzw. Wissensbanksystems, das in der Anlage des Kunden installiert ist. Das wissensbasierte System benutzt eine Reihe von Regeln und Hypothesen, um Daten auszuwerten, die von verschiedenen Punkten innerhalb der Anlage zusammengetragen werden, und überwacht so die Funkionstüchtigkeit der Anlage des Kunden. Dieses wissensbasierte System identifiziert das Auftreten eines Defekts innerhalb der Anlage und arbeitet mit Hilfe der Regeln, Hypothesen und erfaßten Daten an der Isolierung der Fehlerquelle in der Anlage und, soweit möglich, an der Eingrenzung oder Isolierung der defekten ersetzbaren Feldeinheit, die zum Ausfall führte. Durch die Fehlerauswertung wird eine Reihe von Daten erzeugt, die den Domänen- Knotenpfad der Betriebselemente bei jeder Störung der Kundenanlage angibt. Zum möglichst erfolgreichen Abschluß des Vorgangs werden mehrere Wiederholungsversuche ausgeführt, und jeder mißglückte Neuversuch erzeugt an sich einen ähnlichen Datensatz, der den dazugehörigen Domänen-Knotenpfad der Betriebselemente anzeigt. Diese Datensätze werden zusammen mit dem ursprünglichen Fehlersymptom-Code verwendet, der die Art des aufgetretenen Problems angibt, und daraufhin wird der festgestellte Defekt mit der Liste offener Komposit-Fehlerereignisse (composite failure event) verglichen, in der alle bekannten Fehler an der Kundenanlage aufgeführt sind, um verdächtige ersetzbare Feldeinheiten zu identifizieren. Bei den verdächtigen ersetzbaren Feldeinheiten handelt es sich um wahrscheinlich ausgefallene Einheiten, die möglicherweise den festgestellten Defekt ausgelöst haben. Hierbei werden also Knoten-Pfaddaten mit dazugehörigen Fehlersymptom-Codes und historischen Fehlerdaten in Zusammenhang gebracht, um unabhängig vom Eingriff des Technikers eine einzige Einheit in der Anlage des Kunden zu identifizieren, deren Ausfall am wahrscheinlichsten ist.
  • Kurze Beschreibung der Zeichnungen
  • Fig. 1 zeigt das verteilte, hierarchische, maschinenausgelöste Wartungssystem in Form eines Blockdiagramms;
  • die Fig. 2 und 3 zeigen diese Vorrichtung noch genauer;
  • Fig. 4 verdeutlicht weitere Details der Funktion zum Isolieren der ersetzbaren Feldeinheit;
  • Fig. 5 zeigt die Topologie der Kundenanlage;
  • Fig. 6 veranschaulicht ein typisches Format eines Fehlerberichts;
  • Fig. 7 zeigt den Prozeß des Erzeugens von Komposit-Fehlerereignissen und des Abgleichs mit Fehlerberichten und
  • Fig. 8 zeigt Details eines typischen Komposit-Fehlerereignissen.
  • DETAILLIERTE BESCHREIBUNG
  • In Fig. 1 ist das hierarchisch verteilte, wissensbasierte, maschinenausgelöste Wartungssystem im Blockdiagramm dargestellt. Wie in der Darstellung ist eine Vielzahl von Kundenanlagen 40-42 über entsprechende Verbindungsleitungen 50 - 53 an ein zentrales Wartungssystem 1 angeschlossen. Jede Kundenanlage 40 weist ein maschinenausgelöstes Wartungssystem 10 auf bzw. ist an ein solches angeschlossen, das die Verbindung zum zentralen Wartungssystem 1 herstellt und damit eine sofortige und effiziente Fehlererkennungsmeldung und -erfassung gewährleistet. Dabei kann jede Kundenanlage 40 direkt an das zentrale Wartungssystem 1 angeschlossen sein, oder aber mehrere Kundenanlagen 41, 42 können an ein regionales Wartungssystem 30 angeschlossen sein, und mehrere regionale Wartungssysteme 30 lassen sich wiederum an das zentrale Wartungssystem 1 anschließen. Das Wartungssystem ist hierarchisch angeordnet, wobei die lokale Kundenanlage 40-42 von dem dazugehörigen internen Wartungssystem 10 bedient wird; und eine Reihe von Kundenanlagen 41, 42 und deren dazugehörige Wartungssysteme 10 von einem entsprechenden regionalen Wartungssystem 30 bedient werden. Anschließend wird eine Anzahl regionaler Wartungssysteme 30 an das zentrale Wartungssystem 1 angeschlossen. Die Entwicklungsstufe und Komplexität jeder Ebene des Wartungssystems kann nach wirtschaftlichen Gesichtspunkten ausgewählt werden, wie z. B. dem Wert der installierten Anlagen, die auf diese Weise gewartet werden. Folglich kann das lokale Wartungssystem 10 weniger komplex als das regionale Wartungssystem 30 aufgebaut sein, da es in jeder Kundenanlage 40 vorhanden sein muß. Demgegenüber kann das regionale Wartungssystem 30 komplizierter strukturiert sein, da es eine Vielzahl von Kundenanlage 41-42 bedient und die aus all diesen Systemen zusammengetragenen Daten sichtet, um dadurch einen größeren Überblick über Fehlerzustände zu erhalten. Ebenso kann es sich bei dem zentralen Wartungssystem 1 um ein hochentwickeltes und kostenintensives System handeln, da es alle installierten Kundenanlagen 40-42 bedient und alle regionalen Wartungssysteme 30 unterstützt. Das zentrale Wartungssystem 1 verwaltet die Berichte über sämtliche Fehler, die an den Kundenanlagen 40-42 aufgetreten sind, und kann daher mit Hilfe dieser Daten Fehlerschemata erkennen, die über die Möglichkeiten der regionalen oder lokalen Wartungssysteme 30 bzw. 10 hinausgehen, weil diesen Systemen lediglich ein begrenzter Datenpool zur Verfügung steht.
  • Architektur der Kundenanlagen
  • Im typischen Fall besteht die Kundenanlage 40 aus mehreren ersetzbaren Feldeinheiten (FRU) 70-75, von denen jede eine bestimmte, genau abgegrenzte Funktion ausführt. In der Kundenanlage 40 können sich zudem weitere Elemente befinden, bei denen es sich insofern nicht um ersetzbare Feldeinheiten handelt, als sie nicht einfach von einem Techniker repariert oder ausgewechselt werden können. Zur einfacheren Beschreibung werden jedoch alle funktionalen Teilelemente in der Kundenanlage 40 als ersetzbare Feldeinheiten bezeichnet, ungeachtet dessen, ob sie tatsächlich im traditionellen Sinne als ersetzbare Feldeinheit physisch von einem Techniker ausgewechselt werden können oder nicht. Die physische Konfiguration der Kundenanlage 40 ist für das Konzept der vorliegenden Erfindung nicht von entscheidender Bedeutung, und der Begriff der ersetzbaren Feldeinheit sollte nicht als eine Einschränkung der Betriebseigenschaften des betreffenden Systems betrachtet werden.
  • In jeder Kundenanlage 40 befindet sich eine Reihe von funktionalen Erfassungsschaltungen 20, welche den Betriebszustand der ersetzbaren Feldeinheiten (70-75) in der Kundenanlage 40 überwachen. Diese funktionalen Erfassungsschaltungen 20 können ein Teil der ersetzbaren Feldeinheiten 70-75 oder separate Elemente sein und bestehen aus der Fehlererfassungs-, diagnostischen und Wartungseinrichtung, die auf dem Fachgebiet hinlänglich bekannt ist. Aus Gründen der Vereinfachung wird diese Vorrichtung nicht genauer beschrieben. Die Hard- und Software, die funktionale Erfassungsschaltungen 20 umfassen, senden immer dann einen Fehlerbericht an das lokale Wartungssystem 10, wenn die funktionalen Erfassungsschaltungen 20 feststellen, daß eine oder mehrere Hardware- oder Software-Komponenten innerhalb der Kundenanlage 40 ausgefallen sind.
  • Zur Effektivitätssteigerung des Fehlerberichtsprozesses ist der Bericht so abgefaßt, daß er die Architektur der Kundenanlage widerspiegelt, wobei es sich normalerweise um mehrere Prozesse handelt, die über Pfade ablaufen, welche Knoten miteinander verbinden. Jeder Pfad verbindet mindestens zwei Knoten miteinander und kann Elemente der Datenübertragung oder Prozeßsteuersignale oder beides aufweisen. Im typischen Fall sind in die Knoten Funktionen eingebaut, die als Teilsätze von physischen ersetzbaren Feldeinheiten 70-75 vorliegen. Dabei ist es möglich, daß ein Knoten vollständig irr einer ersetzbare Feldeinheit 70-75 enthalten ist oder am Rand einer ersetzbare Feldeinheit 70-75, die eine Schnittstelle mit einem Pfad bildet, oder aber als Funktion, die sich über Elemente von mehr als einer ersetzbaren Feldeinheit 70-75 erstreckt.
  • Analog zur "Standardisierung" von Vergleichsdaten läßt sich ein verallgemeinerter Sammelpfad beschreiben, der alle zum Beschreiben eines vollständigen Pfades nötigen Knoten enthält. In Fig. 5 ist dieses Konzept dargestellt. Ein Signal, das sich durch die Schaltung in NETZ 1 von links nach rechts bewegt, gelangt über einen verallgemeinerten Pfad durch das Knotennetzwerk, das aus einem Knoten A, einem Knoten B, einem Knoten C, einem Knoten D und einem Knoten E besteht. Demnach ist eine verallgemeinerte Domäne eine Abbildung, welche einen Teilsatz des verallgemeinerten Pfades zeigt. Zum Beispiel verdeutlichen die Knoten B, C und D einen verallgemeinerten Domänen-Teilsatz des verallgemeinerten Pfades A, B, C, D, E. Allerdings wird bei einem Prozeß ein ganz bestimmter Pfad nach ganz bestimmten Regeln genutzt. Wenn beispielsweise der Knoten C1 ein Steuerprozessor ist, der einen vollständigen verallgemeinerten Pfad durch die Anlage erhalten soll, dann muß er vorrangig oder anderweitig einen Knoten A erhalten, dann einen Knoten B, der über einen Pfad physisch mit dem Knoten A verbunden ist, dann einen Pfad zu sich selbst, usw. Eine spezifische Domäne des Knotens C1 könnte der Knoten A1, Knoten B1, Knoten C1, Knoten D2 und Knoten E2 sein.
  • Wenn ein Vorgang keinen ganzen verallgemeinerten Pfad benötigt, dann beschreibt die verallgemeinerte Domäne den verwendeten Teilsatz des verallgemeinerten Pfades. Eine aus den Knoten A, B, C und D bestehende verallgemeinerte Domäne hat dann eine spezifische Domäne, die genau beschreibt, welcher der Knoten A, B, C und D genutzt werden. Eine solche spezifische Domäne könnte beispielsweise der Knoten A1, Knoten B1, Knoten C1 und Knoten D1 sein.
  • Die spezifische Domäne wird zur Beschreibung jedes während einer Operation genutzten Satzes an Einrichtungen verwendet. Erkennt Knoten C1 während der oben beschriebenen Operation einen Fehler, erhält man dann wertvolle Informationen, wenn Knoten C1 die spezifische Domäne identifiziert, die aus allen Ressourcen besteht, die zum Zeitpunkt des Ausfalls in Betrieb waren, und zusätzlich Symptome des Fehlers angezeigt werden.
  • Architektur des lokalen Wartungssystems
  • Zu dem lokalen Wartungssystem 10 gehört ein internes Expertensystem 11 und eine Datenbank 12, die eine Auflistung aller Fehler enthält, die von den funktionalen Erfassungsschaltungen 20 erkannt werden. In der Datenbank 12 des Wartungssystems befindet sich zudem ein Verzeichnis der ersetzbaren Feldeinheiten 13. Darin sind alle ersetzbaren Feldeinheiten 70-75, die in der Kundenanlage 40 enthalten sind, sowie deren Verbindungen untereinander definiert, so daß diese Daten und Betriebsdiagnoseregeln von dem Expertensystem 11 zum Diagnostizieren und Isolieren der Systemfehler auf eine einzige defekte ersetzbare Feldeinheit 70-75 in der Kundenanlage 40 verwendet werden können. Mit dem maschinenausgelösten Sende-Empfänger 15 wird über dazugehörige Verbindungsleitungen 50 eine Datenverbindung zum zentralen Wartungssystem 1 hergestellt. Zudem schafft der maschinenausgelöste Wartungs-Sende-Empfänger 15 eine Verbindung zu allen anderen lokalen Fehlerberichtssystemen, wie z. B. das an den Host Computer 60 angeschlossene Service-Informations-Meldesystem (SIM) 16.
  • In Betrieb erkennen die funktionalen Erfassungsschaltungen 20 Fehler, die innerhalb der Kundenanlage 40 auftreten. Die Datenmenge, die von den funktionalen Erfassungsschaltungen 20 bereitgestellt wird, hängt von der Komplexität der Vorrichtung ab. Ein lokales Wartungssystem 10 empfängt den Wartungsbericht von den funktionalen Erfassungsschaltungen 20 und speichert diese Daten in der Datenbank 12, wodurch ein Protokoll aller bislang in der Kundenanlage 40 aufgetretenen Defekte entsteht. Das Expertensystem 11 analysiert den von den funktionalen Erfassungsschaltungen 20 eingegangenen Fehlerbericht mit Hilfe der Regeln und Hypothesen 14, die in das interne Expertensystem 11 einprogrammiert wurden. Das interne Expertensystem 11 kann von Sensor- und Datenerfassungspunkten innerhalb der Kundenanlage 40 zusätzliche Daten zurückladen oder die in der Kundenanlage 40 befindlichen Fehlerauswertungsfunktionen aktivieren, um zusätzliche Daten über den Betriebszustand der Kundenanlage 40 zu erhalten und eine dynamische Rekonfiguration (Fencing) durchzuführen und so eine Hypothese zu bestätigen oder zu widerlegen oder eine ersetzbare Feldeinheit aus dem Betrieb zu nehmen. Mit Hilfe des Regelsatzes 14 im internen Expertensystem 11 sowie mit dem Verzeichnis der ersetzbaren Feldeinheiten 13 kann das interne Expertensystem 11 die Quelle des erkannten Fehlers auf eine einzelne oder zumindest auf eine kleine Anzahl von ersetzbaren Feldeinheiten 70-75 innerhalb der Kundenanlage 40 eingrenzen.
  • Darüber gibt das interne Expertensystem 11 an, wie schwerwiegend der festgestellte Fehler ist und gibt damit einen Hinweis darauf, auf welcher Ebene die Instandsetzung erfolgen müßte.
  • Die Fehlerbearbeitung hängt von dem zugewiesenen Bewertungsgrad ab. So können Fehler einfach aufgezeichnet und die identifizierte ausgefallene ersetzbare Feldeinheit überwacht werden, oder aber es wird ein Warnsignal auf niedriger Stufe erzeugt, um dem Wartungspersonal anzuzeigen, daß eine nichtkritische Einheit in der Kundenanlage 40 ausgefallen ist. Über den maschinenausgelösten Wartungs- Sende-Empfänger 15 kann aber auch eine Verbindung zum regionalen oder zentralen Wartungssystem 30 bzw. 1 hergestellt und die sofortige Entsendung eines Reparaturtechnikers angefordert werden, wenn ein kritischer Fehler entdeckt worden ist, der sich erheblich auf den Betrieb der Kundenanlage 40 auswirkt.
  • Eine zweite Funktion des internen Expertensystems 11 besteht in der Isolierung der Fehlerquelle, wobei die ausgefallene ersetzbare Feldeinheit 70 abgeschaltet, rekonfiguriert oder in der Kundenanlage 40 isoliert wird. Wie dies genau erfolgt, hängt von der Architektur der Kundenanlage 40 und von der Art der defekten ersetzbaren Feldeinheit 70 ab. Die Isolierfunktion kann ganz einfach darin bestehen, den Zugriff der Steuerelemente der Kundenanlage 40 auf die ausgefallene ersetzbare Feldeinheit 70 zu verhindern.
  • Architektur des internen Expertensystems
  • In den Fig. 2 und 3 ist die Architektur des internen Expertensystems 11 im Blockdiagramm dargestellt. Bei dem internen Expertensystem 11 handelt es sich um eine in Echtzeit arbeitende Expertensystem-Maschine für einen speziellen Zweck, die mit einer Vergleichs-/Objektdatenbank 12 verbunden ist. Im internen Expertensystem 11 ist eine Fakten-Datenbank mit den gesammelten Fehlerberichten, ein Hypothesensatz (die Liste der verdächtigen ersetzbaren Feldeinheiten) und eine Inferenzmaschine mit dem Prozeß zum Ausführen der Regeln und Prozeduren enthalten. Durch Rekursion und Regelmodifizierungen kann dieses Expertensystem lernen. Zudem kann die Regel-Datenbank aus der Ferne - entweder durch das regionale oder das zentrale Expertensystem 30 bzw. 1 - modifiziert werden. Die Architektur des internen Expertensystems 11 aus den Fig. 2 und 3 besteht aus zwei Hauptteilbereichen. Die Vorschwellenbearbeitung 201 stellt die Prozesse dar, die im internen Expertensystem 11 ablaufen, bevor ein Fehler in der dazugehörigen Kundenanlage 40 einen kritischen Wert erreicht hat oder oft genug aufgetreten ist und dadurch die Aktivierung der Nachschwellenbearbeitung 202 erfordert, unter der die Isolierungs-, Wartungs- und Wiederherstellungsfunktionen des internen Expertensystems 11 zu verstehen sind.
  • In der vorliegenden Beschreibung wird der Begriff Fehler-Domäne verwendet, der die Grenzen angibt, in denen ein bestimmter Fehler auftritt. Zu der Fehler-Domäne gehört eine Reihe von Aspekten: physische, zeitliche sowie die Stärke, Dauerhaftigkeit, Schwelle, usw. Mitunter muß ein Fehler mehrmals auftreten, bevor die Fehler- Domäne überhaupt genau bestimmt werden kann. Diese Schwelle kann bei jedem Fehlersymptom bzw. jeder -klasse verändert werden. Sie wird empirisch ermittelt und modifiziert und zeigt sich im System als neues oder überarbeitetes Objekt. Bei dem Fehlerverwaltungsprozeß werden solange Informationen zusammengetragen, bis ein klares Bild von der Fehler-Domäne entsteht. An diesem Punkt erfolgt ein Übergang, durch den das eingebaute Expertensystem die Isolierung auf der Grundlage von Informationen über die Fehler-Domäne ausführen kann. Zu jeder entstehenden Fehler-Domäne gehört ein Komposit-Fehlerereignis (Composite Failure Event CFE), welches die Zustände identifiziert, die die Fehler-Domäne bislang durchlaufen hat, und zusammenfaßt, was gegenwärtig über die Fehler-Domäne bekannt ist. Der Vorschwellenbarbeitungsblock 201 erzeugt das Komposit-Fehlerereignis und akkumuliert die Daten.
  • Aufbau der Fehlerberichte
  • Bei einer Architektur mit mehreren Pfaden wie in Fig. 5 ist es möglich, daß ein Erkennungsprozessor die Fehlerbeseitigung innerhalb der gleichen Domäne, einer teilweise überlappenden Domäne oder einer völlig anderen Domäne koordiniert. Ziel der Fehlerbeseitigung ist es, den Ablauf beim Kunden vollständig wiederherzustellen. Dabei kann ein beachtlicher Einblick in eine festgestellte Störung gewonnen werden. Der Fehlerbericht faßt prägnante Fehlerdaten über das ursprüngliche Auftreten sowie Informationen über jeden unternommenen Schritt beim Versuch der Fehlerbehebung an der Kundenanlage 40 zusammen. Eingeschlossen in den Bericht ist eine Definition des defekten Pfades und jedes Pfades, an dem die Fehlerbehebung probiert wurde, und schließlich der Pfad, der zum Erfolg führte. Zudem befinden sich darin Codes für die Fehlersymptome des anfänglichen Auftretens und die anschließenden Aktivitäten der Störungsbeseitigung. Weiterhin werden Informationen über die Operation bereitgestellt, die die Kundenanlage 40 bei Auftreten des Defektes gerade ausführte.
  • In der oben angegebenen Fehler-Domäne sind die folgenden Komponenten enthalten:
  • 1. Physischer Ort Eine Operation, die versucht, eine durch den Ort begrenzte Komponente zu verwenden, führt zu dem Fehler.
  • 2. Dauerhaftigkeit Maßstab für die Wiederholungsrate des Fehlers. Eine geringe Dauerhaftigkeit zeigt einen vorübergehenden Zustand an.
  • 3. Funktionale/Betriebs- Eine Reihe von Funktionen und/oder grenze Operationen, die zu dem vorliegenden Fehler führen.
  • 4. Stärke Der Grad der Leistungsminderung des Systems, der aus diesem Fehler resultiert.
  • 5. Erkennbarkeit Die Symptome, an denen der Fehler erkannt wird.
  • Der Erkennungsprozessor initialisiert einen Fehlerbericht 600, in den er die anfänglichen Symptomdaten 601 eingibt und die spezifische Domäne 602 beschreibt, die zum Zeitpunkt des Defekts in Betrieb war, wie in Fig. 6 angegeben. Anschließend versucht er, den Betrieb an derselben spezifischen Domäne wiederherzustellen. Jeder Fehlerbehebungsvorgang für jene spezifische Domäne wird entsprechend gezählt. Daraus ergibt sich die Dauerhaftigkeit eines Fehlers innerhalb der spezifischen Domäne. Wenn der Prozessor die Kundenoperation an der ursprünglichen spezifischen Domäne erfolgreich beendet hat, ist die Fehlerbehebung abgeschlossen, und der Fehlerbericht 600 wird zum Fehlerverwaltungssystem weitergeleitet. Wurde der Fehler innerhalb eines Wiederholungsversuchs-Schwellenbereiches nicht erfolgreich behoben, wird ein Pfad zugewiesen, der sich in bestimmter Hinsicht von dem ursprünglichen Fehlerpfad unterscheidet, und dort die Fehlerbeseitigung in Angriff genommen. Die neue spezifische Domäne 603 wird dem ursprünglichen Fehlerbericht 601, 602 als Anlage beigefügt. In jedem spezifischen Domänenfeld wird die Anzahl der Versuche weitergezählt. Der Prozessor ändert die spezifische Domäne solange, bis entweder die Operation erfolgreich ist, oder der Prozessor feststellt, daß alle Optionen für die Fehlerbehebung ausgeschöpft sind und der Fehler am System nicht beseitigt werden kann. Jede einzelne Domänenvariante wird zusammen mit der Anzahl der ausgeführten Versuche an jener spezifischen Domäne an den Fehlerbericht 600 angehängt. Wenn entweder die Operation erfolgreich ist oder die Prozessoren aufgeben, dann ist die Fehlerbehebung beendet, und der Fehlerbericht 600 wird an das Fehlerverwaltungssystem weitergeleitet. Es ist möglich, jedoch nicht notwendig, die Fehlersymptomvarianten an der Domäne, in der sie beobachtet wurden, anzuzeigen. Auf diese Weise kann der Fehlerbericht 600 viele einzelne Fehlererfassungen zu einem einzigen Informationsprotokoll zusammenzufassen.
  • Während des Betriebs erkennen die funktionalen Erfassungsschaltungen 20 einen Fehler innerhalb einer der ersetzbaren Feldeinheiten 70-75 und erstellen einen Fehlerbericht 600 über den festgestellten Defekt. Der Fehlerbericht 600 wird in den Berichterstattungsprozeß 211 zum Erfassen neuer Fehler eingegeben, der die Informationen über die Domäne 602 und die Symptome 601 des eingegangenen Fehlerberichts 600 mit jenen, die zuvor eingegangenen sind, und jenen, für die ein Komposit-Fehler erzeugt wurde, vergleicht.
  • Komposit-Fehlerereignis
  • Ein Komposit-Fehlerereignis 701 wird immer dann aus einem Fehlerbericht 705 erzeugt, wenn der Fehlerbericht 705 einen Fehler in einer spezifischen Domäne beschreibt, der vorher noch nicht beobachtet wurde. In dem Komposit-Fehlerereignis 701 werden die Fehlerinformationen zu einem Bild aus einzelnen Vorgängen zusammengesetzt, die innerhalb einer Fehler-Domäne auftreten, und es verfolgt diese Fehler-Domäne über deren gesamte Lebensdauer. Jedes Komposit- Fehlerereignis erhält eine eigene Kennung (Flag), die wie in Fig. 7 zum Zuweisen aller Vorgänge benutzt wird, die aufgezeichnet werden können.
  • Wenn ein Fehlerbericht 705 beim Fehlerverwaltungssystem eingeht, wird das anfängliche Fehlersymptom 601 in eine verallgemeinerte Domäne von dem Domänendatenbanksystem 216 umgewandelt, welche die Pfade und Knoten angibt, an denen jener Fehler normalerweise beobachtet wird. Diese Beobachtungen entstehen aus dem Zusammentragen und Analysieren empirischer Ergebnisse in einem zentralen Expertensystem. Darüber hinaus gehört zu dem Fehlersymptom eine Stärkeschwelle, eine Dauerhaftigkeitsschwelle und eine charakteristische Auswirkung auf den normalen Betrieb. Auch diese Angaben wurden empirisch ermittelt. Wichtig ist hierbei im übrigen, daß die für den Fehler verallgemeinerte Domäne 610 sich in mancher Hinsicht von der während des Betriebs verallgemeinerten Domäne unterscheiden kann. Dabei ist aber immer eine gewisse Korrelation vorhanden. Die Informationen über die Schwelle 804 und die Domäne 802, 803 von der Erfassung am Anfang werden in dem Komposit-Fehlerereignis 701 festgehalten. Mit Hilfe der Informationen aus der ersten spezifischen Betriebs-Domäne 601 im Fehlerbericht wird in Schritt 703 die verallgemeinerte Fehler-Domäne 610 in eine "fehlerspezifische Domäne" 802 umgewandelt. Die fehlerspezifische Domäne 703 wird dann in 704 mit allen fehlerspezifischen Domänen 802 abgeglichen, die sich in den vorhandenen Komposit-Fehlerereignissen 702 befinden. Falls es keine Übereinstimmung gibt, ist ein Fehler aufgetreten, der nicht in die Profile anderer Fehler paßt, die gegenwärtig verfolgt werden. Es wird ein neues Komposit-Fehlerereignis 701 gebildet, um die neue fehlerspezifische Domäne aufzuspüren.
  • Isolier-Expertensystem
  • In Fig. 8 ist das Einfügen eines Fehlerberichts in ein Komposit-Fehlerereignis 701 dargestellt. Nachdem die fehlerspezifische Domäne mit einer Komposit-Fehlerspezifische Domäne abgeglichen wurde, wird die ermittelte Dauerhaftigkeit mit der Dauerhaftigkeitsschwelle 804 verglichen. Wird letztere überschritten, dann wird das Komposit-Fehlerereignis 701 zum Isolieren an das Isolier-Expertensystem 301 weitergeleitet. Ist die Dauerhaftigkeitsschwelle nicht überschritten, dann werden diese Vorgänge 805 weiterhin gezählt, und es wird der Eingang eines Fehlerberichts angezeigt. Das Zählergebnis wird mit der Fehlerstärkeschwelle 804 verglichen. Wenn selbige überschritten ist, dann wird das Komposit-Fehlerereignis 701 zur Isolierung an das Isolier-Expertensystem 301 weitergeleitet.
  • Nachdem das Komposit-Fehlerereignis zum Isolieren an das Isolier-Expertensystem 301 geschickt wurde, wird es mit einem Flag versehen, so daß der Eingang eines nachfolgenden Fehlerereignisses keine zusätzliche Isolierung nach sich zieht.
  • Vorschwellenbearbeitung
  • Ist zuvor in 702 ein Komposit-Fehlerereignis erzeugt worden, dann übermittelt der Prozeß 211 zum Erkennen eines neuen Fehlers die Daten zu einer Zähleinrichtung 212, mit der die Fehleranzahl für dieses bestimmte Komposit-Fehlerereignis schrittweise gezählt wird. Bei dem Zählprozeß 212 wird die gegenwärtig gespeicherte akkumulierte Zahl 805 aus der CFE-Datenbank 217 zurückgeladen und um eins erhöht, und diese Information wird in der CFE-Datenbank 217 aktualisiert. Anschließend werden die aktuellen Daten bei dem Schwellenerkennungsprozeß 213 verglichen, bei dem festgestellt wird, ob das Gesamtzählergebnis einzelner Ereignisse für dieses Komposit-Fehlerereignis den akkumulierten Schwellenwert 804 überschritten hat, der dieser Fehler-Domäne zugewiesen wurde, als der Komposit-Fehler erstmalig erzeugt wurde und die Fehler-Domäne in das Komposit-Fehlerereignis eingefügt wurde. Ist der Schwellenwert nicht überschritten, endet hier die Bearbeitung. Ist hingegen die Schwelle überschritten, die diesem spezifischen Komposit-Fehlerereignis zugewiesen worden war, dann aktiviert der Schwellenerfassungsprozeß 213 die Schwellenwert-Regeleinrichtung 215. Die Schwellenwert-Regeleinrichtung 215 übergibt die Steuerung an die Nachschwellenbearbeitung 303.
  • Wenn der eingegangene Fehlerbericht 705 nicht mit einem vorhandenen Fehler 702 in Zusammenhang gebracht werden kann, dann erzeugt der Prozeß 211 ein neues Komposit-Fehlerereignis 701. Dies geschieht, indem der Prozeß 211 die Schwellenwert-Regeleinrichtung 215 aktiviert, welche ein neues Komposit-Fehlerereignis schafft. Dabei wird der Prozeß 214 in Gang gesetzt, bei dem es sich um den Komposit-Fehler-Erzeugungsprozeß handelt, der Daten aus der Fehlerdomänen-Datenbank 216 zurücklädt und so ein neues Komposit-Fehlerereignis erzeugt: Die mit dem Fehlerbericht 705 eingegangenen Domänedaten werden für den Zugriff auf die Domänentabelle in der Domänendatenbank genutzt, aus der die Schwellen- und Stärkedaten für das Komposit-Fehlerereignis zugeführt werden.
  • Nachschwellenbearbeitung
  • In Fig. 3 ist der Nachschwellenprozeß 303 und seine Interaktion mit verschiedenen Datenbanken und mit dem Prozeß 301 zum Isolieren der ersetzbaren Feldeinheit dargestellt. Das Element 303 zur Nachschwellenbearbeitung führt zusammen mit dem Element 301 zum Isolieren der ersetzbaren Feldeinheit den Schritt der Isolierung durch, wobei auch die Liste der verdächtigen ersetzbaren Feldeinheiten in der Datenbank 310 und die Regel-Datenbank 309 aktualisiert werden. Handelt es sich bei dem gerade analysierten Fehler um ein Rekursionsereignis, dann stellt das Rekursionserfassungselement 302 fest, daß der vorliegende Fehler eine Wiederholung von bereit zuvor erkannten Fehlern ist und paßt die Liste 310 der verdächtigen FRU für das Komposit-Fehlerereignis an und zieht daraufhin die FRU nicht mehr weiter bei der Frage in Betracht, durch wessen Eingrenzung (Fencing) oder Austausch es zum Setzen des Rekursions-Flags kam. Diese Einrichtung führt auch die in der Regel-Datenbank 309 enthaltenen Regeln aus, um so viele verdächtige ersetzbare Feldeinheiten wie möglich aus der Liste der verdächtigen ersetzbaren Feldeinheiten in der Datenbank 310 der verdächtigen ersetzbaren Feldeinheiten zu entfernen. Zu den Regeln kann die Diagnose, das Untersuchen von Daten oder das Isolieren potentieller ausgefallener Einheiten gehören, wodurch ersetzbare Feldeinheiten aus der Liste verdächtiger ersetzbarer Feldeinheiten eliminiert werden sollen. Ziel des Prozesses ist die Fokussierung auf eine einzige ersetzbare Feldeinheit, die zu dem festgestellten Defekt geführt hat. Dazu ist auch ein gelenkter Prozeß 307 vorgesehen, der eine Schnittstelle zu einem Techniker schafft, um manuell eine ausgefallene ersetzbare Feldeinheit auszutauschen und die vom Techniker anstelle der defekten Einheit eingebaute Ersatzeinheit zu testen. Der im Element 301 ausgeführte Isolierungsprozeß ist beendet, wenn zum einen zwar noch Regeln, aber keine weiteren ersetzbare Feldeinheiten in der Liste der verdächtigen ersetzbaren Feldeinheiten mehr vorhanden sind, oder zum anderen, wenn alle Regeln abgearbeitet worden sind.
  • Isolierungsprozeß
  • In Fig. 4 sind weitere Details des Prozesses 301 zum Isolieren der ersetzbaren Feldeinheit dargestellt. Bei diesem Prozeß wird mit Hilfe der Domänenkennung aus dem Komposit-Fehlerereignis als Schlüssel eine Liste der verdächtigen ersetzbaren Feldeinheiten erstellt und aus der allgemeinen Domäne in die spezifische Domäne übertragen. Dabei wird die Liste der verdächtigen ersetzbaren Feldeinheiten um drei Mechanismen verringert: Zuerst wird bei gesetztem Rekursions-Auslöser für das Komposit-Fehlerereignis ein Element aus der Liste der verdächtigen ersetzbaren Feldeinheiten entfernt, das die Rekursion auslöst. Zweitens wird die Liste der verdächtigen ersetzbaren Feldeinheiten um eine Pfadkoinzidenz modifiziert, die über allen Pfaden aus einer Reihe von Fehlerberichten liegt, die die Kennung des vorliegenden Komposit-Fehlerereignisses betreffen. Schließlich wird der Regelsatz für diese Domäne aufgerufen, der bis zu Ende absolviert werden kann. Im Prozeß 407 werden auch dann noch Regeln ausgeführt, wenn die Liste der verdächtigen ersetzbaren Feldeinheiten erschöpft ist, da bestimmte Regeln befehlsorientiert sind und ungeachtet der Liste der verdächtigen ersetzbaren Feldeinheiten eine Ausführung erfordern. Nachdem die Regeln in Prozeß 407 vollständig ausgeführt wurden, werden die Ergebnisse zum Aktualisieren der Datenbank 310 für verdächtige ersetzbare Feldeinheiten, der Datenbank 217 für Komposit-Fehlerereignisse, des Fehlerberichtprotokolls 308 und des Isolierungs-Datenbanksystems 406 genutzt. Die im Komposit-Fehlerereignis enthaltene fehlerspezifische Domäne 802 (Fig. 8) gibt alle Knotenpunkte an, die als Ursache des Fehlermodus, der durch das Komposit-Fehlerereignis dargestellt wird, in Betracht kommen. Die spezifischen Knoten können innerhalb der physischen Architektur der ersetzbaren Feldeinheiten gesetzt werden, ein Prozeß, aus dem eine FRU-Verdachtsliste 809 (SFL) hervorgeht.
  • Der Isolierungsprozeß versucht, so viele verdächtige FRUs wie möglich aus der FRU-Verdachtsliste zu eliminieren und die verbleibenden Elemente danach zu ordnen, wie wahrscheinlich sie das Problem verursacht haben. Die Koinzidenz- Domäne 807 (Fig. 8) innerhalb des Komposit-Fehlerereignisses hebt sich in dieser Analyse hervor, was zu der Annahme führt, daß die Ergebnisse hinsichtlich dieser Knoten mit den meisten (wenn nicht allen) Fehlerereignissen zu tun hatten. Dies kann als logisches UND für alle betriebsspezifischen Domänen umgesetzt werden, oder aber als ausgeklügeltes Zählsystem, bei dem jedes Element der Domäne bei jedem Erscheinen gezählt wird.
  • Wenn irgendwann einmal ein Element einer SFL ersetzt wird, wird ein Rekursions- Flag 810 innerhalb des Komposit-Fehlerereignisses gesetzt (Fig. 8). Tritt nachfolgend ein Fehler auf, der in die fehlerspezifische Domäne (und folglich in das Komposit-Fehlerereignis) fällt, dann wird daraus sofort klar, daß der Austausch der ersetzbaren Feldeinheit nicht den Fehlerzustand aufgehoben hat. Das Rekursion- Flag führt dazu, daß eine neue Runde der Isolierung an dem Komposit- Fehlerereignis (wie oben- beschrieben) stattfindet, nachdem zuerst das ausgetauschte Element aus der SFL nicht mehr in Betracht kommt. Dadurch entsteht eine neue SFL mit einer neuen Rangordnung.
  • Wenn ein Element der SFL ausgetauscht wird, wird das Komposit-Fehlerereignis vorübergehend geschlossen und zudem das Rekursions-Flag gesetzt. Dieser Zustand wird über eine vorgegebene Dauer aufrechterhalten, in der gewährleistet werden kann, daß der Fehler behoben wurde. Nach Ablauf der vorübergehenden Schließung wird das Komposit-Fehlerereignis geschlossen, während es gleichzeitig protokolliert und aus dem aktiven Vergleich mit neuen Fehlerberichten herausgenommen wird.
  • Einbeziehung des Menschen
  • Auf allen Ebenen ist ein Eingreifen des Menschen möglich, da es durch die Systeminteraktion auf jeder Stufe gefördert wird. Dies erfolgt als Reaktion auf maschinenausgelöste Wartungsereignisse (Machine Initiated Maintenance Events - MIM) 410. Das MIM kann eine oder mehrere verdächtige FRUs oder aber auch gar keine FRUs zu Tage bringen. Im ersten Fall erfordert die Interaktion einen Wechsel der FRU, der zweite Fall ist als Techniker-Warn-MIM bekannt, da bei der Problemlösung meist ein zentrales Expertensystem und auch Techniker zur Unterstützung herangezogen werden.
  • Die einzigartige Kennung des Komposit-Fehlerereignisses ist auch im MIM enthalten und bietet eine Bezeichnung für das Problem, die zur Absolvierung der MIMs von dem Techniker beim Austausch von FRUs benutzt wird.
  • Dort, wo eine oder mehrere verdächtige FRUs im MIM angegeben sind, ruft der Techniker einen interaktiven Dialog auf, auch 'Geführter FRU-Austausch' 307 bzw. GFR genannt. Der Techniker nutzt den GFR 307, um die Kennung des Komposit- Fehlerereignisses auszuwählen, für den der MIM ausgesandt wurde, und wählt die FRU aus, die aus der SFL ausgewechselt wird, welche im Komposit-Fehlerereignis weitergeführt wird. Daraufhin initiiert der GFR 307 die Eingrenzung auf der erforderlichen Ebene, so daß die FRU ausgetauscht werden kann, ohne die Leistung des Teilsystems zu entfernen, und fordert den Techniker auf, das Auswechseln fortzusetzen. Anschließend bestätigt der GFR den Austausch und ruft eine Reihe von diagnostischen Validierungsprozessen auf, die die isolierte FRU testen. Nach erfolgreicher Beendigung nimmt der GFR in Anwesenheit des Technikers die FRU in Betrieb, wobei sie genau überwacht wird. Danach setzt der GFR das Rekursions- Flag (810) im Komposit-Fehlerereignis und ändert den Status (806) des Komposit- Fehlerereignisses, um das beginnende Schließen des Komposit-Fehlerereignisses anzuzeigen.
  • Sämtliche diagnostischen Informationen und solche über FRU-Änderungen werden im Fehlerberichtprotokoll 308 festgehalten, das zudem die zugrundeliegenden Fehlerberichte enthält. Wie schon bei den Fehlerberichten werden die genannten Informationen mit der einzigartigen Kennung des Komposit-Fehlerereignisses verschlüsselt. Dadurch wird eine interne oder externe Rekonstruktion des Problems möglich.
  • In einigen Fällen ist allerdings das lokale Expertensystem 11 nicht in der Lage, die Ursache des Problems mit Gewißheit zu identifizieren. Dies geschieht, wenn es beispielsweise keine Listen mit verdächtigen FRUs gibt. Das kann an einer nicht korrekten Diagnose, einem falschen FRU-Austauschverfahren seitens des Technikers, einer Klasse von Defekten an ersetzbaren Feldeinheiten von Kunden, die eine gegebene FRU-Population betrifft, oder an bestimmten Softwarefehlern liegen. In all diesen Fällen ist die Isoliermaschine 301 nicht imstande, zu einer SFL zu gelangen und gibt einen Techniker-Warnsignal-MIM aus.
  • Der Techniker-Wam-MIM wird zum MIM-Empfänger (61) gelenkt, der die aus dem lokalen Expertensystem 11 eingegangenen Informationen überprüft und seinen Regelsatz ausgehend von dem aktuellen universellen Wissen validiert. Wenn das technische Expertensystem 63 eine neue Lösung kennt (wie beispielsweise eine neue Softwareversion, die einen Fehler behoben hat), leitet es diese Information nach unten weiter. Ansonsten gelangt ein Signal an die Technikerzentrale, daß Unterstützung durch einen Fachmann benötigt wird. Auf diese Weise können die Fachkräfte auf jene Probleme konzentriert werden, die neu sind oder über das bereits bekannte Fachwissen hinausgehen. Das technische Expertensystem (63) schlägt weiterhin Tätigkeitsabläufe vor, die auf Problemquellen basieren, oder bekanntermaßen ausgeschlossen werden müssen oder nicht zu einem Problem beitragen.
  • Wenn die Lösung des Problems erkannt wurde, wird sie vom Ingenieur in Form neuer Regeln und Hypothesen in das technische Expertensystem 63 eingegeben. Vom zentralen System wird vorgesehen, daß allen nachgeordneten Systemen, die von dem Fehler betroffen sind, die Lösung zur Verfügung gestellt wird.
  • Eine weitere Analyseebene entsteht durch das Firmen-Expertensystem (62), das Fehlertrends und die FRU-Zuverlässigkeit bewertet. Es wendet dasselbe Verfahren der Erzeugung von Komposit-Fehlerereignissen und der Isolierung an, um Defekte innerhalb von FRUs auf der Ebene der Komponenten auszuwerten. Dabei wird das breite Spektrum verfügbarer Fehlerinformationen mit Hilfe von genaueren Domäne- Informationen ausgewertet, um Pfade innerhalb von FRUs zu verfolgen. Daraufhin führt es den Abgleich der Voraussagen mit Ergebnissen durch, die durch die Untersuchung zurückgegebener, ausgesonderter FRUs erhalten wurden, und gibt eine Warnung aus, wenn eine Komponente die Zuverlässigkeitsstandards überschreitet.
  • Das System kann zwischen Ausfällen von Bauteilen, die universell an dem Bauteil auftreten, und jenen unterscheiden, die nur in bestimmten Anwendungen auftreten. Die menschliche Interaktion mit diesem System findet auf einer Ebene analog zum GFR statt, bei dem das System den Techniker bei seiner Auswertung einer ausgefallenen FRU führt und der Techniker seine Beobachtungen als Antwort eingibt. Zwar wurde vorstehend eine spezielle Ausführungsform der Erfindung offenbart, doch es wird davon ausgegangen, daß Fachleute auf dem Gebiet alternative Ausführungsformen entwickeln können und werden, die in den Schutzumfang der beiliegenden Ansprüche fallen.

Claims (18)

1. Maschinenausgelöste Wartungsvorrichtung, die mit einem Kundensystem (40) verbunden und mit diesem zusammengestellt ist, die eine Vielzahl von ersetzbaren Feld-Einheiten (70-75) umfaßt, von denen jede mindestens ein Betriebselement enthält, wobei die Vorrichtung so ausgelegt ist, um ausgefallene, ersetzbare Feld-Einheiten in dem Kundensystem zu erfassen und zu identifizieren, und die aufweist:
eine Einrichtung (20) zum Erfassen des Vorhandenseins eines Fehlers in dem Kundensystem (40) und Erzeugen von Daten, die sich auf den Fehler beziehen;
eine Einrichtung (306) zum Beibehalten einer Fehler-Analyse-Historie, die Daten enthält, die jede der ersetzbaren Feld-Einheiten (70-75) und zugeordneter Komposit-Fehler-Daten, die für bekannte, ersetzbare Feld-Einheit-Fehler repräsentativ sind, identifizieren;
eine Einrichtung (201) zum Vergleichen der Daten, die sich auf den Fehler beziehen, mit der Fehler-Analyse-Historie; und
eine Einrichtung (202) zum Identifizieren mindestens einer ausgefallenen, ersetzbaren Feld-Einheit basierend auf dem Vergleich,
dadurch gekennzeichnet,
daß die Erfassungseinrichtung (20) eine Einrichtung zum Identifizieren eines Fehler-Modus und aller solcher Betriebselemente umfaßt, die aktiv in den ersetzbaren Feld-Einheiten während des Betriebs, bei dem der Fehler erfaßt wurde, waren;
und daß die Vorrichtung eine Einrichtung (201) zum Erzeugen eines Fehlerberichts zum Vergleich mit der Fehler-Analyse-Historie umfaßt, wobei der Fehlerbericht Daten enthält, die für den erfaßten Fehler relevant sind, umfassend eine Identifikation des Fehler-Modus und der Betriebselemente, die als aktiv zu der Zeit des Fehlers identifiziert sind;
und eine Einrichtung (217) zum Speichern des Fehlerberichts für eine mögliche Hinzufügung zu der Fehler-Analyse-Historie.
2. Vorrichtung nach Anspruch 1, wobei die Vergleichseinrichtung (201) aufweist:
eine Einrichtung (211) zum Erzeugen einer Liste der Elemente, die für eine Vielzahl der Fehlerberichte gemeinsam sind;
und eine Einrichtung (214) zum Auflisten der gelisteten Elemente zu mindestens einer ersetzbaren Feld-Einheit, die die gelisteten Elemente enthält.
3. Vorrichtung nach Anspruch 2, wobei die identifizierende Einrichtung (202) umfaßt: eine Einrichtung (301) zum Priorisieren der mindestens einen ersetzbaren Feld-Einheit, um eine am wahrscheinlichsten ausgefallene, ersetzbare Feld-Einheit zu identifizieren.
4. Vorrichtung nach Anspruch 3, die weiterhin umfaßt: eine Einrichtung (302), die auf das Ersetzen der identifizierten, am wahrscheinlichsten ausgefallenen, ersetzbaren Feld-Einheit und das darauffolgende Wiederauftreten des erfaßten Fehlers innerhalb einer vorbestimmten Zeitperiode zum Identifizieren einer neuen, am wahrscheinlichsten ausgefallenen, ersetzbaren Feld-Einheit anspricht.
5. Vorrichtung nach Anspruch 1, die weiterhin aufweist: eine Einrichtung (215), die auf den gespeicherten Fehlerbericht zum Erzeugen einer Fehler-Stärke-Indikation, die das Auftreten des erfaßten Fehlers bei dem Kundensystem (40) bezeichnet, anspricht.
6. Vorrichtung nach Anspruch 1, die weiterhin aufweist: eine Einrichtung (812), die auf den gespeicherten Fehlerbericht zum Produzieren einer Fehler-Dauerhaftigkeits-Indikation, die die Schwierigkeit bezeichnet, den erfaßten Fehler zu beheben, anspricht.
7. Vorrichtung nach Anspruch 1, die weiterhin aufweist: eine Einrichtung (301), die auf den erfaßten Fehler zum Aktivieren des Kundensystems (40), um die Operation aktiv während des erfaßten Fehlers erneut zu behandeln, um die Dauerhaftigkeit des erfaßten Fehlers zu bestimmen, anspricht.
8. Vorrichtung nach Anspruch 7, wobei die aktivierende Einrichtung (301) wiederholt das Kundensystem aktiviert, bis diese Operation erfolgreich ist oder eine vorbestimmte Anzahl von Versuchen initiiert ist.
9. Vorrichtung nach Anspruch 1, die weiterhin umfaßt:
eine Einrichtung (214), die auf die Vergleichseinrichtung (201) anspricht, die dahingehend fehlschlägt, den erzeugten Fehlerbericht zu den Komposit-Fehler-Daten in der Fehler-Analyse-Historie anzupassen; zum Erzeugen von neuen Komposit-Fehler-Daten, die für den erzeugten Fehlerbericht repräsentativ sind;
eine Einrichtung (217) zum Anhängen der produzierten Komposit-Fehler-Daten an die Fehler-Analyse-Historie.
10. Verfahren für eine maschinenausgelöste Wartungsvorrichtung, die mit einem Kundensystem verbunden und mit diesem zusammengestellt ist, das eine Vielzahl von ersetzbaren Feld-Einheiten besitzt, von denen jede mindestens ein Betriebselement enthält, zum Identifizieren ausgefallener, ersetzbarer Feld-Einheiten in dem Kundensystem, das die Schritte aufweist:
Erfassen des Vorhandenseins eines Fehlers in dem Kundensystem und Erzeugen von Daten, die sich auf den Fehler beziehen;
Beibehalten einer Fehler-Analyse-Historie, die Daten enthält, die jede der ersetzbaren Feld-Einheiten und zugeordnete Komposit-Fehler-Daten, die für bekannte Fehler ersetzbarer Feld-Einheiten repräsentativ sind, identifizieren;
Vergleichen der Daten, die sich auf den Fehler beziehen, mit der Fehler-Analyse-Historie; und
Identifizieren mindestens einer ausgefallenen, ersetzbaren Feld-Einheit basierend auf dem Vergleich;
gekennzeichnet durch die Schritte:
Identifizieren eines Fehler-Modus und aller solcher Betriebselemente, die in den ersetzbaren Feld-Einheiten während des Betriebs aktiv waren, bei dem der Fehler erfaßt wurde;
Erzeugen eines Fehlerberichts zum Vergleichen mit der Fehler-Analyse-Historie, wobei der Fehlerbericht Daten enthält, die für den erfaßten Fehler relevant sind, umfassend eine Identifikation des Fehler-Modus und der Betriebselemente, die als aktiv zu der Zeit des Fehlers identifiziert sind; und
Speichern des Fehlerberichts für eine mögliche Hinzufügung zu der Fehler-Analyse-Historie.
11. Verfahren nach Anspruch 10, wobei der Schritt eines Vergleichens umfaßt:
Erzeugen einer Liste der Elemente, die für eine Vielzahl der Fehlerberichte gemeinsam sind;
Auflisten der gelisteten Elemente zu mindestens einer ersetzbaren Feld-Einheit, die die gelisteten Elemente enthält.
12. Verfahren nach Anspruch 11, wobei der Schritt eines Identifizierens umfaßt: Priorisieren der mindestens einen ersetzbaren Feld-Einheit, um eine am wahrscheinlichsten ausgefallene, ersetzbare Feld-Einheit zu identifizieren.
13. Verfahren nach Anspruch 12, das weiterhin den Schritt umfaßt: Identifizieren, in Abhängigkeit des Ersetzens der identifizierten, am wahrscheinlichsten ausgefallenen, ersetrbaren Feld-Einheit und des darauffolgenden Wiederauftretens des erfaßten Fehlers innerhalb einer vorbestimmten Zeitperiode, einer neuen, am wahrscheinlichsten, ausgefallenen, ersetzbaren Feld-Einheit.
14. Verfahren nach Anspruch 10, das weiterhin den Schritt aufweist: Produzieren, in Abhängigkeit des gespeicherten Fehlerberichts, einer Fehler-Stärke-Indikation, die das Auftreffen des erfaßten Fehlers bei dem Kundensystem (40) bezeichnet.
15. Verfahren nach Anspruch 10, das weiterhin den Schritt aufweist: Produzieren, in Abhängigkeit des gespeicherten Fehlerberichts, einer Fehler-Dauerhaftigkeits-Indikation, die die Schwierigkeit bezeichnet, die erforderlich ist, um den erfaßten Fehler zu beheben.
16. Verfahren nach Anspruch 10, das weiterhin den Schritt aufweist: Aktivieren, in Abhängigkeit des erfaßten Fehlers, des Kundensystems (40), um die Operation, die während des erfaßten · Fehlers aktiv ist, erneut zu behandeln, um die Rekursivität des erfaßten Fehlers zu bestimmen.
17. Verfahren nach Anspruch 16, wobei der Schritt eines Aktivierens wiederholt das Kundensystem (40) aktiviert, bis die Operation erfolgreich ist oder eine vorbestimmte Anzahl von Versuchen initiiert ist.
18. Verfahren nach Anspruch 10, das weiterhin die Schritte umfaßt:
Produzieren, in Abhängigkeit eines Fehlschlagens, den erzeugten Fehlerbericht zu den Komposit-Fehler-Daten in der Fehler-Analyse-Historie anzupassen, neuer Komposit-Fehler Daten, die für den erzeugten Fehlerbericht repräsentativ sind;
Anhängen der produzierten Komposit-Fehler-Daten an die Fehler-Analyse-Historie.
DE69228803T 1991-02-05 1992-02-04 Wartungs-vorrichtung und verfahren ausgelöst durch wissenbasiertemaschine Expired - Fee Related DE69228803T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US65093291A 1991-02-05 1991-02-05
PCT/US1992/000886 WO1992014206A1 (en) 1991-02-05 1992-02-04 Knowledge based machine initiated maintenance system

Publications (2)

Publication Number Publication Date
DE69228803D1 DE69228803D1 (de) 1999-05-06
DE69228803T2 true DE69228803T2 (de) 1999-08-05

Family

ID=24610899

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69228803T Expired - Fee Related DE69228803T2 (de) 1991-02-05 1992-02-04 Wartungs-vorrichtung und verfahren ausgelöst durch wissenbasiertemaschine

Country Status (7)

Country Link
US (1) US5394543A (de)
EP (1) EP0570505B1 (de)
AT (1) ATE178418T1 (de)
AU (1) AU660661B2 (de)
CA (1) CA2101927A1 (de)
DE (1) DE69228803T2 (de)
WO (1) WO1992014206A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015225144A1 (de) * 2015-12-14 2017-06-14 Siemens Aktiengesellschaft System und Verfahren zur Diagnose von zumindest einer wartungsbedürftigen Komponente eines Geräts und/oder Anlage
DE102020132263A1 (de) 2020-12-04 2022-06-09 Canon Production Printing Holding B.V. Verfahren zum automatischen Bestimmen einer Fehlerursache

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992020026A1 (en) * 1991-05-03 1992-11-12 Storage Technology Corporation Knowledge based resource management
US5652842A (en) * 1994-03-01 1997-07-29 Healthshare Technology, Inc. Analysis and reporting of performance of service providers
US6658465B1 (en) 1997-08-25 2003-12-02 Intel Corporation Method and apparatus for monitoring and controlling programs in a network
AU2237995A (en) * 1994-04-05 1995-10-23 Intel Corporation Method and appartus for monitoring and controlling programs in a network
US5544308A (en) * 1994-08-02 1996-08-06 Giordano Automation Corp. Method for automating the development and execution of diagnostic reasoning software in products and processes
US5561760A (en) * 1994-09-22 1996-10-01 International Business Machines Corporation System for localizing field replaceable unit failures employing automated isolation procedures and weighted fault probability encoding
US6006016A (en) * 1994-11-10 1999-12-21 Bay Networks, Inc. Network fault correlation
US5724254A (en) * 1996-01-18 1998-03-03 Electric Power Research Institute Apparatus and method for analyzing power plant water chemistry
EP0794495A3 (de) * 1996-03-08 1998-07-22 Hewlett-Packard Company Automatisierte Analyse eines modellbasierten Diagnosesystems
US6539267B1 (en) 1996-03-28 2003-03-25 Rosemount Inc. Device in a process system for determining statistical parameter
US7949495B2 (en) * 1996-03-28 2011-05-24 Rosemount, Inc. Process variable transmitter with diagnostics
US7630861B2 (en) * 1996-03-28 2009-12-08 Rosemount Inc. Dedicated process diagnostic device
US6017143A (en) * 1996-03-28 2000-01-25 Rosemount Inc. Device in a process system for detecting events
US7254518B2 (en) * 1996-03-28 2007-08-07 Rosemount Inc. Pressure transmitter with diagnostics
US6654697B1 (en) 1996-03-28 2003-11-25 Rosemount Inc. Flow measurement with diagnostics
US8290721B2 (en) * 1996-03-28 2012-10-16 Rosemount Inc. Flow measurement diagnostics
US6519546B1 (en) 1996-11-07 2003-02-11 Rosemount Inc. Auto correcting temperature transmitter with resistance based sensor
US6434504B1 (en) 1996-11-07 2002-08-13 Rosemount Inc. Resistance based process control device diagnostics
US5956663A (en) * 1996-11-07 1999-09-21 Rosemount, Inc. Signal processing technique which separates signal components in a sensor for sensor diagnostics
US6449574B1 (en) 1996-11-07 2002-09-10 Micro Motion, Inc. Resistance based process control device diagnostics
US6601005B1 (en) 1996-11-07 2003-07-29 Rosemount Inc. Process device diagnostics using process variable sensor signal
US6754601B1 (en) 1996-11-07 2004-06-22 Rosemount Inc. Diagnostics for resistive elements of process devices
EP0948759B1 (de) * 1996-12-31 2002-08-07 Rosemount Inc. Vorrichtung zur überprüfung eines von einer anlage kommenden steuersignals in einer prozesssteuerung
US6370448B1 (en) 1997-10-13 2002-04-09 Rosemount Inc. Communication technique for field devices in industrial processes
US6615149B1 (en) 1998-12-10 2003-09-02 Rosemount Inc. Spectral diagnostics in a magnetic flow meter
US6611775B1 (en) 1998-12-10 2003-08-26 Rosemount Inc. Electrode leakage diagnostics in a magnetic flow meter
FR2789502B1 (fr) * 1999-02-08 2001-08-10 Bull Sa Procede et outil d'analyse et de localisation de pannes materielles dans une machine informatique
US8044793B2 (en) * 2001-03-01 2011-10-25 Fisher-Rosemount Systems, Inc. Integrated device alerts in a process control system
US7206646B2 (en) * 1999-02-22 2007-04-17 Fisher-Rosemount Systems, Inc. Method and apparatus for performing a function in a plant using process performance monitoring with process equipment monitoring and control
US7562135B2 (en) * 2000-05-23 2009-07-14 Fisher-Rosemount Systems, Inc. Enhanced fieldbus device alerts in a process control system
US6633782B1 (en) 1999-02-22 2003-10-14 Fisher-Rosemount Systems, Inc. Diagnostic expert in a process control system
US6298454B1 (en) 1999-02-22 2001-10-02 Fisher-Rosemount Systems, Inc. Diagnostics in a process control system
US6356191B1 (en) 1999-06-17 2002-03-12 Rosemount Inc. Error compensation for a process fluid temperature transmitter
US7010459B2 (en) * 1999-06-25 2006-03-07 Rosemount Inc. Process device diagnostics using process variable sensor signal
US6473710B1 (en) 1999-07-01 2002-10-29 Rosemount Inc. Low power two-wire self validating temperature transmitter
US6505517B1 (en) 1999-07-23 2003-01-14 Rosemount Inc. High accuracy signal processing for magnetic flowmeter
US6701274B1 (en) 1999-08-27 2004-03-02 Rosemount Inc. Prediction of error magnitude in a pressure transmitter
US6556145B1 (en) 1999-09-24 2003-04-29 Rosemount Inc. Two-wire fluid temperature transmitter with thermocouple diagnostics
DE10046096C2 (de) * 2000-09-18 2003-03-27 Siemens Ag Vorrichtung zur Gewährleistung eines sachoptimierten Fehlerhandlings bei komplexen Systemen
US6735484B1 (en) 2000-09-20 2004-05-11 Fargo Electronics, Inc. Printer with a process diagnostics system for detecting events
EP1364262B1 (de) * 2001-03-01 2005-11-02 Fisher-Rosemount Systems, Inc. Erzeugung und anzeige von verzeichnissen in einer prozessanlage
US8073967B2 (en) 2002-04-15 2011-12-06 Fisher-Rosemount Systems, Inc. Web services-based communications for use with process control systems
EP1364263B1 (de) * 2001-03-01 2005-10-26 Fisher-Rosemount Systems, Inc. Gemeinsame benutzung von daten in einer prozessanlage
US7720727B2 (en) * 2001-03-01 2010-05-18 Fisher-Rosemount Systems, Inc. Economic calculations in process control system
GB2373607B (en) * 2001-03-23 2003-02-12 Sun Microsystems Inc A computer system
GB2373606B (en) * 2001-03-23 2003-06-04 Sun Microsystems Inc A computer system
US6629059B2 (en) 2001-05-14 2003-09-30 Fisher-Rosemount Systems, Inc. Hand held diagnostic and communication device with automatic bus detection
US20020191102A1 (en) * 2001-05-31 2002-12-19 Casio Computer Co., Ltd. Light emitting device, camera with light emitting device, and image pickup method
US7493264B1 (en) 2001-06-11 2009-02-17 Medco Health Solutions, Inc, Method of care assessment and health management
US6772036B2 (en) 2001-08-30 2004-08-03 Fisher-Rosemount Systems, Inc. Control system using process model
US7020580B2 (en) * 2002-07-12 2006-03-28 Ford Motor Company Method and system to facilitate reporting results of a defect inspection
US6990431B2 (en) * 2003-06-23 2006-01-24 Municipal And Industrial Data Labs, Inc. System and software to monitor cyclic equipment efficiency and related methods
CN1853098B (zh) * 2003-07-18 2010-12-08 罗斯蒙德公司 声学流量计和监测工业过程中固定设备的健康程度的方法
US7018800B2 (en) * 2003-08-07 2006-03-28 Rosemount Inc. Process device with quiescent current diagnostics
US7627441B2 (en) * 2003-09-30 2009-12-01 Rosemount Inc. Process device with vibration based diagnostics
US7523667B2 (en) * 2003-12-23 2009-04-28 Rosemount Inc. Diagnostics of impulse piping in an industrial process
US7100427B2 (en) * 2004-05-07 2006-09-05 Sensicore, Inc. Multi-sensor system for fluid monitoring with selective exposure of sensors
US7249000B2 (en) * 2004-05-07 2007-07-24 Sensicore, Inc. Fluid monitoring systems and methods with data communication to interested parties
US20050251366A1 (en) * 2004-05-07 2005-11-10 Sensicore, Inc. Monitoring systems and methods for fluid testing
US7104115B2 (en) * 2004-05-07 2006-09-12 Sensicore, Inc. Fluid treatment apparatus with input and output fluid sensing
WO2006020784A1 (en) * 2004-08-09 2006-02-23 Sensicore, Inc. Systems and methods for fluid quality monitoring using portable sensors in connection with supply and service entities
US8005647B2 (en) 2005-04-08 2011-08-23 Rosemount, Inc. Method and apparatus for monitoring and performing corrective measures in a process plant using monitoring data with corrective measures data
US9201420B2 (en) 2005-04-08 2015-12-01 Rosemount, Inc. Method and apparatus for performing a function in a process plant using monitoring data with criticality evaluation data
US8112565B2 (en) * 2005-06-08 2012-02-07 Fisher-Rosemount Systems, Inc. Multi-protocol field device interface with automatic bus detection
WO2006135849A2 (en) * 2005-06-10 2006-12-21 Sensicore, Inc. Systems and methods for fluid quality sensing, data sharing and data visualization
US7272531B2 (en) * 2005-09-20 2007-09-18 Fisher-Rosemount Systems, Inc. Aggregation of asset use indices within a process plant
US20070068225A1 (en) * 2005-09-29 2007-03-29 Brown Gregory C Leak detector for process valve
US7814366B2 (en) * 2005-11-15 2010-10-12 Intel Corporation On-demand CPU licensing activation
US8387138B2 (en) * 2006-03-21 2013-02-26 At&T Intellectual Property I, L.P. Security scanning system and method
US7953501B2 (en) 2006-09-25 2011-05-31 Fisher-Rosemount Systems, Inc. Industrial process control loop monitor
US8788070B2 (en) * 2006-09-26 2014-07-22 Rosemount Inc. Automatic field device service adviser
JP2010505121A (ja) 2006-09-29 2010-02-18 ローズマウント インコーポレイテッド 検証を備える磁気流量計
US8649047B2 (en) * 2007-05-08 2014-02-11 Xerox Corporation Dynamic ranking of service actions
US8898036B2 (en) * 2007-08-06 2014-11-25 Rosemount Inc. Process variable transmitter with acceleration sensor
US8301676B2 (en) * 2007-08-23 2012-10-30 Fisher-Rosemount Systems, Inc. Field device with capability of calculating digital filter coefficients
US7702401B2 (en) 2007-09-05 2010-04-20 Fisher-Rosemount Systems, Inc. System for preserving and displaying process control data associated with an abnormal situation
US7590511B2 (en) * 2007-09-25 2009-09-15 Rosemount Inc. Field device for digital process control loop diagnostics
US8055479B2 (en) 2007-10-10 2011-11-08 Fisher-Rosemount Systems, Inc. Simplified algorithm for abnormal situation prevention in load following applications including plugged line diagnostics in a dynamic process
US7921734B2 (en) * 2009-05-12 2011-04-12 Rosemount Inc. System to detect poor process ground connections
CN101833497B (zh) * 2010-03-30 2015-01-21 浪潮电子信息产业股份有限公司 一种基于专家系统方法的计算机故障管理系统
US8595553B2 (en) * 2010-06-03 2013-11-26 Siemens Aktiengesellschaft Error pattern identification in an installed base of systems
US9207670B2 (en) 2011-03-21 2015-12-08 Rosemount Inc. Degrading sensor detection implemented within a transmitter
US9927788B2 (en) 2011-05-19 2018-03-27 Fisher-Rosemount Systems, Inc. Software lockout coordination between a process control system and an asset management system
US9052240B2 (en) 2012-06-29 2015-06-09 Rosemount Inc. Industrial process temperature transmitter with sensor stress diagnostics
US9207129B2 (en) 2012-09-27 2015-12-08 Rosemount Inc. Process variable transmitter with EMF detection and correction
US9602122B2 (en) 2012-09-28 2017-03-21 Rosemount Inc. Process variable measurement noise diagnostic
US9940235B2 (en) 2016-06-29 2018-04-10 Oracle International Corporation Method and system for valid memory module configuration and verification
CN106815114A (zh) * 2017-01-12 2017-06-09 西安科技大学 一种基于软硬件协同的计算机系统故障处理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3928830A (en) * 1974-09-19 1975-12-23 Ibm Diagnostic system for field replaceable units
US4554661A (en) * 1983-10-31 1985-11-19 Burroughs Corporation Generalized fault reporting system
US5090014A (en) * 1988-03-30 1992-02-18 Digital Equipment Corporation Identifying likely failure points in a digital data processing system
JP2547069B2 (ja) * 1988-04-20 1996-10-23 富士通株式会社 故障診断方式
US5067099A (en) * 1988-11-03 1991-11-19 Allied-Signal Inc. Methods and apparatus for monitoring system performance
US4972453A (en) * 1989-02-28 1990-11-20 At&T Bell Laboratories Autonomous expert system for directly maintaining remote telephone switching systems
US5138694A (en) * 1991-06-28 1992-08-11 United Technologies Corporation Parallel processing qualitative reasoning system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015225144A1 (de) * 2015-12-14 2017-06-14 Siemens Aktiengesellschaft System und Verfahren zur Diagnose von zumindest einer wartungsbedürftigen Komponente eines Geräts und/oder Anlage
DE102020132263A1 (de) 2020-12-04 2022-06-09 Canon Production Printing Holding B.V. Verfahren zum automatischen Bestimmen einer Fehlerursache

Also Published As

Publication number Publication date
CA2101927A1 (en) 1992-08-06
EP0570505A1 (de) 1993-11-24
AU660661B2 (en) 1995-07-06
EP0570505A4 (en) 1996-06-26
AU1374292A (en) 1992-09-07
EP0570505B1 (de) 1999-03-31
DE69228803D1 (de) 1999-05-06
ATE178418T1 (de) 1999-04-15
WO1992014206A1 (en) 1992-08-20
US5394543A (en) 1995-02-28

Similar Documents

Publication Publication Date Title
DE69228803T2 (de) Wartungs-vorrichtung und verfahren ausgelöst durch wissenbasiertemaschine
DE69228986T2 (de) Durch hierarchisch verteilte wissenbasierte maschine ausgelöste wartungs-vorrichtung und -verfahren
DE68924226T2 (de) Dienstwarnsignalfunktion für Eingangs-/Ausgangsgerät.
DE68920462T2 (de) On-line-Problemverwaltung für Datenverarbeitungssysteme.
EP2359204B1 (de) Adaptives zentrales wartungssystem und verfahren zum planen von wartungsvorgängen von systemen
DE102011117803B4 (de) Verfahren für die Wartungsdiagnose- und Wartungsprozedurverbesserung
DE19742446B4 (de) Fehlerdiagnoseverfahren
DE3786381T2 (de) Prüfverfahren und -gerät für ein verteiltes Verarbeitungssystem.
WO2002013015A1 (de) System zur ermittlung von fehlerursachen
DE10307342B4 (de) Vorrichtung und Verfahren zur modellbasierten On-Board-Diagnose
DE10349784A1 (de) Verfahren und Einrichtung zur Selbstdiagnose und Selbstreparatur
DE102004015400A1 (de) Methode und Einrichtung für die Bewertung der Wartungsfähigkeit von komplexen Systemen
DE102004015504A1 (de) Verfahren und Vorrichtung zur diagnostischen Wahl eines Wartungskonzepts für ein komplexes System
DE10222399A1 (de) Steuerungsverfahren und System zur automatischen Vorbearbeitung von Gerätestörungen
DE10227595A1 (de) System und Verfahren zur automatischen Parametersammlung und Problemlösungserzeugung für Computerspeichervorrichtungen
DE19827431C2 (de) Verfahren zur Fehlererkennung in einem Prozessorsystem
DE102010052998A1 (de) Software-zentrierte Methodik für die Überprüfung und Bestätigung von Fehlermodellen
EP1855162A2 (de) Serviceplattform zur Wartung von Maschinen
DE102015225144A1 (de) System und Verfahren zur Diagnose von zumindest einer wartungsbedürftigen Komponente eines Geräts und/oder Anlage
WO2006133865A1 (de) Dynamische priorisierung von prüfschritten in der werkstattdiagnose
DE102004015503A1 (de) Verfahren und Vorrichtung zum Korrigieren diagnostischer Analysekonzepte in komplexen Systemen
DE60116187T2 (de) Wartunssmeldung auf Basis der Fahrparametern eines Aufzugs
DE60011142T2 (de) Vorrichtung und verfahren für leistungs- und fehlerdatenanalyse
DE10249644A1 (de) Softwareabsturzereignisanalyseverfahren und -system
DE69430649T2 (de) Fehlertolerante Rechnersysteme

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee