-
Die Erfindung betrifft ein Verfahren zum Trainieren eines Machine-Learning-Moduls eines computerimplementierten Vorhersagemodells zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts. Ferner betrifft die Erfindung ein Verfahren zum Vorhersagen von entsprechenden Produktqualitätsparameterwerten unter Verwendung des computerimplementierten Vorhersagemodells mit dem trainierten Machine-Learning-Modul. Schließlich betrifft die Erfindung Computersysteme zum Ausführen des Trainings- und des Vorhersageverfahrens.
-
Die Qualität von Produkten, welche in chemischen Produktionsanlagen, insbesondere großtechnischen chemischen Produktionsanlagen, hergestellt werden, wird von einer Vielzahl von Prozessparametern in einer komplexen, nichtlinearen und mithin kaum vorhersehbaren Weise beeinflusst. Insbesondere ist es äußerst schwer, exakte quantitative Aussagen über die Qualität der resultierenden Produkte zu treffen. Die tatsächliche Qualität der Produkte lässt sich im Allgemeinen erst durch retrospektive Laboranalysen ermitteln. Unter Verwendung moderner leistungsfähiger Computersysteme ermöglichen es Verfahren zum maschinellen Lernen („Machine-Learning-Verfahren“) Vorhersagemodelle für das Ergebnis komplexer, nichtlinearer Verfahrensabläufe bereitzustellen.
-
Im Zuge des maschinellen Lernens (siehe beispielsweise „Maschinelles Lernen“ in der Wikipedia; https://de.wikipedia.org/wiki/Maschinelles_Lernen) lernt ein künstliches System aus Beispielen und kann diese nach Beendigung der Lernphase verallgemeinern. Dazu bauen Algorithmen beim maschinellen Lernen ein statistisches Modell auf, das auf Trainingsdaten beruht. Das heißt, es werden nicht einfach die Beispiele auswendig gelernt, sondern Muster und Gesetzmäßigkeiten in den Lerndaten erkannt. So kann das System auch unbekannte Daten beurteilen.
-
Jedoch hängt der Lernerfolg bzw. die Qualität der Vorhersagen solcher Verfahren in erheblichem Maße von der Qualität und dem Umfang der zum Trainieren verwendeten Trainingsdaten ab. Im Falle chemischer Produktionsanlagen, insbesondere komplex aufgebauter großtechnischer chemischer Produktionsanlagen, mit möglicherweise einer Vielzahl von Teilsystemen, stehen im Allgemeinen nur in begrenztem Umfang Trainingsdaten zur Verfügung, da es aus vielfältigen Gründen nicht möglich bzw. unrealistisch ist, langwierige und umfangreiche Testläufe zum Sammeln von Daten, welche in ausreichendem Maße alle möglichen Betriebsbedingungen der Anlagen abbilden, durchzuführen. Zumal solche Testläufe bei jeder Veränderung der Anlage und selbst bei einem Austausch von Anlagenkomponenten wiederholt werden müssten.
-
Aufgrund dieser Einschränkungen sind zur Verfügung stehende Vorhersagemodelle basierend auf Verfahren zum maschinellen Lernen entweder zu unpräzise in ihren Vorhersagen oder zu spezifisch, indem sie nur für bestimmte Betriebsbedingungen präzise Vorhersagen zu treffen vermögen.
-
Der Erfindung liegt die Aufgabe zugrunde, ein verbessertes Verfahren zum Trainieren von Machine-Learning-Modulen zur Vorhersage von Produktqualitätsparameterwerten für durch chemische Produktionsanlagen hergestellte chemische Produkte zu schaffen.
-
Die der Erfindung zugrundeliegende Aufgabe wird jeweils mit den Merkmalen der unabhängigen Patentansprüche gelöst. Ausführungsformen der Erfindung sind in den abhängigen Patentansprüchen angegeben.
-
Ausführungsformen umfassen ein Verfahren zum Trainieren eines Machine-Learning-Moduls eines computerimplementierten Vorhersagemodells zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts, wobei die Produktionsanlage eine Mehrzahl von Sensoren umfasst, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Verfahren umfasst:
- • Bereitstellen von Trainingsdaten, wobei die Trainingsdaten für eine Mehrzahl von durch die Produktionsanlage hergestellten Produkteinheiten jeweils für ein oder mehrere Qualitätsparameter der jeweiligen Produkteinheit bestimmte Produktqualitätsparameterwerte als Trainingsproduktqualitätsparameterwerte umfasst, wobei den Trainingsproduktqualitätsparameterwerten jeweils eine Herstellungszeit der Produkteinheit zugeordnet ist, für welche sie bestimmt wurden,
wobei die Trainingsdaten ferner von jedem der Sensoren jeweils eine Mehrzahl von Prozessparameterwerten als Trainingsprozessparameterwerte umfassen, welche während der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktqualitätsparameterwerten bestimmt wurden, wobei den Trainingsprozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
- • Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsanlage umfassen,
- • für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trainingsprozessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, wobei das Bestimmen jeweils unter Verwendung der zeitlichen Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet werden,
- • Zuordnen der Trainingsprozessparameterwerte jeweils zu den ein oder mehreren Trainingsproduktqualitätsparameterwerten einer der Produkteinheiten, während deren Herstellungsprozess der jeweilige Trainingsprozessparameterwert erfasst wurde, unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitlichen Verschiebung des den jeweiligen Trainingsprozessparameterwert erfassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit,
- • Trainieren des Machine-Learning-Moduls unter Verwendung der einander zugeordneten Trainingsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte, wobei die jeweiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Ausgabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabedaten des Machine-Learning-Moduls für das Trainieren verwendet werden.
-
Ausführungsformen können den Vorteil haben, dass zeitliche Verschiebungen zwischen den Erfassungszeiten zu denen die individuellen Sensoren die Trainingsprozessparameterwerte erfassen und der Herstellungszeit, etwa der Zeit zu welcher die Herstellung der Produkteinheit abgeschlossen ist, d.h. dem Ende des Herstellungsprozesses, effektiv berücksichtigt werden können. Entsprechende zeitliche Verzögerungen können auf dem zeitlichen Prozessablauf, d.h. der Reihenfolge und zeitlichen Dauer einzelner Prozessschritte, beruhen, aber auch im Aufbau der Produktionsanlage begründet sein. Beispielsweise können entsprechende zeitliche Verzögerungen von Transportwegen und Transportkapazitäten innerhalb der Produktionsanlage abhängen. So können beispielsweise Verarbeitungs- und/oder Reaktionsgeschwindigkeiten, Erwärmungs- und/oder Abkühlgeschwindigkeiten, ebenso wie Rohrleitungslängen, Rohrquerschnitte und/oder Durchfluss- bzw. Durchsatzgeschwindigkeiten die zeitliche Verschiebung beeinflussen. Grundsätzlich kann ein Machine-Learning-Modul, wie etwa ein künstliches neuronales Netz, zwar auch den Einfluss solcher zeitlichen Verschiebungen erlernen, jedoch wären dazu solch umfangreiche Mengen an Trainingsdaten notwendig, welche realistischer Weise nicht zur Verfügung stehen. Ausführungsformen ermöglichen daher trotz einer beschränkten Menge an Trainingsdaten, welche beispielsweise im Zuge von Testläufen der Produktionsanlage, insbesondere einer begrenzten Anzahl an Testläufen, und anschließender Analysen der resultierenden Produkte, etwa in einem Labor, gewonnen werden, ein effektives Trainieren des Machine-Learning-Moduls, sodass das Vorhersagemodel zu präzisen Vorhersagen über die Produktqualität der von der Produktionsanlage hergestellten Produkte in die Lage versetzt wird.
-
Ausführungsformen vermögen es somit, anders als andere Algorithmen des maschinellen Lernens, eine hohe Genauigkeit und Verallgemeinerungsfähigkeiten in realen Anwendungen zu erzielen, selbst wenn nur eine begrenzte Menge und Variabilität historischer Daten zur Verfügung steht. Das so trainierte Machine-Learning-Modul ermöglicht präzise Vorhersagen über die Qualität von Zwischen- und Endprodukten, welche in Produktionsanlagen, wie etwa Polymerproduktionsanlagen, hergestellt werden, in Echtzeit aus gemessenen Prozessdaten der entsprechenden Produktionsanlagen zu erzielen. Vorhersagen in Echtzeit bedeuten, dass die entsprechenden Vorhersagen beispielsweise noch während des Produktionsablaufs gemacht werden, d.h. bevor die Produktion der entsprechenden Zwischen- und Endprodukte, deren Qualität vorhergesagt wird, abgeschlossen ist. Dies ermöglicht es, falls notwendig, beispielsweise noch während der Produktion der entsprechenden Zwischen- und Endprodukte in den Produktionsablauf einzugreifen und die Qualität der Zwischen- und Endprodukte zu beeinflussen. Auch wenn entsprechende Vorhersagen beispielsweise erst mit zum Ende der Produktion vorliegen, können diese den Vorteil haben, direkt eine Aussage über die Qualität der Zwischen- und Endprodukte bereitzustellen, ohne dass erst zeitlich aufwendige zusätzliche Laboruntersuchungen notwendig sind.
-
Die Produktqualität eines Produkts wird definiert durch eine Gruppe von Produktqualitätsparametern, welche mittels quantitativer Werte von Materialeigenschaften des entsprechenden Produkts, wie etwa Viskosität, Reinheit, Trübung, Farbskala, usw., beschrieben wird.
-
Prozessparameterwerte beschreiben Prozessparameter, d.h. Prozesszustandsparameter, welche den Zustand eines Prozesses beschreiben, sowie Prozesssteuerparameter, welche eine Steuerung von Einstellungen einer Produktionsanlage bzw. von Anlagenkomponenten der entsprechenden Produktionsanlage beschreiben. Prozessparameter werden von verschiedenen Sensoren in der Anlage während des Betriebs zur Herstellung eines Produkts gemessen und können zum Beispiel Konzentrationen und Durchflüsse von Rohstoffen und Additiven, Temperaturen, Drücke, Ventileinstellungen, Drehgeschwindigkeiten, Energien, Volumen, Gewichte usw. umfassen.
-
Bei einem Herstellungsprozess kann es sich beispielsweise um einen kontinuierlichen oder diskontinuierlichen Prozess handeln. Bei einem diskontinuierlichen Batchprozess bezeichnet eine Produkteinheit ein Batch oder eine vordefinierte Teilmenge eines Batches. Im Falle eines kontinuierlichen Prozesses handelt es sich bei einer Produkteinheit um eine vordefinierte Teilmenge, welche beispielsweise als Stichprobe dem kontinuierlich hergestellten Produkt bzw. Produktstrom entnommen wurde.
-
Das vorgeschlagene Verfahren basiert auf maschinellem Lernen, bei dem ein Vorhersagemodell mit Sätzen von Trainingsdaten trainiert wird. Die Trainingsdaten umfassen jeweils im Betrieb der Produktionsanlage, beispielsweise Testbetrieb und/oder Regelbetrieb, erfasste historische Daten. Diese historischen Daten beinhalten beispielsweise jeweils zum einen Prozessdaten, welche Prozessparameter beschreiben, und zum anderen aus diesen Prozessdaten resultierende Produktqualitätsdaten, welche Produktqualitätsparameter beschreiben. Bei diesen Produktqualitätsdaten handelt es sich beispielsweise um Daten aus Offline-Labormessungen der hergestellten Produkte.
-
Ausführungsformen können den Vorteil haben, das grundlegende Problem eines Fehlens umfangreicher Trainingsdatensätze mit unter realen Bedingungen erfassten Prozess- und Produktqualitätsdaten zu beheben. Ausführungsformen integrieren ingenieurwissenschaftliches Fachwissen über den zugrundeliegenden Prozess, beispielsweise einen physikochemischen Prozess, und das Anlagendesign gezielt als Vorwissen in Modellierungs- und Trainingsverfahren zum Bereitstellen eines trainierten, auf künstlicher Intelligenz (KI) beruhenden Vorhersagemodells. Nach erfolgreichem Training ist das resultierende Vorhersagemodell in der Lage komplexe und dynamische Zusammenhänge zwischen Anlagenbetrieb und resultierender Produktqualität präzise abzubilden.
-
Das Vorhersagemodell mit dem trainierten Machine-Learning-Modul kann beispielsweise zur effektiven und präzisen datenbasierten Online-Produktqualitätsvorhersage für industrielle chemische Produktionsanlagen genutzt werden. Hierzu wird Anlagenplanungs- und Ingenieurwissen über prozess- und anlagenspezifischen Zeitverzögerungen zwischen Betrieb und Produkt mit Techniken aus der Datenanalytik und dem maschinellen Lernen kombiniert. Zudem können weitere Informationen genutzt werden, wie beispielsweise über Steuerungsparameter, Reichweiten der Steuerungsparameter usw.
-
Industriellen Herstellungsprozesse, wie beispielsweise Polymerherstellungsprozesse, weisen eine hochkomplexe, nichtlineare Abhängigkeit zwischen den Betriebsparametern bzw. Prozesssteuerungsparametern des Prozesses und Eigenschaften des resultierenden Produkts auf. Beispielsweise wird die Qualität eines Polymer-Endprodukts durch seine Materialeigenschaften, wie etwa Viskosität, Farbe und/oder Reinheit bestimmt, welche wiederum den Gütegrad des Produkts bestimmen. Unterschiedliche Gütegrade desselben Produkts führen beispielsweise zu unterschiedlichen Verwendungsmöglichkeiten und/oder Preisen. Daher ist die Überwachung, Steuerung und Optimierung der Produktqualität entscheidend für die Gesamtleistung und Rentabilität einer Produktionsanlage, wie etwa einer Polymerproduktionsanlage.
-
Nach Ausführungsformen werden die sensorspezifischen zeitlichen Verschiebungen eines oder mehreren der Sensoren abhängig von Trainingsprozessparameterwerten, welche von einem oder mehreren im Prozessablauf nachgeordneten Sensoren erfasst wurden, und die entsprechenden Trainingsprozessparameterwerten jeweils zum Bestimmen der jeweiligen von diesen abhängigen sensorspezifischen zeitlichen Verschiebungen verwendet.
-
Ausführungsformen können den Vorteil haben, dass auch dynamische Effekte der Anlagensteuerung und Prozesseinstellung berücksichtigt werden können. Beispielsweise sind Rohrlängen und Durchmesser bekannte Fixgrößen der Produktionsanlage. Eine resultierende Transportzeit von Prozesskomponenten kann zudem aber beispielsweise von gemessenen Prozessparameterwerten, wie etwa einer Durchflussgeschwindigkeit der durch die entsprechenden Rohre transportierten Prozesskomponenten, abhängig sein.
-
Nach Ausführungsformen handelt es sich bei den Herstellungszeiten der Produkteinheiten jeweils um eine Abschlusszeit des von der Produktionsanlage zum Herstellen der entsprechenden Produkteinheit ausgeführten Prozesses.
-
Nach Ausführungsformen umfasst das Verfahren ferner ein Bereinigen der bereitgestellten Trainingsprozessparameterwerte, wobei das Bereinigen einen oder mehrere der folgenden Datenbearbeitungsschritte umfasst:
- • Entfernen von Ausreißerwerten aus den Trainingsprozessparameterwerten,
- • Entfernen unphysikalischer Werte aus den Trainingsprozessparameterwerten, und/ oder
- • Ergänzen fehlender Trainingsprozessparameterwerte, wobei zum Identifizieren fehlender Trainingsprozessparameter die Trainingsdaten auf Vollständigkeit geprüft werden unter Verwendung von a priori Vollständigkeitsinformationen, welche festlegen, von welchen Sensoren der Produktionsanlage und für welche Prozessparameter die Trainingsdaten Trainingsprozessparameterwerte umfassen sollen.
-
Ausführungsformen können den Vorteil haben, dass die Trainingsprozessparameterwerte, bei welchen es sich um im Betrieb der Produktionsanlage erfasste Sensorwerte handelt, eine höhere Qualität aufweisen und somit ein effektiveres Lernen des Machine-Learning-Moduls ermöglicht wird.
-
Unphysikalische Werte bezeichnen Trainingsprozessparameterwerte, welche den betrachteten Prozessen zugrundeliegenden physikalischen Gesetzen widersprechen. Für Trainingsprozessparameterwerte können basierend auf der Auslegung der Anlage sowie den in der Anlage ablaufenden physikalisch und chemischen Prozessen zu physikalische Wertebereiche definiert werden, d.h. Wertebereiche, welche in Einklang mit den zugrundeliegenden physikalischen Gesetzen stehen. Trainingsprozessparameterwerte, welche außerhalb dieser zu erwartenden Wertebereiche liegen, werden beispielsweise als unphysikalisch betrachtet. Bei solchen unphysikalischen Werten ist anzunehmen, dass diese beispielsweise auf Fehlern in der Erfassung der Trainingsprozessparameterwerte beruhen. Die Anlagenauslegung kann beispielsweise Wertebereiche für Parameterwerte bzw. Trainingsprozessparameterwerte festlegen, für welche die Anlage ausgelegt ist und welche in der Anlage erreicht werden können. Liegen Trainingsprozessparameterwerte außerhalb dieser zu erwartenden Wertebereiche, für die die Anlage ausgelegt ist, können die entsprechenden Trainingsprozessparameterwerte als unphysikalisch zurückgewiesen werden.
-
Beispielsweise erfolgt eine Beurteilung, ob ein Trainingsprozessparameterwert unphysikalisch ist, lokal, d.h. unter Berücksichtigung der lokalen Auslegung der Anlage sowie den in der Anlage lokal ablaufenden physikalisch und chemischen Prozessen. Beispielsweise erfolgt eine Beurteilung, ob ein von einem Sensor erfasster Trainingsprozessparameterwert unphysikalisch ist, unter Berücksichtigung von Trainingsprozessparameterwert, welche benachbarte Sensoren erfassen. So können beispielsweise sensorübergreifende Plausibilitätsprüfungen ausgeführt werden, unplausible Werte als unphysikalisch identifiziert und entfernt werden. Beispielsweise sollten sich von benachbarten Sensoren erfasste Trainingsprozessparameterwerte nicht oder nur in begrenztem Umfang voneinander unterscheiden, wenn zwischen bzw. im Bereich der entsprechenden Sensoren keine Prozessschritte, d.h. physikalischen und/oder chemischen Prozesse, auftreten, die zu einer signifikanten Änderung der entsprechenden Trainingsprozessparameterwerte führen können. Eine signifikante Änderung bedeutet in diesem Fall beispielsweise eine Änderung, welche außerhalb eines vordefinierten Schwankungsbereichs liegt, wie er beispielsweise durch Toleranzen in der Auslegung der Produktionsanlage und/oder Toleranzen in der Messgenauigkeit, der zum Messen verwendeten Sensoren, verursacht werden kann. Ferner können für die Trainingsprozessparameterwerte bestimmte Entwicklungen angenommen werden. So sollte beispielsweise eine Temperatur in Abwesenheit exothermer Reaktionen, d.h. im Falle keiner oder rein endothermer Reaktionen, ohne Energiezuführung zu dem System aufgrund der allgemein auftretenden Wärmedissipation abnehmen. Liefern aufeinanderfolgende Temperatursensoren ansteigende Trainingsprozessparameterwerte für die Temperatur, obwohl für diese Sensoren eine Temperaturabnahme zu erwarten ist, kann ein Plausibilitätstest zu einem Zurückweisen der ansteigenden Trainingsprozessparameterwerte als unphysikalische Werte führen.
-
Nach Ausführungsformen umfasst das Verfahren ferner für ein oder mehrere Sensoren jeweils ein Aggregieren der von dem jeweiligen Sensor erfassten Trainingsprozessparameterwerte, wobei die entsprechenden Trainingsprozessparameterwerte unter Verwendung der jeweils zugeordneten Erfassungszeiten einem Aggregationszeitfenster zugeordnet werden, wobei einem gemeinsamen Aggregationszeitfenster zugeordnete Prozessparameterwerte jeweils aggregiert werden.
-
Ausführungsformen können den Vorteil haben, dass die Trainingsdaten in aggregierter Form besser zu handhaben und auszuwerten sind.
-
Nach Ausführungsformen werden die sensorspezifischen zeitlichen Verschiebungen der Sensoren, deren Trainingsprozessparameterwerte aggregiert werden, jeweils für die Aggregationsfenster bestimmt und den aggregierten Trainingsprozessparameterwerten des jeweiligen Aggregationsfensters zugeordnet. Ausführungsformen können den Vorteil haben, dass Abstände zwischen den Datenerfassungen der Sensoren beispielsweise so eingestellt sind, dass während der Herstellung derselben Produkteinheit eine Mehrzahl von Trainingsprozessparameterwerten durch denselben Sensor erfasst und so effektiv verarbeitet werden.
-
Nach Ausführungsformen umfasst das Bereitstellen von Eingabedaten ferner ein Extrahieren von statistischen Merkmalswerten und/oder Frequenzmerkmalswerten aus den Trainingsprozessparameterwerten zum Trainieren des Machine-Learning-Moduls. Ausführungsformen können den Vorteil haben, dass durch eine Verwendung von statistischen Merkmalswerten wie etwa Mittelwert, Median, Minimum, Maximum, Varianz, usw. und/oder Frequenzmerkmalswerten wie etwa eine dominante Frequenz, Nieder- oder Hochfrequenzgehalt, eine spektrale Differenz, usw. die durch das Machine-Learning-Modul zu bearbeitende Datenmenge verringert und das Lernen mithin effizienter und weniger Fehleranfällig ausgeführt werden kann.
-
Nach Ausführungsformen umfasst das Bereitstellen von Eingabedaten ferner ein Skalieren der extrahierten Merkmalswerte zum Trainieren des Machine-Learning-Moduls. Ausführungsformen können den Vorteil haben, dass geeignete skalierte, etwa normierte, Daten von dem Machine-Learning-Modul effizienter verarbeitet werden können. Nach Ausführungsformen umfasst das Bereitstellen von Ausgabedaten ein Skalieren der Trainingsproduktqualitätsparameterwerte.
-
Nach Ausführungsformen umfasst das Bereitstellen von Eingabedaten ferner ein Reduzieren der Dimensionalität extrahierter Merkmalswerte unter Verwendung einer Transformation der extrahierten Merkmalswerte. Als Transformationstechnik kann beispielsweise eine Hauptkomponentenanalyse zur Anwendung kommen. Ausführungsformen können den Vorteil haben, dass die durch das Machine-Learning-Modul zu bearbeitende Datenmenge verringert und das Lernen mithin effizienter ausgeführt werden kann.
-
Nach Ausführungsformen umfasst das Verfahren ferner ein Zuordnen von Gewichtungsfaktoren des Machine-Learning-Moduls, welche für ein Gewichten von extrahierten Merkmalen verwendet werden, welche auf Trainingsprozessparameter beruhen, die für identische Prozessparameter von Sensoren erfasst wurden, welche innerhalb desselben Teilsystems der Produktionsanlage angeordnet sind, zu einer gemeinsamen Gewichtungsgruppe, wobei Gewichtungsfaktoren derselben Gewichtungsgruppe gleichgesetzt und gemeinsam trainiert werden. Ausführungsformen können den Vorteil haben, dass so weniger Gewichtungsfaktoren individuell gelernt werden müssen und das Trainieren somit effektiver ausgestaltet werden kann.
-
Nach Ausführungsformen werden ein oder mehrere anwendungsindividuellen Verlustfunktion zur Verwendung durch das Machine-Learning-Modul bereitgestellt, um selektiv spezifische Vorhersagefehler im Zuge des Trainings stärker zu gewichten als andere Vorhersagefehler. Ausführungsformen können den Vorteil haben, dass Vorhersagefehler individuell gewichtet werden können. Sollen die Vorhersagen des Vorhersagemodells zur Qualitätskontrolle der hergestellten Produkte verwendet werden, kann es wichtig sein, dass die vorhergesagte Güte für ausgewählte oder alle Produktqualitätsparameter nicht zu positiv bewertet wird. So kann sichergestellt werden, dass unter Verwendung der entsprechenden Vorhersagen Produkteinheiten mit ungenügender Qualität mit hoher Zuverlässigkeit aussortiert werden können und die Gefahr minimiert werden kann, dass ungenügende Produkteinheiten aufgrund von Toleranzen der Vorhersagen versehentlich durchgelassen werden. Beispielsweise wird ein Vorhersagefehler, welcher eine Produktreinheit zu hoch vorhersagt negativer bewertet, als ein Vorhersagefehler, welcher eine Produktreinheit zu niedrig vorhersagt.
-
Nach Ausführungsformen werden neben den Trainingsdaten Testdaten als zweite statistisch unabhängige Stichprobe bereitgestellt, welche Testprozessparameterwerte und Testproduktqualitätsparameterwerte umfassen, wobei die Testdaten zum Testen der Vorhersagepräzision des Vorhersagemodells mit dem mit den Trainingsdaten trainierten Machine-Learning-Modul verwendet werden, wobei das Testen ein Vorhersagen von Produktqualitätsparameterwerten unter Verwendung der Testprozessparameterwerte und ein Vergleichen der resultierenden vorhergesagten Produktqualitätsparameterwerte mit den erwarteten Testproduktqualitätsparameterwerten umfasst,
wobei im Falle von stark variierenden Betriebsbedingungen der Produktionsanlage unter denen die Trainingsdaten und Testdaten erstellten werden, die Trainingsdaten und Testdaten so zusammengestellt werden, dass die verschiedenen Betriebsbedingungen in den Trainingsdaten und Testdaten jeweils proportional gleich vertreten sind.
-
Ausführungsformen können den Vorteil haben, dass ein effektives und zuverlässiges Testen der Vorhersagepräzision des Vorhersagemodells ermöglicht wird.
-
Nach Ausführungsformen umfasst das Machine-Learning-Modul ein künstliches neuronales Netz, beispielsweise ein mehrlagiges Perzeptron (engl.: „Multilayer-Perzeptron“/MLP), ein Convolutional Neural Network (CNN), ein Rekurrentes neuronales Netz (RNN) oder ein Long Short-Term Memory Network (LSTM-Netz). Ausführungsformen können den Vorteil haben, dass ein effektives Vorhersagen von Produktqualitätsparameterwerten ermöglicht wird.
-
Beispielsweise handelt es sich bei der chemischen Produktionsanlage um eine großtechnische chemische Produktionsanlage. Bei einer großtechnischen chemischen Produktionsanlage kann es sich um eine Produktionsanlage handeln, welche dafür ausgelegt ist einem großtechnischen, insbesondere industriellen, Maßstab chemische Produkte zu produzieren. Eine solche Anlage, d.h. eine chemische Produktionsanlage und/oder großtechnische chemische Produktionsanlage, kann aus einer Vielzahl von Teilsystemen (z.B. 5 - 10 oder mehr) aufgebaut sein. Ein Teilsystem zeichnet sich insbesondere dadurch aus, dass es sich um eine eigenständig funktionsfähige Baugruppe handeln kann, deren Funktion vorzugsweise direkten Einfluss auf die Produktion oder den Produktionsfluss hat.
-
Nach Ausführungsformen handelt es sich bei der Produktionsanlage um eine physikochemische Produktionsanlage, beispielsweise eine Polymerproduktionsanlage zur Herstellung eines Polymerprodukts. Bei dem Polymer kann es sich beispielsweise um Polyethylenterephthalat (PET), Polyamide (PA), Polylactide (PLA), Polyethylen (PE), Polypropylen (PP), Polyvinylchlorid (PVC), Weich-Polyethylen (LDPE) oder Ethylen-Vinylacetat-Copolymere (EVA) handeln.
-
Nach Ausführungsformen handelt es sich bei der chemischen Produktanlage um eine großtechnische chemische Produktionsanlage. Nach Ausführungsformen umfasst die Produktionsanlage eine Mehrzahl von Teilsystemen, beispielsweise 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr. Nach Ausführungsformen umfasst ein Teilsystem eine eigenständig funktionsfähige Baugruppe, deren Funktion vorzugsweise direkten Einfluss auf die Produktion oder den Produktionsfluss der Produktionsanlage besitzt.
-
Beispielsweise kann es sich bei der chemischen Produktionsanlage um eine Polymerproduktionsanlage zur Herstellung eines Polymers, eine Zementproduktionsanlage zur Herstellung von Zement, oder eine Aromatenextraktionsanlage zum Herstellen bzw. Bereitstellen von Aromaten unter Verwendung eines Extraktionsverfahrens, handeln.
-
Nach Ausführungsformen handelt es sich bei den Produktqualitätsparameterwerten der Produkteinheiten um Produktqualitätsparameterwerten, welche unter Verwendung von Stichproben aus den entsprechenden Produkteinheiten, beispielsweise unter Verwendung eines in einem Labor ausgeführten Produktqualitätsanalyseverfahren, bestimmt werden.
-
Ausführungsformen umfassen ferner ein Verfahren zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts unter Verwendung eines computerimplementierten Vorhersagemodells mit einem nach einer der voranstehenden Ausführungsformen trainierten Machine-Learning-Modul, wobei die Produktionsanlage eine Mehrzahl von Sensoren umfasst, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Verfahren umfasst:
- • Bereitstellen einer Mehrzahl von den Sensoren im Betrieb der Produktionsanlage erfassten Prozessparameterwerten, wobei den Prozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
- • Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsanlage umfassen,
- • für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen den Erfassungszeiten der durch den entsprechenden Sensor erfassten Prozessparameterwerte und einer Herstellungszeit einer Produkteinheit, für welche Produktqualitätsparameterwerte vorhergesagt werden sollen und während deren Herstellung die jeweiligen Prozessparameterwerte erfasst wurden, wobei das Bestimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Prozessparameterwert zugordnet werden,
- • zueinander Zuordnen jeweils derjenigen Prozessparameterwerte, welche während der Herstellung derselben Produkteinheit erfasst wurden, wobei die zu aggregierenden Prozessparameterwerte unter Verwendung der sensorspezifischen zeitlichen Verschiebung bestimmt werden,
- • Verwenden jeweils der einander zugeordneten Prozessparameterwerte zum Bereitstellen von Eingabedaten des trainierten Machine-Learning-Moduls für ein Vorhersagen von ein oder mehreren Produktqualitätsparameterwerten,
- • Empfangen von ein oder mehreren unter Verwendung des trainierten Machine-Learning-Moduls für die Produkteinheit, während deren Herstellung die zum Bereitstellen der Eingabedaten verwendeten Produktqualitätsparameterwerte erfasst wurden, vorhergesagten Produktqualitätsparameterwerten als Ausgabe des Vorhersagemodells.
-
Ausführungsformen können den Vorteil haben, dass ein Verfahren zur datenbasierten Online-Produktqualitätsvorhersage für industrielle chemische Produktionsanlagen bereitgestellt wird. Somit muss nicht erst auf eine Analyse, etwa eine Laboranalyse, der Produktqualität gewartet werden. Vielmehr kann bereits direkt bei Fertigstellung des entsprechenden hergestellten Produkts eine präzise Angabe zu dessen Qualität gemacht werden. Dies ermöglicht eine effektive Qualitätsüberwachung, in Zuge derer beispielsweise Produkteinheiten mit ungenügender Qualität aussortiert werden können. Eine ungenügende Qualität liegt beispielsweise vor, wenn ein oder mehrere der vorhergesagten Produktqualitätsparameter außerhalb eines vordefinierten zulässigen Toleranzbereichs liegen. Insbesondere ermöglicht eine vorhersagebasierte Qualitätsüberwachung eine Qualitätsüberwachung, bei welcher die Qualität jeder einzelnen Produkteinheit berücksichtigt wird und nicht nur einzelner im Labor analysierter statistische Stichproben.
-
Ausführungsformen nutzen zur Vorhersage der Produktqualität leicht zu erfassende Prozessdaten. Ausführungsformen können dabei den Vorteil haben, ein Datenanalysetool bereitzustellen, welches eine detaillierte Analyse historischer Daten ermöglicht und entsprechend große Datenmengen effizient zu analysieren vermag, um relevante Erkenntnisse zu gewinnen. Trotz der nichtlinearen Komplexität und der multivariaten Natur entsprechender Produktionsprozesse vermögen es Ausführungsformen im Gegensatz zu konventionellen Simulationsmodellen die Produktqualität präzise vorherzusagen.
-
Ausführungsformen können den Vorteil haben, dass keine oder allenfalls noch sporadische Offline-Labormessungen zur Ermittlung von Qualitätseigenschaften der von der Anlage hergestellten Produkten, wie beispielsweise Polymerprodukten, benötigt werden. Solche Labormessungen sind zumeist arbeits- und kostenintensiv. Ergebnisse liegen dabei im Allgemeinen erst mit einer erheblichen Zeitverzögerung von beispielsweise mehreren Stunden oder bis zu einem Tag vor.
-
Ausführungsformen können den Vorteil haben, dass Eigenschaften des Endprodukts während des Betriebs der Produktionsanlage, d.h. während des Herstellungsprozesses, vollständig unter Verwendung von Prozessparametern bestimmt werden können.
-
Nach Ausführungsformen sammelt die Produktionsanlagen bei jedem Herstellungsschritt im Produktionsbetrieb, d.h. Regelbetrieb, Prozessdaten, d.h. Prozessparameterwerte, für eine Mehrzahl von Prozessparametern.
-
Ausführungsformen können den Vorteil haben, dass das sie im Gegensatz zu bekannten Simulations- und Modellierungsmethoden trotz einer nichtlinearen Komplexität und Multivarianz, wie sie beispielsweise bei Polymerherstellungsprozessen auftreten, in der Lage sind Produktqualitätseigenschaften aus Echtzeit-Prozessdaten präzise abzuleiten. Insbesondere können Ausführungsformen den Vorteil haben im Gegensatz zu bekannten Modellen zur Qualitätsvorhersage dynamische Schwankungen und externe Einflüsse, wie sie in realen industriellen Prozessen stets auftreten, vollständig berücksichtigen zu können.
-
Ausführungsformen können im Zuge des Bereitstellens der Eingabedaten auf die erfassten Prozessparameterwerte alle zuvor für das Trainieren beschriebenen Datenverarbeitungsverfahren der Trainingsprozessparameterwerte anwenden.
-
Nach Ausführungsformen umfasst das Verfahren ein zusätzliches Trainieren des trainierten Machine-Learning-Moduls, wobei das zusätzliche Trainieren umfasst:
- • Bereitstellen von Produktqualitätsparameterwerten als zusätzliche Trainingsproduktqualitätsparameterwerte, welche unter Verwendung von ein oder mehreren der von Produktionsanlage hergestellten Produkteinheiten bestimmt wurden, für welche Produktqualitätsparameterwerte vorhergesagt wurden,
- • Zuordnen der bereitgestellten Prozessparameterwerte, welche während der Herstellung der jeweiligen Produkteinheiten erfasst wurden, für welche die zusätzlichen Trainingsproduktqualitätsparameterwerte bereitgestellt werden, als zusätzliche Trainingsprozessparameterwerte zu den zusätzlichen Trainingsproduktqualitätsparameterwerten, wobei die Prozessparameterwerte, welche während der Herstellung der jeweiligen Produkteinheiten erfasst wurden, unter Verwendung der Erfassungszeit der jeweiligen Prozessparameterwerte, der sensorspezifischen zeitlichen Verschiebungen der die jeweiligen Prozessparameterwerte erfassenden Sensoren und der Herstellungszeiten der jeweiligen hergestellten Produkteinheiten bestimmt werden,
- • zusätzliches Trainieren des Machine-Learning-Moduls unter Verwendung der zusätzlichen Trainingsproduktqualitätsparameterwerte und der zugeordneten zusätzlichen Trainingsprozessparameterwerte, wobei die jeweiligen zusätzlichen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von zusätzlichen Ausgabedaten und die jeweils zugeordneten zusätzlichen Trainingsprozessparameterwerte zum Bereitstellen von zusätzlichen Eingabedaten des Machine-Learning-Moduls für das zusätzliche Trainieren verwendet werden.
-
Ausführungsformen können den Vorteil haben, dass durch ein wiederholtes Trainieren des Machine-Learning-Moduls die Vorhersagegenauigkeit und die Vorhersagebreite des Vorhersagemodells sukzessive verbessert werden kann.
-
Nach Ausführungsformen ist das Vorhersagemodell dazu konfiguriert, sich verändernde Betriebsbedingungen zu berücksichtigt. Das Vorhersagemodell erfasst Prozessdaten für ein kontinuierliches Lernen und ist so in der Lage, sich automatisch an veränderte Bedingungen anzupassen. Umfassen die erfassten Prozessdaten bisher ungesehene, veränderte Prozessdaten, welche aus den veränderten Betriebsbedingungen resultieren, werden diese im Zuge eines fortgesetzten, kontinuierlichen Trainierens des Vorhersagemodells herangezogen und als Trainingsdaten genutzt. Somit ist beispielsweise auch ein zusätzliches Trainieren, d.h. ein Retrainieren bzw. Umtrainieren, des Vorhersagemodells möglich. Die Berücksichtigung aktueller und gegebenenfalls bisher ungesehener, veränderter Prozess- und/oder Produktqualitätsdaten ermöglicht es den Verallgemeinerungsgrad der Vorhersagefähigkeit des Vorhersagemodells zu erweitern, womit dieses in die Lage versetzt wird, sich an vielfältige zukünftige Veränderungen der Produktionsbedingungen dynamisch anzupassen.
-
Nach Ausführungsformen umfasst das Verfahren ferner ein Erfassen von Anomalien der vorhergesagten Produktqualitätsparameterwerte, wobei das Erfassen der Anomalien umfasst:
- • Vergleichen der unter Verwendung der von der Produktionsanlage hergestellten Produkteinheiten bestimmten Produktqualitätsparameterwerten mit den für die jeweilige Produkteinheit vorhergesagten Produktqualitätsparameterwerten,
- • falls eine Abweichung zwischen den für dieselbe Produkteinheit bestimmten und vorhergesagten Produktqualitätsparameterwerten ein vordefiniertes Kriterium erfüllt, Identifizieren der vorhergesagten Produktqualitätsparameterwerte als Anomalien,
- • falls eine oder mehrere der vorhergesagten Produktqualitätsparameterwerte als Anomalie identifiziert werden, Ausgaben eines Anomaliehinweises.
-
Ausführungsformen können den Vorteil haben, dass Anomalien effektiv erfasst werden können. Entsprechende Anomalien können durch die Produktionsanlage oder durch das Vorhersagemodell verursacht werden. Ausführungsformen können den Vorteil haben, dass sie dazu in der Lage sind, anomale und fehlerhafte Anlagenbetriebsabläufen, wie zum Beispiel Reaktorverschmutzungen, Zersetzungsprozesse, Ausfälle bestimmter Komponenten usw., zu erkennen und wahrscheinliche Grundursachen für die erkannten Anomalien zu identifizieren. Hierzu werden beispielsweise Abweichungen zwischen Modellvorhersagen und retrospektiv gemessenen Produktqualitätsdaten ausgewertet. Überschreiten die Abweichungen, beispielsweise einzeln oder in Kombination, einen vordefinierten Schwellenwert, so weist dies auf ein Vorliegen einer Anomalie oder Fehlers im Anlagenbetrieb hin. Ebenso können so beispielsweise Unzulänglichkeiten des Vorhersagemodells identifiziert werden.
-
Nach Ausführungsformen umfasst das vordefinierte Kriterium ein Überschreiten eines vordefinierten ersten Schwellenwerts. Nach Ausführungsformen umfasst ein Erfüllen des vordefinierten Kriteriums, dass ein Vertrauensniveau der Abweichung einen vordefinierten zweiten Schwellenwert unterschreitet.
-
Nach Ausführungsformen umfasst eine Voraussetzung für ein Initiieren eines zusätzlichen Trainierens des trainierten Machine-Learning-Moduls ein Identifizieren von ein oder mehreren der vorhergesagten Produktqualitätsparameterwerte als Anomalie. Ausführungsformen können den Vorteil haben, dass das Machine-Learning-Modul verbessert werden kann, falls die Anomalie durch Unzulänglichkeiten des bisherigen Trainings des Machine-Learning-Moduls verursacht wird.
-
Nach Ausführungsformen umfasst eine Voraussetzung für ein Initiieren eines zusätzlichen Trainierens des trainierten Machine-Learning-Moduls ein Ansammeln von zusätzliche Trainingsproduktqualitätsparameterwerten und zusätzliche Trainingsprozessparameterwerten für eine vordefinierte Anzahl an hergestellten Produkteinheiten. Ausführungsformen können den Vorteil haben, dass das Machine-Learning-Modul fortwährend verbessert werden kann.
-
Nach Ausführungsformen umfasst das Verfahren ferner:
- • Auswählen, aus den Prozessparameter für welche die Sensoren der Produktionsanlage Prozessparameterwerte erfassen, eine Gruppe von steuerbaren Prozessparametern, welche durch ein zentrales Steuersystem der Produktionsanlage steuerbar sind,
- • Identifizieren einer Untergruppe der steuerbaren Prozessparametern deren Variation die unter Verwendung des trainierten Machine-Learning-Moduls vorhergesagten Produktqualitätsparameterwerten am stärksten beeinflusst, wobei das Identifizieren ein Variieren unterschiedlicher Untergruppen der steuerbaren Prozessparameter und ein Vergleichen der resultierenden vorhergesagten Produktqualitätsparameterwerte umfasst.
-
Ausführungsformen können den Vorteil haben, dass aus einer Vielzahl von Prozessparametern diejenigen Prozessparameter identifiziert werden können, welche für die Produktqualität maßgeblich sind.
-
Nach Ausführungsformen umfasst das Verfahren ferner:
- • Empfangen eines Satzes von Zielproduktqualitätsparameterwerten für ein oder mehrere Produktqualitätsparameter des von der Produktionsanlage herzustellenden Produkts,
- • Bestimmen von Prozessparameterwerten für die steuerbaren Prozessparameter der Untergruppe, für welche eine Gesamtabweichung zwischen den unter Verwendung des trainierten Machine-Learning-Moduls vorhergesagten Produktqualitätsparameterwerten und den empfangenen Zielproduktqualitätsparametern einen vordefinierten dritten Schwellenwert unterschreitet, wobei das Bestimmen ein Variieren der steuerbaren Prozessparameter der Untergruppe unter Verwendung eines nichtlinearen Minimierungsverfahrensverfahrens umfasst,
- • Ausgabe der bestimmten Prozessparameterwerte als Empfehlung für ein Einstellen der steuerbaren Prozessparameter unter Verwendung des Steuersystems zum Herstellen von Produkteinheiten des herzustellenden Produkts, welche die Zielproduktqualitätsparameterwerte aufweisen.
-
Ausführungsformen können den Vorteil haben, dass Empfehlungen zur verbesserten bzw. optimierten Steuerung der Produktionsanlage bereitgestellt werden können. Mit anderen Worten kann ein Verfahren zur interaktiven Prozessoptimierung in Produktionsanlagen, wie etwa industriellen bzw. großtechnischen chemischen Produktionsanlagen, bereitgestellt werden.
-
Ausführungsformen können ferner den Vorteil haben, dass sie anspruchsvolle datengetriebene Empfehlungen für Einstellungen von Prozessparametern zur Verbesserung, insbesondere Optimierung, des Anlagenbetriebs bereitzustellen vermögen. Eine Verbesserung, insbesondere Optimierung, des Anlagenbetriebs bedeutet beispielsweise eine Verbesserung, insbesondere Optimierung, der resultierenden Produktqualität. Eine Verbesserung, insbesondere Optimierung, kann sich beispielsweise auch auf andere Parameter, etwa Prozessparameter, auswirken, wie zum Beispiel in Form einer Erhöhung, insbesondere Maximierung, eines Durchsatzes, einer Erhöhung, insbesondere Maximierung, einer Gesamtwirtschaftlichkeit der Anlage und/oder einer Verringerung, insbesondere Minimierung, des Energieverbrauchs der gesamten Anlage oder einzelner Anlagenbereiche.
-
Nach Ausführungsformen wird dem Nutzer eine interaktive Nutzeroberfläche auf einem Display einer Nutzerschnittstelle bereitgestellt. Die interaktive Nutzeroberfläche stellt dem Nutzer eine Eingabe- und/oder Auswahlmöglichkeit zur Eingabe und/oder Auswahl gewünschter Zielwerte, beispielsweise gewünschte Produktqualitätswerte, bereit. Unter Verwendung der entsprechenden Eingabe- und/oder Auswahlwerte gibt die interaktive Nutzeroberfläche für den Nutzer Empfehlungen zur Einstellung von Prozessparametern aus, mit deren Verwendung die gewünschten Produktqualitätswerte zu erreichen sind.
-
Ausführungsformen können den Vorteil haben, dass suboptimale Betriebsbedingungen der Produktionsanlage, wie sie etwa bei Polymeranlagen bisher häufig auftreten, vermieden werden können. So ist es für Ausführungsformen beispielsweise möglich selbst angesichts einer Mehrzahl von einstellbaren Prozesssteuerungsparametern, welche jeweils eine starke Wechselwirkung untereinander sowie einen starken Einfluss auf die Produktqualitätseigenschaften aufweisen, die Einstellungen für Prozesssteuerungsparameter zu bestimmen, welche eine stabile und optimale Qualität eines bestimmten Produkts sicherstellen.
-
Ein Bestimmen der besten Einstellungen für Prozesssteuerungsparameter stellt selbst für erfahrene Anlagenbediener bei einer Mehrzahl von einstellbaren Prozesssteuerungsparametern mit starken Wechselwirkungen eine große Herausforderung dar, welche es schwierig macht, die besten Einstellungen für die Prozesssteuerungsparameter zu bestimmen. Bisher finden beispielsweise sogenannte Rezepte Verwendung, welche für eine Auswahl der wichtigsten Prozesssteuerungsparameter empfohlene Werte angeben, um eine bestimmte Qualität und/oder Gütegrad für bestimmte Produkte zu erreichen. Diese Angaben beruhen jedoch meist nur auf sehr allgemeinen und vagen Schätzungen von Werten der Prozesssteuerungsparameter, um vorgegebene Grenzwerte für Qualität und/oder Gütegrad der Produkte zu erfüllen. Ferner lassen sich entsprechende Rezepte nur eingeschränkt von einer Anlage auf eine andere übertragen.
-
Ferner treten tatsächliche Auswirkungen von Änderungen der Prozesssteuerungsparameter typischerweise erst mit einer prozessspezifischen, individuellen Zeitverzögerung auf. Diese Zeitverzögerung kann je nach Prozess und je nach geändertem Prozesssteuerungsparameter mehreren Stunden bis zu einem Tag und länger dauern. Eine Optimierung der Prozess-, Leistungs- und Qualitätsparameter kann durch diese Zeitverzögerung erheblich erschwert werden.
-
Ausführungsformen können somit neben einer Online-Überwachung verschiedener Produkteigenschaften ein Verfahren zur Kontrolle und Optimierung der Produktqualität bereitstellen.
-
Ausführungsformen umfassen ferner ein Computersystem zum Trainieren eines Machine-Learning-Moduls eines computerimplementierten Vorhersagemodells zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts, wobei die Produktionsanlage eine Mehrzahl von Sensoren umfasst, welche jeweils dazu konfiguriert sind, im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen, wobei das Computersystem einen Prozessor und einen Speicher umfasst, wobei in dem Speicher das Vorhersagemodell mit dem Machine-Learning-Modul gespeichert ist, wobei in dem Speicher ferner Programminstruktionen gespeichert sind, wobei ein Ausführen der Programminstruktionen durch den Prozessor den Prozessor dazu veranlasst, ein Verfahren auszuführen, welches umfasst:
- • Bereitstellen von Trainingsdaten, wobei die Trainingsdaten für eine Mehrzahl von durch die Produktionsanlage hergestellten Produkteinheiten jeweils für ein oder mehrere Qualitätsparameter der jeweiligen Produkteinheit bestimmte Produktqualitätsparameterwerte als Trainingsproduktqualitätsparameterwerte umfasst, wobei den Trainingsproduktqualitätsparameterwerten jeweils eine Herstellungszeit der Produkteinheit zugeordnet ist, für welche sie bestimmt wurden,
wobei die Trainingsdaten ferner von jedem der Sensoren jeweils eine Mehrzahl von Prozessparameterwerten als Trainingsprozessparameterwerte umfassen, welche während der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktqualitätsparameterwerten bestimmt wurden, wobei den Trainingsprozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
- • Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsanlage umfassen,
- • für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trainingsprozessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, wobei das Bestimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet werden,
- • Zuordnen der Trainingsprozessparameterwerte jeweils zu den ein oder mehreren Trainingsproduktqualitätsparameterwerten einer der Produkteinheiten, während deren Herstellungsprozess der jeweilige Trainingsprozessparameterwert erfasst wurde, unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitlichen Verschiebung des den jeweiligen Trainingsprozessparameterwert erfassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit,
- • Trainieren des Machine-Learning-Moduls unter Verwendung der einander zugeordneten Trainingsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte, wobei die jeweiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Ausgabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabedaten des Machine-Learning-Moduls für das Trainieren verwendet werden.
-
Nach Ausführungsformen ist das Computersystem dazu konfiguriert, jede der zuvor beschriebenen Ausführungsformen des Verfahrens zum Trainieren des Machine-Learning-Moduls auszuführen.
-
Ausführungsformen umfassen ferner Computersystem zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts unter Verwendung eines computerimplementierten Vorhersagemodells mit einem nach einer der voranstehenden Ausführungsformen trainierten Machine-Learning-Modul, wobei die Produktionsanlage eine Mehrzahl von Sensoren umfasst, welche jeweils dazu konfiguriert sind, im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen,
wobei das Computersystem einen Prozessor und einen Speicher umfasst, wobei in dem Speicher das Vorhersagemodell mit dem trainierten Machine-Learning-Modul gespeichert ist, wobei in dem Speicher ferner Programminstruktionen gespeichert sind, wobei ein Ausführen der Programminstruktionen durch den Prozessor den Prozessor dazu veranlasst ein Verfahren auszuführen, welches umfasst:
- • Bereitstellen einer Mehrzahl von den Sensoren im Betrieb der Produktionsanlage erfassten Prozessparameterwerten, wobei den Prozessparameterwerten jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet sind,
- • Bereitstellen von a priori Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Prozess, wobei die a priori Informationen zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsanlage umfassen,
- • für jeden der Sensoren jeweils Bestimmen einer sensorspezifischen zeitlichen Verschiebung zwischen den Erfassungszeiten der durch den entsprechenden Sensor erfassten Prozessparameterwerten und einer Herstellungszeit einer Produkteinheit, für welche Produktqualitätsparameterwerte vorhergesagt werden sollen und während deren Herstellung die jeweiligen Prozessparameterwert erfasst wurden, wobei das Bestimmen jeweils unter Verwendung der zeitliche Ablaufinformationen erfolgt, wobei die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren jeweils den durch den jeweiligen Sensor erfassten Prozessparameterwert zugeordnet werden,
- • zueinander Zuordnen jeweils derjenigen Prozessparameterwerte, welche während der Herstellung derselben Produkteinheit erfasst wurden, wobei die zu aggregierenden Prozessparameterwerte unter Verwendung der sensorspezifischen zeitlichen Verschiebung bestimmt werden,
- • Verwenden jeweils der einander zugeordneten Prozessparameterwerte zum Bereitstellen von Eingabedaten des trainierten Machine-Learning-Moduls für ein Vorhersagen von ein oder mehreren Produktqualitätsparameterwerten,
- • Empfangen von ein oder mehreren unter Verwendung des trainierten Machine-Learning-Moduls für die Produkteinheit, während deren Herstellung die zum Bereitstellen der Eingabedaten verwendeten Produktqualitätsparameterwerte erfasst wurden, vorhergesagten Produktqualitätsparameterwerten als Ausgabe des Vorhersagemodells.
-
Nach Ausführungsformen ist das Computersystem dazu konfiguriert jede der zuvor beschrieben Ausführungsformen des Verfahrens zum Vorhersagen von Produktparameterwerten unter Verwendung des trainierten Machine-Learning-Moduls auszuführen. Ferner kann das Computersystem dazu konfiguriert werden, jede der zuvor beschrieben Ausführungsformen des Verfahrens zum Erfassen von Anomalien und/oder zum Bereitstellen von Empfehlen für ein Einstellen von steuerbaren Prozessparameter auszuführen.
-
Im Weiteren werden Ausführungsformen der Erfindung mit Bezugnahme auf die Zeichnungen näher erläutert. Es zeigen:
- 1 ein schematisches Diagramm eines exemplarischen Vorhersagemodells,
- 2 ein schematisches Ablaufdiagramm eines exemplarischen Trainingsverfahrens zum Trainieren eines Vorhersagemodells unter Verwendung von a priori Zusatzinformationen,
- 3 ein schematisches Ablaufdiagramm eines exemplarischen Verfahrens zum Erkennen und Analysieren von Anomalien,
- 4 ein schematisches Ablaufdiagramm eines exemplarischen Verfahrens zum Re-trainieren bzw. Umtrainieren des Vorhersagemodells,
- 5 schematische Ablaufdiagramme eines exemplarischen Verbesserungsverfahrens zum Verbessern von Prozessparametereinstellungen,
- 6 exemplarische Zeitreihendaten von Prozess- und Produktqualitätsparameterwerten für eine PET-Produktionsanlage,
- 7 exemplarische Diagramme eines Vergleichs von vorhergesagten und retrospektiv gemessenen Produktqualitätsparameterwerten,
- 8 ein schematisches Diagramm einer exemplarischen Nutzeroberfläche zur Eingabe gewünschter Produktqualitätsparameterwerte und zum Bereitstellen von Empfehlungen für verbesserte Prozessparametereinstellungen zum Erreichen der gewünschter Produktqualitätsparameterwerte,
- 9 ein schematisches Diagramm eines exemplarischen Machine-Learning-Moduls in Form eines künstlichen neuronalen Netzes,
- 10 ein schematisches Diagramm einer exemplarischen Produktionsanlage,
- 11 schematisches Ablaufdiagramm eines exemplarischen Trainingsverfahrens, und
- 12 ein schematisches Diagramm einer exemplarischen Infrastruktur zum Trainieren eines Vorhersagemodells.
-
Elemente der nachfolgenden Ausführungsformen, die einander entsprechen, werden mit denselben Bezugszeichen gekennzeichnet.
-
Folgende Notation wird im Zuge der vorliegenden Beschreibung verwendet:
- C bezeichnet einen Vektor von Prozessparameterwerten, welche von einem Nutzer, d.h. dem Bediener, einer Produktionsanlage direkt beeinflusst werden können. CQ bezeichnet einen Vektor von Prozessparameterwerten, welche vom Bediener der Produktionsanlage direkt beeinflusst werden können und welche selbst die Produktqualität beeinflussen können. Dabei gilt CQ ⊆C. P bezeichnet einen Vektor von Prozessparameterwerten, welche von dem Bediener der Produktionsanlage nicht direkt beeinflusst werden können. X bezeichnet einen Vektor aller Prozessparameterwerte, d.h.,
- Q bezeichnet einen Vektor von vorhergesagten Produktqualitätsparameterwerten, welche das Vorhersagemodell vorhersagt. Q' bezeichnet einen Vektor von gemessenen Produktqualitätsparameterwerten. Bei den entsprechenden Messungen handelte es sich beispielsweise um retrospektiv vorgenommene Labormessungen an Produktproben. Q* bezeichnet einen Vektor von gewünschten Produktqualitätsparameterwerten, welche von dem Bediener der Produktionsanlage festgelegt werden. bezeichnet einen Vektor von empfohlenen Prozessparameterwerden, welche ein Prozessverbesserungsmodell empfiehlt, um die gewünschte Produktqualitätswerte Q* zu erreichen.
-
1 veranschaulicht eine Struktur eines exemplarischen Vorhersagemodells 120 und einer von dem Vorhersagemodell im Zuge seiner Verwendung vorgenommenen Datenaufbereitung.
-
In das Vorhersagemodell 120 werden Prozessdaten X 100, d.h. Prozessparameterwerte mit X = {C, P}, als Eingabe eingegeben. Diese Prozessdaten 100 können mithin Prozessparameterwerte C umfassen, welche von einem Bediener einer Produktionsanlage direkt beeinflusst bzw. eingestellt werden können und/oder Prozessparameterwerte P, welche von einem Bediener einer Produktionsanlage direkt beeinflusst bzw. eingestellt werden können.
-
Die Prozessdaten X 100 werden, beispielsweise kontinuierlich oder periodisch, während des Betriebs einer Produktionsanlage aufgezeichnet. Die Prozessdaten X 100 umfassen beispielsweise Sensorwerte, Konzentrationswerte von Grundbestandteilen und Additiven, und Durchflusswerte von Grundbestandteilen und Additiven, Temperaturen, Drücke, Ventilstellungen, aggregierte und/oder berechnete Datenwerte aus der Anlagensteuerung, usw.
-
Das Vorhersagemodell 120 verwendet die Prozessparameterwerte X 100 als Eingabewerte und prognostiziert resultierende Produktqualitätsparameterwerte Q 130, beispielsweise Materialeigenschaften wie etwa Viskosität, Reinheit, Trübung, Farbskala usw., als Ausgabewerte. Das Vorhersagemodell 120 lässt sich als eine Funktion f
M beschreiben, welche für einen Vektor oder Satz von Prozessparameterwerten X einen Vektor oder Satz von Produktqualitätsparameterwerten Q ausgibt:
-
Das Vorhersagemodell 120 ist beispielsweise strukturiert in einer Folge von Datenverarbeitungsschritten der Blöcke 121-125, welche nacheinander ausgeführt werden zur Aufbereitung der Eingabedaten, d.h. der Prozessdaten X 100, gefolgt von einem künstlichen neuronalen Netzalgorithmus in Block 126 und einer Datennachbearbeitung in Block 127 der Ausgabedaten des neuronalen Netzes 126. Ergebnis der Datennachbearbeitung 127 sind beispielsweise vorhergesagten Produktqualitätsdaten, d.h. Produktqualitätsparameterwerte Q.
-
In Block 121 wird ein Bereinigungsschritt ausgeführt, welcher beispielsweise ein Validieren von Rohprozessdaten, ein Entfernen von unphysikalischen Ausreißern und/oder ein Berechnen fehlender Prozessdaten umfasst.
-
Bei manchen Prozessen, wie beispielsweise einer Polymerisation, handelt es sich um vergleichsweise langsame Prozesse. In diesem Fall zeigt sich ein Einfluss von Änderungen der Prozessparameterwerte auf die Qualität des Endprodukts bzw. die Produktqualitätsparameterwerte erst mit einer Zeitverzögerung. Um diesem Zeitverzögerungseffekt Rechnung zu tragen, werden die bereinigten Daten aggregiert und unter Verwendung von Aggregationstechniken wie etwa Data Rolling oder Resampling (Up- oder Downsampling) auf eine geeignete Frequenz verschoben. In Block 123 werden aus den aggregierten Gruppen jeweils für die entsprechende Gruppe ein oder mehrere charakteristische Merkmalswerte wie etwa Mittelwert, Median, Minimum, Maximum, Varianz usw. extrahiert. Die extrahierten Merkmalsdaten werden in Block 124 normalisiert mit Hilfe von Transformationsverfahren, wie beispielsweise einem Verschieben gemäß dem Mittelwert (engl.: „Shifting by Means“), einem Dividieren durch die Standardabweichung (engl.: „Dividing by Standard Variation“) oder einer Transformation des MinMax-Bereichs auf das Intervall [0,1]. Optional kann in Block 125 beispielsweise eine Hauptkomponentenanalyse (engl.: „Principal Components Analysis“/PCA) durchgeführt werden, um die Dimensionalität der normierten Merkmalsdaten zu reduzieren, wobei Werte wichtiger Merkmale kombiniert und Werte unwichtiger Merkmale entfernt werden. In Block 126 wird ein Modell mit einem künstlichen neuronalen Netz bereitgestellt, welches gezielt dazu trainiert wurde, einen bestimmten komplexen nichtlinearen Produktionsprozess, wie beispielsweise einen Polymerproduktionsprozess, zu approximieren und welches aus den vorverarbeiteten Prozessdaten Rohausgabedaten, d.h. Rohproduktqualitätsparameterwerte, berechnet. In Block 127 werden die Rohausgabedaten des künstlichen neuronalen Netzes transformiert und normiert, um Vorhersagen für Produktqualitätsparameterwerte zu erhalten.
-
Die bei der vorangehend beschriebenen Datenverarbeitung, Nachbearbeitung und im künstlichen neuronalen Netz verwendeten genauen Algorithmen und Modellparameter, werden im Zuge eines Trainingsverfahrens bestimmt.
-
2 veranschaulicht ein exemplarisches Trainingsverfahren zum Trainieren eines Vorhersagemodells unter Verwendung von a priori Zusatzinformationen. Das Vorhersagemodell umfasst ein künstliches neuronales Netz. Das a priori Zusatzinformationen umfasst beispielsweise Ingenieurs- und/oder Prozesswissen.
-
Im Zuge des Trainingsverfahrens lernt das untrainierte Vorhersagemodell 210 geeignete Modellparameterwerte unter Verwendung historischer Trainingsdatensätze
245. Diese Trainingsdatensätze umfassen jeweils reale historische, d.h. zuvor gemessene, Prozessdatenwerte X
T 200 als auch reale historische Produktqualitätsdatenwerte
240, welche aus den historischen Prozessdatenwerten X
T 200 des entsprechenden Trainingsdatensatzes
245 resultieren. Die Prozessdatenwerte X
T 200 wurden beispielsweise während einer Betriebsphase eines Test- und/oder Regelbetriebs der Produktionsanlage gemessen, während die historischen Produktqualitätsdatenwerte
240 beispielsweise mittels Offline-Labormessungen der resultierenden Endprodukte bestimmt wurden. Nach Ausführungsformen können die Trainingsdaten der Trainingsdatensätze
245 beispielsweise während einer regulären Betriebsphase der Produktionsanlage oder während einer Inbetriebnahmephase der Produktionsanlage aufgezeichnet werden. Insbesondere können sie live aufgezeichnet und dem Vorhersagemodell zu Trainingszwecken direkt zur Verfügung gestellt werden.
-
Das in 2 gezeigte untrainierte Vorhersagemodell 210 umfasst eine Folge von Modulen 211-217. Bei den Modulen 211 bis 215 handelt es sich beispielsweise um Datenaufbereitungsmodule, bei Modul 216 um ein künstliches neuronales Netzmodul und bei Modul 217 um ein Datennachbearbeitungsmodul. Die Datenaufbereitungsmodule umfassen beispielsweise ein Datenbereinigungsmodul 211, ein Datenaggregationsmodul 212, ein Datentransformationsmodul 213, ein Datennormalisierungsmodul 214 und/oder ein Hauptkomponentenanalysemodul 215. Bei dem Module 216 handelt es sich beispielsweise um ein Neuronales-Netz-Modul, welches ein zu trainierendes künstliches neuronales Netzwerk bereitstellt, beispielsweise ein mehrlagiges Perzeptron (engl.: „Multilayer-Perzeptron“/MLP), ein Convolutional Neural Network (CNN), ein Rekurrentes neuronales Netz (RNN), ein Long Short-Term Memory Network (LSTM-Netz) usw. Schließlich umfasst das zu trainierende Vorhersagemodel ein Datennormalisierungsmodul 217.
-
Für das Trainingsverfahren werden beispielsweise Hyperparameter festgelegt, d.h. algorithmusspezifische Werte, die den Lernprozess des Vorhersagemodells im Zuge des Trainingsverfahrens steuern, wie zum Beispiel Lernrate, Toleranz usw. Ferner werden Modellparameterwerte aus den Trainingsdaten gelernt, d.h. Werte, welche bestimmen, wie der Algorithmus des künstlichen neuronalen Netzes eine Ausgabe berechnet. Bei den Modellparametern handelt es sich beispielsweise um Gewichte und Koeffizienten des künstlichen neuronalen Netzes.
-
In einem idealen Szenario sollten die Trainingsdatensätze so umfangreich wie möglich sein, d.h. sie sollten einen ausreichend langen Zeitraum abdecken, in welchem die Produktionsanlage unter allen möglichen Betriebsbedingungen betrieben wurde und eine breite Palette von Produktqualitäten produziert wurde. In einem solchen idealen Szenario kann ein Vorhersagemodell effektiv trainiert werden, wodurch es einen Satz von Modellparametern lernt, um die Beziehungen zwischen Input, d.h. zwischen Prozessdaten, und Output, d.h. Produktqualität, aus den Trainingsdaten optimal abzubilden. Die Leistung des Vorhersagemodells könnte dann durch Testen und Variieren der genauen Algorithmen und Hyperparameter, welche in den Modellblöcken 211-217 verwendet werden, optimiert werden.
-
In der Praxis, d.h. in realen Szenarien, ist es jedoch nicht möglich, so umfangreiche Trainingsdatensätze zu sammeln, dass ein einfacher, direkter Lernprozess allein auf Basis der umfangreiche Trainingsdatensätze möglich wäre. Infolgedessen sind bisherige, allein auf Basis von Trainingsdatensätzen trainierte Vorhersagemodelle entweder zu ungenau oder zu spezialisiert, um in realen Anwendungen tatsächlich nützlich zu sein. Darüber hinaus gibt es unzählige Optionen für die Wahl der Algorithmen und Hyperparameter in jedem der Modellblöcke 211 bis 217, wodurch das Auffinden eines optimalen Satzes von Algorithmen und Hyperparametern extrem erschwert wird.
-
Ausführungsformen stellen ein Verfahren bereit zum Integrieren von a priori Zusatzinformationen 250 über physikochemische Prozesse sowie das Anlagendesign der Produktionsanlage, welche dem Produktionsverfahren zugrunde liegen, in das Trainingsverfahren. Durch das Verwenden von a priori Zusatzinformationen kann der Werteraum für mögliche Modellalgorithmen und Hyperparameter deutlich verkleinert werden und das resultierende trainierte Vorhersagemodell vereint die Vorteile des prozessgetriebenen technischen Konstruktionsansatzes und des datengetriebenen maschinellen Lernansatzes.
-
Nach Ausführungsformen können die Zusatzinformationen beispielsweise auf technischen Dokumentationen in Form von Prozessflussdiagrammen, Rohrleitungs- und Instrumentierungsdiagrammen, Auslöse- und Alarmplänen, Gefahren- und Betriebsfähigkeitsstudien usw. sowie auf qualitatives Wissen erfahrener Ingenieure oder Anlagenbediener, beruhen. Diese Zusatzinformationen lassen sich unterschiedlichen Domänen 251 bis 257 zuordnen und werden während des Modellaufbaus und des Modelltrainings miteinbezogen, um geeignete Algorithmen und Hyperparameter in jedem der Blöcke 211 bis 217 des Trainingsverfahrens zu ermitteln.
-
Entsprechende Zusatzinformationen können a priori Wissen bzw. Hintergrundwissen bereitstellen basierend auf dem prozessgetriebenen technischen Konstruktionsansatz, welcher dem Anlagendesign der Produktionsanlage zugrunde liegt. Diese Zusatzinformationen umfassen beispielsweise Informationen über das Anlagendesign der Produktionsanlage sowie die in der Produktionsanlage ablaufenden physikochemischen Prozesse. Mit diesem a priori Wissen bzw. Hintergrundwissen kann der datengetriebenen maschinellen Lernansatz um Wissen über die prozessgetriebene technische Konstruktion der Produktionsanlage ergänzt werden. Dieses zusätzliche Wissen ermöglicht es das maschinelle Lernen effizienter und präziser auszugestalten.
-
Prozessflussdiagrammen, Rohrleitungs- und Instrumentierungsdiagrammen, Auslöse- und Alarmplänen, Gefahren- und Betriebsfähigkeitsstudien usw. können beispielsweise Informationen über den Aufbau und die Funktionsweise der Produktionsanlage sowie darüber entnommen werden, wo welche physikalisch chemischen Prozesse in welcher Form innerhalb der Anlage ablaufen. Beispielsweise lassen sich hieraus zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsanlage erstellen. Beispielsweise können den vorgenannten Unterlagen Verarbeitungs- und/oder Reaktionsgeschwindigkeiten, Erwärmungs- und/oder Abkühlgeschwindigkeiten, ebenso wie Rohrleitungslängen, Rohrquerschnitte und/oder Durchfluss- bzw. Durchsatzgeschwindigkeiten, welche die zeitlichen Abläufe innerhalb der Produktionsanlage beeinflussen, entnommen werden. Diese Informationen können ferner als a priori Wissen bzw. Hintergrundwissen beispielsweise zur Einschränkung bzw. Konkretisierung des datengetriebenen maschinellen Lernens verwendet werden. Anhand der vorgenannten Informationen können beispielsweise die zum Erfassen von Prozessparameterwerte verwendeten Sensoren bestimmten Positionen und/oder physikalisch chemischen Prozessen in der Produktionsanlage zugeordnet werden. Mithin können auch die von den entsprechenden Sensoren erfassten Prozessparameterwerten bestimmten physikalisch chemischen Prozessen bzw. Teilprozessen zugeordnet werden. Dieses a priori Wissen bzw. Hintergrundwissen zu den Prozessparameterwerte kann dazu verwendet werde die Prozessparameterwerte, welche die Grundlage des datengetriebenen maschinellen Lernansatzes darstellen, in einen prozessualen, konstruktiven Kontext einzuordnen. Dieser Kontext kann beispielsweise zur Datenbereinigung und/oder zu Definition von Abhängigkeiten und7oder zur Definition von zeitlichen Reihenfolgen der von dem Machine-Learning-Modul zum maschinellen Lernen verwendeten Daten bzw. Prozessparameterwerten verwendet werden. Ebenso kann entsprechendes qualitatives Wissen etwa erfahrener Ingenieure oder Anlagenbediener Informationen über den Aufbau und die Funktionsweise der Produktionsanlage sowie darüber liefern, wo welche physikalisch chemischen Prozesse in welcher Form innerhalb der Anlage ablaufen.
-
Für den Datenbereinigungsblock 211 wird beispielsweise a priori Zusatzinformationen 251 der Wissensdomäne zur Datenbereinigung bereitgestellt. Beispielsweise werden Sensor- und Gerätespezifikationen zur Verfügung gestellt. Diese Spezifikationen geben beispielsweise Typ, Empfindlichkeit und Einheit, usw. der entsprechenden Sensoren bzw. Geräte an.
-
Beispielsweise kann der Datenbereinigungsblock 211 Ausreißerwerte, welche nicht in Einklang mit den Spezifikationen stehen, aus den Eingabedaten, d.h. den Prozessdatenwerte X
T 200 der Trainingsdatensätze
245, unter Verwendung der Sensor- und Gerätespezifikationen entfernen. Bei den entfernten Ausreißerwerten handelt es sich beispielsweise um Prozessdatenwerte, welche außerhalb und/oder innerhalb eines Randbereichs eines vordefinierten Mess- bzw. Betriebsbereichs liegen, für welchen Sensoren bzw. Geräte ausgelegt sind.
-
Ferner können unphysikalische Werte basierend auf der Anlagenauslegung identifiziert und aus den Prozessdatenwerten XT 200 entfernt werden. Die Anlagenauslegung kann Wertebereiche für Parameterwerte festlegen, für welche die Anlage ausgelegt ist und welche in der Anlage erreicht werden können. Treten Werte außerhalb dieser Wertebereiche auf, für die die Anlage ausgelegt ist, können die entsprechenden Werte als unphysikalisch zurückgewiesen werden. Des Weiteren können sensorübergreifende Plausibilitätsprüfungen ausgeführt werden, unplausible Werte identifiziert und aus den Prozessdatenwerten XT 200 entfernt werden. Beispielsweise sollten sich Sensorwerte benachbarter Sensoren nicht oder nur in begrenztem Umfang voneinander unterscheiden, wenn zwischen bzw. im Bereich der entsprechenden Sensoren keine Prozessschritte, d.h. physikalischen und/oder chemischen Prozesse, auftreten, die zu einer signifikanten Änderung der entsprechenden Sensorwerte führen können. Eine signifikante Änderung bedeutet in diesem Fall eine Änderung, welche außerhalb eines vordefinierten Schwankungsbereichs liegt, wie er beispielsweise durch Toleranzen in der Auslegung der Produktionsanlage und/oder Toleranzen in der Messgenauigkeit, der zum Messen verwendeten Sensoren, verursacht werden kann. Ferner können für die gemessenen Sensorwerte bestimmte Entwicklungen angenommen werden. So sollte eine Temperatur in Abwesenheit exothermer Reaktionen, d.h. im Falle keiner oder rein endothermer Reaktionen, beispielsweise ohne Energiezuführung zu dem System aufgrund der allgemein auftretenden Wärmedissipation abnehmen. Messen aufeinanderfolgende Temperatursensoren einen Temperaturanstieg, obwohl für diese Sensoren eine Temperaturabnahme zu erwarten ist, kann ein Plausibilitätstest zu einem Zurückweisen eines Sensorwerts führen, welcher wider Erwarten eine Temperaturzunahme anzeigt.
-
Nach Ausführungsformen definieren die a priori Zusatzinformationen 251 einen Satz von Prozessparametern, welche die Produktqualitätsparameterwerte des resultierenden Endprodukts beeinflussen. Beispielsweise werden für ein oder mehrere Prozessschritte jeweils Prozessparameter definiert, von welchen die finalen Produktqualitätsparameterwerte abhängen. Für den von den a priori Zusatzinformationen 251 definierten Prozessparametersatz wird eine Vollständigkeitsprüfung ausgeführt. Fehlen in einem der Trainingsdatensätze
245 Prozessdatenwerte X
T zu einem der definierten Prozessparameter, werden Prozessdatenwerte zu diesem Prozessparameter in den Eingabedaten ergänzt. Die ergänzten Prozessparameter werden beispielsweise aus vorliegenden Prozessdatenwerten abgeleitet, etwa mittels Interpolation und/oder Extrapolation. Beispielsweise können zum Ableiten fehlender Prozessdatenwerte auch Prozessdatenwerte aus anderen Trainingsdatensätzen
245 herangezogen werden. Beispielsweise können Durchschnittswerte aus anderen Trainingsdatensätzen
245 verwendet werden und/oder Extrapolationen von den anderen Trainingsdatensätzen
245 auf die Bedingung des aktuellen Trainingsdatensatzes. Als weiteren Trainingsdatensätze zum Schätzen und/oder Extrapolieren fehlender Prozessdatenwerte können beispielsweise auch gemessene Werte aus anderen Produktionsanlagen herangezogen werden, gemessene Werte aus Versuchsanlagen und/oder Versuchsaufbauten, Werte aus numerischen Computersimulationen oder Werte aus analytischen Näherungsformeln zur Beschreibung des relevanten Prozessschritts.
-
Fehlende oder aufgrund einer Identifizierung als fehlerhaft entfernte Datenwerte können beispielsweise durch Entwurfsvorgaben oder durch geeignete statistische Verfahren ergänzt werden. Geeignete statistische Verfahren können beispielsweise umfassen: Ein Verwenden eines letzten oder nächstgültigen Werts des entsprechenden Sensors, einen Mittelwert über ein zurückliegendes Zeitfenster, wie etwa die letzte Stunde und/ oder Stunden, oder eine Interpolation und/oder Extrapolation aus Datenwerten benachbarter Sensoren.
-
Für den Datenaggregationsblock 212 werden beispielsweise a priori Zusatzinformationen 252 der Wissensdomäne Datenaggregation bereitgestellt.
-
Nach Ausführungsformen werden Definitionen relevanter Zeitskalen des Prozesses bereitgestellt und als Grundlage für eine Aggregation der Prozessdatenwerte verwendet. Die relevanten Zeitskalen definieren Zeitfenster, innerhalb derer gemessene Daten aggregiert werden. Die entsprechenden Zeitfenster definieren eine Frequenz für das Aggregieren der Daten.
-
Nach Ausführungsformen werden Prozessdatenwerte zeitverzögerter Prozesse, welche zu unterschiedlichen Zeiten gemessen wurden, demselben Prozessdurchlauf zugeordnet und zusammen gruppiert. Zeitverzögerungen in einem zeitverzögerten Prozess basierend beispielsweise auf einer Abfolge zeitlich aufeinanderfolgender Prozessschritte, einer Prozessbetriebsart, wie etwa einem Batchbetrieb oder einem Dauerbetrieb, einem dynamischen Verhalten des Prozesses oder einer Reaktionskinetik des Prozesses. Zur Definition von Zeitverzögerungen des Prozesses werden beispielsweise Prozessflussdiagramme bereitgestellt, aus welchen sich Beziehungen zwischen unterschiedlichen Anlagenabschnitten ergeben, welche zeitversetzt zu ein und demselben Prozessdurchlauf beitragen.
-
Für den Merkmalsextraktionsblock 213 werden beispielsweise a priori Zusatzinformationen 253 der Wissensdomäne zur Merkmalsextraktion bereitgestellt. Im Zuge der Merkmalsextraktion werden für aggregierte numerische Daten beispielsweise Merkmalswerte berechnet. Aggregierte kategorische Daten werden beispielsweise im Zuge der Merkmalsextraktion kodiert. Berechnete Merkmalswerte können Merkmale des Zeitbereichs sein, etwa statistische Werte wie Mittelwert, Median, Minimum, Maximum, Varianz, usw., oder Merkmale des Frequenzbereichs, wie etwa eine dominante Frequenz, Nieder- oder Hochfrequenzgehalt, eine spektrale Differenz, usw. Diese Merkmalswerte werden aus den aggregierten Werten ein oder mehrerer Prozessparameter berechnet. Beispielsweise wird vorhandenes Wissen über das Prozessverhalten in numerische Merkmale kodiert. Zusätzliche Merkmale werden beispielsweise aus bestehenden parametrischen Modellen, Prozesssimulationen oder prozessspezifischen Formeln extrahiert.
-
Für den Datennormalisierungsblock 214 werden beispielsweise a priori Zusatzinformationen 254 der Wissensdomäne zur Datennormalisierung bereitgestellt. Die Merkmalwerte, welche die vorangehende Merkmalsextraktion bereitstellt, werden zur Verbesserung des Trainings des nachfolgenden neuronalen Netzes skaliert. So werden die Merkmalswerte für das neuronale Netz beispielsweise effizienter handhabbar. Nach Ausführungsformen werden für die Merkmalsparameter beispielsweise jeweils ein individuelles Skalierungsverfahren gewählt basierend auf dem Sensortyp, dem zugrundeliegenden physikalischen Prozess und/oder Wissen über die Verteilung der Prozessparameterwerte.
-
Für den Datentransformationsblock 215 werden beispielsweise a priori Zusatzinformationen 255 der Wissensdomäne zur Datentransformation zwecks Dimensionalitätsreduktion bereitgestellt. Die Transformation in Block 215 dient einer Reduzierung der Dimensionalität der Merkmalwerte zur Vereinfachung der Lernaufgabe für das neuronale Netz. Zur Reduzierung der Dimensionalität der Eingabedaten des neuronalen Netzes werden beispielsweise Transformationstechniken der Hauptkomponentenanalyse (engl.: „Principal Component Analysis“/PCA), wie etwa lineare PCA, Kernel-PCA, usw. oder Diskriminanzanalyse (engl.: „Linear discriminant analysis“/LDA), genutzt.
-
Mittels der Transformation können Merkmale, die nur geringe prädiktive Informationen enthalten, identifiziert und die zugehörigen Merkmalswerte kombiniert oder eliminiert werden. Ebenso können Merkmale, die viele prädiktive Informationen enthalten, etwa Grundlage der Prozessspezifikation, hervorgehoben werden.
-
Für das künstliche neuronale Netz 216 werden beispielsweise a priori Zusatzinformationen 256 der Wissensdomäne zu neuronalen Netzen bereitgestellt. Nach Ausführungsformen wird ein geeigneter neuronaler Netztyp, wie beispielsweise MLP, CNN, RNN oder LSTM-Netz, ausgewählt. Ausgewählt wird beispielsweise ferner die Architektur des künstlichen neuronalen Netzes, d.h. die verwendete Anordnung und Anzahl von Schichten und Knoten, Aktivierungsfunktionen, eine Verlustfunktion und/oder Hyperparameter bzw. ein Unterraum von Hyperparametern. Die Auswahl erfolgt beispielsweise unter Verwendung von Kenntnissen über den zugrundeliegenden Produktionsprozess, über die Eingabedaten und/oder über die Ausgabedaten. Beispielsweise werden unterschiedliche Typen von künstlichen neuronalen Netzen und/oder Netzen mit unterschiedlichen Konfigurationen durchgetestet.
-
Beispielsweise wird das Training des neuronalen Netzes unterstützt durch Bereitstellen von Definitionen, bezüglich welcher Prozessparameter das neuronale Netz invariant sein soll. Diese Definitionen können dazu genutzt werden, dass neuronale Netz mit zusätzlichen simulierten Daten zu trainieren, welche mit diesen zielerhaltenden Transformationen stochastisch gestört werden.
-
Beispielsweise werden gemeinsam genutzte Gewichte verwendet, um bestimmte Gewichte im Netzwerk gemeinsam zu trainieren, basierend auf dem Wissen über den Ort, an welchem ein bestimmter Prozessschritt abläuft. So werden beispielsweise Merkmale von bestimmten Sensortypen in derselben Prozesseinheit das gleiche Gewicht zugeordnet. Durch das gemeinsame Trainieren von Gewichten, kann die Effizienz des Trainingsverfahrens erhöht werden.
-
Beispielsweise wird eine Gewichtungsreduktion zur Normalisierung von Gewichten durch Einbeziehung von Prozesswissen zur Glättung der Datenzuordnung (Data Mapping) verwendet. Gilt beispielsweise X1 ≈ X2 für alle, außer ggf. einzelne Prozessparametern, dann sollte auch fM (X1) ≈ fM (X2) gelten.
-
Beispielsweise wird eine anwendungsindividuelle Verlustfunktion konstruiert, anstelle einer indifferenten Verwendung der typischen mittleren quadratischen Abweichungsfunktion (engl.: „mean squared error function“/MSE), um bestimmte fehlerhafte, etwa widersprüchliche oder unphysikalische, Vorhersagen spezifisch zu bestrafen. Beispielsweise werden im Hinblick auf Verunreinigungskonzentrationen mittlere quadratische oder absolute logarithmische Abweichungen verwendet, um große oder große negative Abweichungen stärker zu bestrafen.
-
Beispielsweise werden Warmstartverfahren verwendet, um initiale Modellgewichte basierend auf vortrainierten Modellen auszuwählen. So werden zur Initialisierung von Gewichten beispielsweise Gewichte eines neuronalen Netzes verwendet, welches mit vereinfachten Trainingsdatensätzen derselben Produktionsanlage oder einer ähnlichen Produktionsanlage trainiert wurde. Auch können Gewichte eines neuronalen Netzes verwendet werden, welches mit Trainingsdatensätzen derselben Produktionsanlage vor einem Umbau trainiert wurde.
-
Für den Datennormalisierungsblock 217 wird beispielsweise a priori Zusatzinformationen 257 der Wissensdomäne zur Ausgabedatennormalisierung bereitgestellt. Produktqualitätsparameter werden so skaliert, dass sie mit der Skalierung der Ausgabedaten des neuronalen Netzes übereinstimmen. Die Wahl der Skalierungsmethode basiert beispielsweise für jeden der Produktqualitätsparameter jeweils auf einer erwarteten Verteilung der entsprechenden Produktqualitätsparameterwerte.
-
Unter Einbeziehung von ein oder mehreren der Blöcke 251 bis 257 wird das Trainingsverfahren zum Training des Vorhersagemodells unter Verwendung der Trainingsdatensätze
245 beispielsweise mittels Cross-Validierung durchgeführt. Die Trainingsdatensätze werden gemischt und in Untergruppen für das Training, für ein Validieren und ein Testen aufgeteilt. Diese Untergruppen werden zum Trainieren und Benchmarking der Leistung des Modells verwendet.
-
Sind die gegebenen Trainingsdatensätze hinsichtlich der Betriebsbedingungen für welche sie gemessen wurden stark unausgewogen, wird das Aufteilen in die Untergruppen unter Verwendung einer dem Betriebszustand bzw. den Betriebsbedingungen entsprechende Variable gesteuert. Eine Unausgewogenheit der Betriebsbedingungen kann beispielsweise darauf beruhen, dass die Produktionsanlage in welcher die entsprechenden Trainingsdatenwerte gemessen werden nur unter wenigen Bedingungen und kaum unter anderen betrieben wird. Bei der entsprechenden Variablen kann es sich beispielsweise um einen direkt gemessenen Prozessparameter, einen aus Berechnungen abgeleiteten Parameter oder ein Ergebnis eines zusätzlichen Schritts einer Clusteranalyse der Betriebsbedingungen handeln. Dabei kann eine prozentuale Zusammensetzung der Untergruppen hinsichtlich Trainingsdatensätzen der unterschiedlichen Betriebsbedingungen sichergestellt werden. Gleichfalls erfolgt das Aufteilen in die Untergruppen bei einer starken Unausgewogenheit der Trainingsdatensätze hinsichtlich der Zielvariablen beispielsweise unter Verwendung einer der Zielvariablen oder einer zusätzlichen Metrik einer Clusteranalyse der Produktqualitätsparameter. Eine Unausgewogenheit der Betriebsbedingungen kann beispielsweise darauf beruhen, dass die Produktionsanlage hauptsächlich Endprodukte mit sehr ähnlicher Produktqualität herstellt.
-
Die Validierungsdatensätze werden zur weiteren Abstimmung des neuronalen Netzes verwendet. Hyperparameter-Optimierungsansätze, wie etwa eine Grid-Suche oder Zufallssuche, nehmen einen Teilbereich von Hyperparameterbereichen und geben ein Tupel von Hyperparametern zurück, welche die Eingabedaten optimal auf die Ausgabedaten abbilden, d.h. die Prozessparameterwerte auf die Produktqualitätsparameterwerte.
-
Das Ergebnis des Trainingsverfahrens ist ein trainiertes Vorhersagemodell fM 120, d.h. ein Vorhersagemodell mit präzisen Algorithmen und Modellparametern für jeden der Blöcke 121-127 des entsprechenden Vorhersagemodells, so dass für jeden neuen Datensatz von Prozessparameterwerten X als Eingabedaten ein Datensatz von Produktqualitätsparameterwerten Q als Ausgabedaten berechnet werden kann. Dieses trainierte Vorhersagemodell fM 120 kann beispielsweise während eines Betriebs der Produktionsanlage dazu verwendet werden, kontinuierlich in Echtzeit zu erwartende Qualitätseigenschaften vorherzusagen und diese zu überwachen, ohne auf Labormessungen warten zu müssen.
-
3 veranschaulicht ein exemplarisches Verfahren zum Erkennen von Anomalien unter Verwendung des Vorhersagemodells.
-
Nach erfolgreichem Training kann das trainierte Vorhersagemodell fM 120 den Produktionsprozess, beispielsweise einen Polymerproduktionsprozess, präzise abbilden und ausgehend von Prozessparameterwerten X 100 der Produktionsanlage resultierende Produktqualitätsparameterwerte Q 130 beispielsweise während des Betriebs unmittelbar vorhersagen.
-
Aus retrospektiven Labormessungen resultierende Produktqualitätsparameterwerte Q' 340 können genutzt werden, um weitere Einblicke in den Betrieb der Produktionsanlage zu erhalten. Insbesondere unter Verwendung solcher gemessener Produktqualitätsparameterwerte Q' 340 kann ein Anomalieerkennungsverfahren implementiert werden, welches zur Erkennung eines anomalen und fehlerhaften Betriebs der Produktionsanlage dient. Eine solche Anomalie kann beispielsweise Reaktorverschmutzungen, auftretende Zersetzungsprozesse innerhalb der Produktionsanlage, Ausfälle von Komponenten der Produktionsanlage, usw. umfassen. Selbst im Falle einer Verwendung eines solchen Vorhersagemodells fM 120, welches präzise Vorhersagen für die Produktqualität zu liefern vermag, kann es nach wie vor notwendig sein, entsprechende retrospektive Labormessungen der Produktqualität, etwa für Zertifizierung der Produktqualität, auszuführen. Auch wenn solche Labormessungen, wenn ein präzises Vorhersagemodell fM 120 zur Verfügung steht, wesentlich seltener durchzuführen sind als dies etwa aktuell in Produktionsanlagen üblich ist.
-
Zu einem gegebenen Zeitpunkt t werden gemessene Produktqualitätsparameter Q'(t) 340 mit den für diesen Zeitpunkt t vorhergesagten Produktqualitätsparameter Q(t) 330 unter Verwendung einer Klassifizierungsfunktion fA(Q',Q) 360 verglichen. Abhängig von dem Maß einer Abweichung zwischen Q'(t) und Q(t) klassifiziert fA jeden Zeitpunkt t entweder als normal, fall die Vorhersage Q(t) ausreichend gut mit der Messung Q'(t) übereinstimmt, oder als Anomalieereignis 362, falls eine Abweichung zu zwischen Q'(t) und Q(t) groß ist.
-
Die Klassifizierung und Interpretation einer Übereinstimmung als „ausreichend gut“ und einer Abweichung als „zu groß“ kann mit verschiedenen Ansätzen realisiert werden:
-
Ein Ansatz für eine Entscheidungsregel, ob eine Übereinstimmung zwischen Q'(t) und Q(t) ausreichend ist oder ob es sich um eine Anomalie handelt, ist eine Verwendung eines vordefinierten Schwellenwert. Gemessene Produktqualitätsparameter Q'(t) werden als ein Anomalieereignis klassifiziert, falls eine Abweichung zwischen Q'(t) und Q(t) den vordefinierten Schwellenwert überschreitet. Die Abweichung kann beispielsweise unter Verwendung der L1- oder L2-Verlustfunktion quantifiziert werden, d.h. der kleinsten absoluten Abweichung (engl.: „Least Absolute Deviation“/LAD)
oder der kleinsten Quadratabweichungen (engl.: „Least Square Errors“)
-
Ein weiterer Ansatz für die Klassifizierung basiert beispielsweise auf einer Bewertung des Vertrauens, d.h. der statistischen Sicherheit des Vorhersagemodells. Gemessene Produktqualitätsparameter Q'(t) werden als ein Anomalieereignis klassifiziert, falls eine Abweichung zwischen Q'(t) und Q(t), beispielsweise quantifiziert durch die L1- oder L2-Verlustfunktion, außerhalb eines statistischen Sicherheitsbereichs bzw. Konfidenzintervall des entsprechenden Vorhersagemodells liegt. Eine Möglichkeit, die statistische Sicherheit des Vorhersagemodells zu quantifizieren, besteht beispielsweise darin, ein zweites neuronales Netz zu verwenden, das trainiert wurde, um die Genauigkeit des ersten Vorhersagemodells vorherzusagen.
-
Wird ein Ereignis zum Zeitpunkt t als ein Anomalieereignis 362 klassifiziert, kann beispielsweise eine Ursachenanalyse durchgeführt werden, welche eine wahrscheinlichste Ursache der Anomalie identifiziert, z.B. eine Einheit der Produktionsanlage oder einen Sensor.
-
4 veranschaulicht ein exemplarisches Trainingsverfahren zum Retrainieren bzw. Umtrainieren des Vorhersagemodells unter Verwendung aktueller Prozess- und Produktqualitätsdaten als Trainingsdaten.
-
Mittels Retrainieren kann ein kontinuierliches Lernen für ein bereits trainiertes Vorhersagemodell fM 120 implementiert werden. Selbst bei einem Vorhersagemodell fM 120, welches wie zuvor beschrieben mit a priori Zusatzinformationen trainiert wurde, ist die Leistung des Vorhersagemodells bei Anwendung auf neuartige reale Prozessparameterwerte abhängig von den zum Trainieren verwendeten Trainingsdatensätzen und den Prozessbedingungen, unter denen diese Trainingsdatensätze erhalten wurden. Während die Vorhersagegenauigkeit für Betriebsbedingungen, die den Trainingsbedingungen ähneln, in der Regel sehr gut ist, wird die Vorhersagegenauigkeit des Vorhersagemodells deutlich abnehmen, falls sich die Betriebsbedingungen, unter denen die neuartigen realen Prozessparameterwerte erfasst wurden, deutlich von den Betriebsbedingungen unterscheiden, unter denen die Prozessparameterwerte der Trainingsdatensätze erfasst wurden.
-
Nach Ausführungsformen kann eine solche Beschränkung reduziert werden mittels eines Verfahrens zum kontinuierlichen Retrainieren des Vorhersagemodells mit neu gewonnenen Daten als Trainingsdaten, falls sich die Betriebsbedingungen der Produktionsanlage zeitlich ändern.
-
Die Prozessparameterwerte X 100 der Produktionsanlage werden kontinuierlich als Eingabedaten für das bereits trainierte Vorhersagemodell fM 120 verwendet, welches vorhergesagte Produktqualitätsparameterwerte Q 130 in Echtzeit als Ausgabedaten zurückgibt. Darüber hinaus stellen gelegentlich vorgenommene retrospektive Labormessungen gemessene Produktqualitätsparameterwerte Q' 340 zur Verfügung.
-
Zu jedem Zeitpunkt t bestimmt eine Klassifizierungsfunktion fU(X, Q', Q)) 460, wie die neue Beobachtung zum Retraining des Vorhersagemodells fM 120 verwendet werden soll. Mögliche Formen des Retrainings sind beispielsweise ein Online- oder ein Mini-Batch-Trainingsverfahren.
-
Beispielsweise nutzt das Online-Trainingsverfahren jede neue Beobachtung, um das bestehende Vorhersagemodell sequentiell mittels einer Backpropagation zu trainieren. Das auf diese Weise neu trainierte Modell wird dynamisch angepasst, wobei es dazu neigt, aktuelle Beobachtungen stärker hervorzuheben als ältere Daten. Ein solches Online-Trainingsverfahren kann beispielsweise in ein oder mehreren der folgenden Fälle eingesetzt werden:
-
Beispielsweise unterscheiden sich entweder die gemessenen Prozessparameterwerte X(t) oder die gemessenen Produktqualitätsparameterwerte Q'(t) erheblich von denen vorhandener Trainingsdaten X
T und
Das Maß für den „Unterschied“ kann beispielsweise ein Wahrscheinlichkeitswert eines Clustering-Modells oder ein Indexwert eines lokalen Ausreißermodells (engl.: „Local Outlier Factor Model“/LOF-Modell) sein. In diesem Fall wurden beispielsweise das Clustering-Modell Clustering bzw. das LOF-Modell zuvor unter Verwendung der entsprechenden vorhandenen Trainingsdaten X
T und
trainiert.
-
Beispielsweise weist das bestehende Vorhersagemodell fM 120 für die neue Beobachtung ein geringes Vertrauen, d.h. eine geringe statistische Sicherheit, auf. Eine Möglichkeit, die statistische Sicherheit des Vorhersagemodells fM 120 zu quantifizieren, besteht beispielsweise darin, ein zweites neuronales Netz zu verwenden, das trainiert wurde, um die Genauigkeit des ersten Vorhersagemodells fM 120 vorherzusagen.
-
Beispielsweise weist das bestehende Vorhersagemodell fM 120 eine hohe statistische Sicherheit auf, aber eine Vorhersagegenauigkeit des Vorhersagemodells fM 120 ist gering für die neue Beobachtung, d.h. es gibt eine große Abweichung zwischen gemessenen Produktqualitätsparameterwerten Q'(t) und von dem Vorhersagemodell fM 120 vorhergesagten Produktqualitätsparameterwerten Q(t), welche einen vordefinierten Schwellwert überschreitet.
-
Im Gegensatz zum Online-Trainingsverfahren verwendet das Mini-Batch-Trainingsverfahren nicht jede neue Beobachtung direkt zum Training des Vorhersagemodells fM 120, sondern sammelt zunächst eine vordefinierte Mindestanzahl von n neuen Beobachtungen und trainiert das bestehende Modell erst, wenn diese vordefinierte Mindestanzahl, d.h. die Batch-Größe, erreicht ist. Ein auf diese Weise neu trainiertes Modell kann den Vorteil haben, dass es die gesamten Trainingsdaten global besser zu approximieren vermag. Ein Mini-Batch-Trainingsverfahren kann beispielsweise in ein oder mehreren der folgenden Fälle eingesetzt werden:
- Beispielsweise sind die gemessenen Prozessparameterwerte X(t) der Produktionsanlage und die gemessenen Produktqualitätsparameterwerte Q'(t) vergleichbar mit bereits vorhandenen und zuvor zum Training verwendeten Trainingsdaten XT und
- Beispielsweise weist das bestehende Vorhersagemodell fM 120 für die neuen Beobachtungen eine hohe statistische Sicherheit und eine hohe Vorhersagegenauigkeit auf.
-
Die neuen Daten
oder im Falle von Mini-Batch-Trainingsverfahrens die Sammlung bzw. der Stapel neuer Daten werden als Eingabedaten 462 und Ausgabedaten 464 zum Training des bestehenden Modells f
M 120 verwendet. Das Ergebnis des Retrainings ist ein aktualisiertes Vorhersagemodell f
M 420, d.h. ein Vorhersagemodell mit präzisen Algorithmen und Modellparametern in jedem der Blöcke 421-426. Auf diese Weise kann ein Vorhersagemodell kontinuierlich aus neuen Beobachtungen lernen und kann sich so automatisch an zukünftige Betriebsbedingungen der Produktionsanlage anpassen.
-
5 veranschaulicht ein exemplarisches Verbesserungsverfahren zum Verbessern von Prozessparametereinstellungen zum Erzielen gewünschter Produktqualitätswerte.
-
Nach Ausführungsmodellen wird zum Zwecke einer Prozessoptimierung basierend auf dem Qualitätsvorhersagemodell fM 120 ein Verfahren zum Bereitstellen von Empfehlungen erstellt für das Einstellen von Prozessparametern zum Verbessern des Betriebs der Produktionsanlage. Dieses Verfahren stellt dem Bediener der Produktionsanlage beispielsweise Vorschläge für verbesserte Sollwerte für die Prozessparameter bereit, so dass Zielvorgaben wie Produktqualität, Produktausbeute, Energieeffizienz usw. verbessert, insbesondere maximiert, werden können.
-
Das Verbesserungsverfahren umfasst beispielsweise ein Bereitstellen einer Definition, welche Prozessparameterwerte vom Bediener der Produktionsanlage zu ändern und zu verbessern sind. Im Allgemeinen kann der gesamte Satz an zur Verfügung stehenden Prozessparametern X 500 in die Prozessparameter C 502 unterteilt werden, die direkt von dem Bediener gesteuert werden können, und Prozessparameter P, welche von dem Bediener nicht direkt gesteuert werden können. Der Satz der steuerbaren Prozessparameter C 502 kann in zwei Gruppen unterteilt werden: die Steuerungsparameter CQ 504, die einen direkten Einfluss auf die Produktqualität haben und die übrigen Steuerungsparameter C \ CQ, die entweder die Produktqualität nicht oder nur über ihre Korrelation mit bereits in CQ definierten Parametern beeinflussen.
-
Durch eine Kombination aus Wissen über die Produktionsanlage einerseits und maschinellem Lernen andererseits kann bestimmt werden, welche Prozessparameter aus X 500 zu den Teilmengen 502 und 504 gehören. Die Teilmenge C 502 aller steuerbaren Prozessparameter kann aus X 500 unter Verwendung eines regelbasierten Auswahlalgorithmus 501 unter Einbeziehung von Informationen 551 über die Produktionsanlage in Form von technischen Dokumentationen der Produktionsanlage, wie etwa Prozessflussdiagramme, Rohrleitungs- und Instrumentierungsdiagramme, Auslöse- und Alarmpläne, Gefahren- und Betriebsfähigkeitsstudien usw. zusammengestellt werden. Beispielsweise kann zudem Know-how von Technikern und Anlagenbedienern mit einfließen.
-
Die Teilmenge CQ 504 aller für die Produktqualitätsvorhersage relevanten steuerbaren Prozessparameter wird beispielsweise mittels eines Suchverfahrens unter Verwendung eines rekursiven Merkmalseliminierungsalgorithmus 503 identifiziert. Der Suchprozess verwendet das trainierte Vorhersagemodell fM 120 und vergleicht verschiedene Kombinationen von Teilmengen von C 502 und bewertet jeweils deren Relevanz für die Modellgenauigkeit, d.h. die Genauigkeit der Vorhersage des Vorhersagemodells 120. Ausführungsformen können den Vorteil haben, dass in CQ 504 nur die steuerbaren Prozessparameter berücksichtigt werden, welche am meisten zur Modellgenauigkeit beitragen.
-
Nach der Definition der Teilmenge C
Q 504 ergibt sich, dass alle anderen Prozessparameter X \ C
Q keinen oder nur einen geringen Einfluss auf die Qualitätsvorhersage haben. Beispielsweise wird ein statistisches Maß 555, etwa ein Mittelwert oder eine Verteilungsfunktion verwendet, um diese Prozessparameter in den nachfolgenden Schritten des Verbesserungsverfahrens zu modellieren. Unter Verwendung einiger Anfangswerte für C
Q 504 kann das trainierte Vorhersagemodell f
M 120 verwendet werden, um die Produktqualitätsparameterwerte Q 530 aus Eingabedaten
vorherzusagen.
-
Die Zielvorgabe, d.h. die gewünschte Qualität des Endprodukts, wird durch einen Vektor Q* 580 beschrieben. Eine skalare Funktion f
R 560, welche ein Maß für die Differenz zwischen der vorhergesagten Qualität und der Zielqualität darstellt, kann in verschiedener Hinsicht festgelegt werden. So kann beispielsweise f
R als Summe der quadratischen Entfernung eines aktuell vorhergesagten Produktqualitätsvektors Q zum gewünschten Produktqualitätsvektor Q* gemäß Zielvorgabe angegeben werden:
-
Die Auswirkungen der einzelnen Qualitätsparameter können mit Hilfe eines Gewichtsvektors w gesteuert werden.
-
Mit dem Vorhersagemodell f
M(X) 120, kann die Funktion f
R beschrieben werden als:
-
Um einen verbesserten, beispielsweise optimalen Satz von Parameterwerten
zu finden, welche eine geringere bzw. eine geringste Abweichung zu Zielvorgabe Q* aufweisen, wird ein nichtlinearer Optimierungsalgorithmus f
O 590 verwendet zum Minimieren von f
R,
-
Hierbei wird C
Q 504 iterativ modifiziert (591), um einen Satz von Parameterwerten
zu finden, so dass gilt
-
Als Optimierungsalgorithmus fO 590 wird beispielsweise ein Nelder-Mead-Verfahren bzw. Downhill-Simplex-Verfahren, ein Simplex-Verfahren oder ein L-BFGS-Verfahren (Limited-memory Broyden-Fletcher-Goldfarb-Shanno-Verfahren) verwendet.
-
Nach Ausführungsformen wird der Parameterraum für CQ 504, in dem der Optimierungsalgorithmus fO nach einer optimierten Lösung sucht, so eingeschränkt, dass durch den Optimierungsalgorithmus nur physikalisch sinnvolle und in der Produktionsanlage einstellbare Prozessparameterwerte erhalten werden können. Diese Einschränkungen und andere Hyperparameter des Optimierungsmodells werden bereitgestellt durch Definitionen 593 basierend auf Informationen über allgemeine physikalische Einschränkungen, Einschränkungen der Produktionsanlage und/oder Parameterbereiche in historischen Daten.
-
Der resultierende Satz von Prozessparameterwerten
592 stellt eine Empfehlung zum Erreichen gewünschter Produktqualitätsparameterwerte Q* 580 dar. Die Ein- und Ausgabe des Optimierungsalgorithmus f
O 590 kann in eine übergreifende interaktive Benutzeroberfläche 598 integriert werden. Über eine Eingabefunktion 594 dieser interaktiven Benutzeroberfläche 598 kann ein Nutzer die gewünschten Produktqualitätsparameterwerte Q* 580 eingeben und erhält nach Ausführung der Verbesserungsverfahrens die berechneten Prozessparameterwerten
592 als Ausgabe über eine Ausgabefunktion 596 der interaktiven Benutzeroberfläche 598 zurück.
-
6 zeigen exemplarische Zeitreihendaten von Prozess- und Produktqualitätsparametern für eine exemplarische Polyethylenterephthalat(PET)-Produktionsanlage, für welche der vorgeschlagene Ansatz exemplarisch angewendet werden kann. 6A zeigt einen Auszug von Prozessparameterwerten 600 aus einem exemplarischen Trainingsdatensatz, welcher auf historischen Betriebsdaten einer exemplarischen PET-Anlage beruht. Der Trainingsdatensatz umfasst beispielsweise 495 Prozessparameter, von denen in 6A aus Gründen der Übersichtlichkeit 13 Prozessparameter gezeigt sind. 6B zeigt Produktqualitätsparameter 640 aus demselben exemplarischen Trainingsdatensatz. Der Trainingsdatensatz umfasst 13 Produktqualitätsparameter zu denen in 6B jeweils Produktqualitätsparameterwerte gezeigt werden, welche die Qualität des Endprodukts quantitativ beschreiben. Die meisten Prozessparameter wurden beispielsweise mit einer Häufigkeit von 1 Stunde abgetastet, während Labormessungen der Produktqualitätsparameter alle 4 bis 24 Stunden durchgeführt wurden. Im Zuge eines Trennungsverfahrens zum Trainieren eines Vorhersagemodells nach einer der hierin beschriebene Ausführungsformen wird der Trainingsdatensatz unter Verwendung statistischer Kennzahlen und Prozessspezifikationen bereinigt. Anschließend werden die Prozessdatenparameterwerte um eine Zeitverzögerung von 4 bis 24 Stunden verschoben, wobei für jede Prozesseinheit unter Verwendung von Informationen über den Prozessablauf individuelle Verzögerungen angewendet werden. Die zeitlich verschobenen Prozessdatenparameterwerte werden jeweils zu Gruppen von 2 Stunden aggregiert. Für diese Gruppen werden jeweils Merkmalswerte extrahiert. Zu den extrahierten Merkmalswerten gehören beispielsweise Mittelwert, Standardabweichung und in einigen Fällen die Differenz von Gruppe zu Gruppe. Alle Merkmalswerte sind normiert. Für normalverteilte Merkmalswerte wird beispielsweise eine z-Normalisierung verwendet, d.h. Erwartungswert 0 und deren Varianz/Standardabweichung 1, während für binäre verteilte Merkmale beispielsweise eine Min-Max-Normalisierung verwendet wird. Die Dimensionalität der 495*3 Merkmalsparameter wird durch eine Hauptkomponentenanalyse und ein Vernachlässigen unbedeutender Komponentenbeiträge auf etwa 50 Dimensionen reduziert. Die Daten werden in drei statistisch unabhängige Stichproben unterteilt, d.h. einen Trainingsdatensatz, einen Testdatensatz und einen Validierungsdatensatz unterteilt. Der so resultierende Trainingsdatensatz umfasst 70% der Datenpunkte, der Testdatensatz 25% und der Validierungsdatensatz die restlichen 5% der Datenpunkte. Als künstliches neuronales Netz wird beispielsweise ein mehrschichtiges neuronales Perzeptron-Neuronennetz verwendet, das aus zwei verborgenen Schichten („Hidden Layer“) mit maximal 200 Knoten und einer gleichgerichteten Aktivierungsfunktion für den Eingang und die verborgenen Schichten besteht. Zusätzlich werden beispielsweise Regularisierungsmodelle, insbesondere Lasso-Regression und Ridge-Regression, angewendet. Das Training des Vorhersagemodells erfolgt iterativ unter Verwendung des Adam-Optimierers, indem ein mittlerer quadratischer Fehler der Ausgabe des neuronalen Netzes im Vergleich zu den Wahrheitswerten des Trainingsdatensatzes minimiert wird. Die iterative Minimierung wird beispielsweise für eine maximale Anzahl von 1000 Epochen durchgeführt. Es wird jedoch ein Frühstoppkriterium durchgesetzt, um sicherzustellen, dass die Verlustfunktion der gleichzeitig ausgewerteten Validierungsprobe minimal ist und ein Erlernen von statistischen Schwankungen in der Trainingsprobe vermieden wird.
-
7 zeigt einen Vergleich von vorhergesagten und retrospektiv gemessenen Produktqualitätswerten. Anhand des hohen Übereinstimmungsgrads lässt sich die von dem Vorhersagemodell erreichte hohe Maß an Präzision der Vorhersagen ablesen.
-
Das trainierte Vorhersagemodell fM wurde an dem unabhängigen Testdatensatz ausgewertet, wobei festgestellt wurde, dass das Vorhersagemodell fM die Zusammenhänge zwischen Prozessparameterwerten und Produktqualitätsparametern des Testdatensatzes präzise beschreibt. 7 zeigt die gemessenen Produktqualitätsparameterwerte 700 des Testdatensatzes, die von dem trainierten Vorhersagemodell fM unter Verwendung der Prozessparameterwerte des Testdatensatzes vorhergesagte Produktqualitätsparameterwerte 730 sowie die jeweiligen Vertrauensintervalle 735 für die Vorhersagen mit dem trainierten Vorhersagemodell fM.
-
Für ein Verfahren zum Bereitstellen von Verbesserungsempfehlungen unter Verwendung des trainierten Vorhersagemodells fM wird eine Teilmenge von beispielsweise 45 steuerbaren Prozessparametern CQ mit Hilfe von Informationen über die Prozesskonfiguration und einem Feature-Eliminierungsalgorithmus basierend auf dem Vorhersagemodells fM bestimmt. Um einen optimierten Satz von Prozessparameterwerten zum Erreichen gewünschter Produktqualitätsparameterwerte Q*, beispielsweise fünf Qualitätsparameter und die Anlagenkapazität, zu bestimmen, wird eine numerische Zielfunktion fR definiert als die quadratische Summe der Abweichungen aller vorhergesagten Produktqualitätsparameterwerte Q von den gewünschten Produktqualitätsparameterwerten Q*, jeweils gewichtet mit einem individuellen Faktor w. Die Zielfunktion wird mit dem nichtlinearen Nelder-Mead-Minimierungsalgorithmus minimiert. Um die Konvergenzzeit der Minimierung zu verbessern, werden die Ausgangsparameter für die Minimierungen aus dem historischen Datensatz ermittelt. Als Empfehlung werden jeweils die Mittelwerte der Prozessparameterwerte gewählt, die im Vergleich der gewünschten Produktqualitätsparameterwerten in den besten Produktqualitätsparameterwerten resultieren, d.h. den gewünschten Produktqualitätsparameterwerten am nächsten kommen. Beispielsweise konvergiert der Algorithmus typischerweise innerhalb weniger tausend Iterationen.
-
8 veranschaulicht eine exemplarischen Nutzeroberfläche 598 zur Eingabe gewünschter Produktqualitätswerte Q* 594 und zum Bereitstellen von Empfehlungen für verbesserte Prozessparametereinstellungen zum Erreichen der gewünschten Produktqualitätsparameterwerte. Die Nutzeroberfläche 598 ermöglicht es dem Anlagenbediener, direkt mit dem Optimierungsmodell zu interagieren. Dazu stellt die Nutzeroberfläche 598 ein Eingabemodul 820 bereit, über welches der Bediener eine gewünschte Produktqualität Q* 594 auswählen kann durch Eingabe bzw. Auswahl eines Produktqualitätsparameterwertes 821 und des Toleranzbereichs 822 für den Produktqualitätsparameterwert 821. Nach Empfang der Angabe der Produktqualität Q* 594 wird das Verfahren zum Bereitstellen von Verbesserungsempfehlungen, wie es beispielsweise in der
7 beschrieben wird, ausgeführt, bis ein optimierter Satz von steuerbaren Prozessparametern
gefunden ist. Dieser Satz von steuerbaren Prozessparametern
umfasst beispielsweise optimierte Einstellungen für jeden der, beispielsweise 45, Prozessparameter, welche in Segment 596 der Nutzeroberfläche angezeigt wird. Die Ausgabe der optimierten Einstellungen umfasst für jeden der steuerbaren Prozessparameter
ein Ausgabemodul 840, welches einen empfohlenen Prozessparameterwert 842 umfasst. Zusätzlich zu dem empfohlenen Prozessparameterwert 842 kann das Ausgabemodul 840 zu Veranschaulichungszwecken optional einen graphischen Vergleich, beispielsweise unter Verwendung von Histogrammen, des empfohlenen Prozessparameterwerts 842 mit den historisch verwendeten Prozessparameterwerten 843 umfassen.
-
9 veranschaulicht eine schematische Struktur eines exemplarischen künstlichen neuronalen Netzes, welches als Machine-Learning-Modul 216 verwendet werden kann. Bei dem gezeigten künstlichen neuronalen Netz handelt es sich um das bereits im Kontext der
6 beschriebenen mehrschichtigen neuronalen Perzeptron-Neuronennetz mit einer Eingabeschicht X, einer Ausgabeschicht Y, sowie zwei verborgenen Schichten („Hidden Layer“) H
1 und H
2. Für die Eingabeschicht und die verborgenen Schichten wird jeweils eine gleichgerichtete Aktivierungsfunktion verwendet. Es wird eine Mehrzahl von m Trainingssamples bzw. Trainingsdatensätzen, beispielsweise mehrere hundert (z.B. m = 907), bereitgestellt. Jeder der Trainingsdatensätze umfasst Trainingsprozessparameterwerte
für eine Mehrzahl von n Prozessparametern, beispielsweise mehrere hundert (z.B. n = 493), mit i = 1, ..., n und j = 1, ..., m. Ferner umfassen die Trainingsdatensätze Produktqualitätsparameterwerte
für eine Mehrzahl von I Produktqualitätsparametern, beispielsweise I = 10, mit k = 1, ..., I und j = 1, ..., m. Die Trainingsprozessparameterwerte
werden als Eingabedaten für die Eingabeschicht verwendet, wozu sie beispielsweise unter Verwendung einer Z-Normalisierung
skaliert werden, mit
und
Die Produktqualitätsparameterwerte werden als durch das künstliche neuronale Netz vorherzusagende Ausgabedaten bereitgestellt. Aufgrund der Z-Normalisierung der Eingabedaten, ist auf die aus dem künstlichen neuronalen Netz resultierenden Werte eine inverse Z-Normalisierung
anzuwenden, damit die Ergebnisse mit den als Ausgabedaten bereitgestellten Produktqualitätsparameterwerten vergleichbar sind. Im Zuge des künstlichen neuronalen Netzes werden Gewichtungsfaktoren W
H1, W
H2, W
Y der Verbindungen zwischen den Knoten der Schichten angepasst, so dass bei einem Durchlauf der Eingabedaten X durch das künstliche neuronale Netz, diese von Schicht zu Schicht, d.h. auf der ersten verborgenen Schicht
und der zweiten verborgenen Schicht
so verarbeitet werden, dass sie auf der Ausgabeschicht in Ausgabedatenwerten
resultieren, welche nach einer Rückskalierung, beispielsweise in Form der inversen Z-Normalisierung mit den Trainingsproduktqualitätsparametern übereinstimmen.
-
10 veranschaulicht schematisch eine exemplarische chemische Produktionsanlage 900, welche aus einer Mehrzahl von chemischen Edukten 910, 912 ein chemisches Produkt 920 herstellt. Die Edukte 910, 912 können dem Prozess initial oder zu unterschiedlichen Zeitpunkten im Verlauf des Prozesses zugeführt werden. Aus den Edukten 910, 912 kann direkt das Produkt 920 hergestellt werden, oder es werden ein oder mehrere Zwischenprodukte hergestellt, aus welchen das Produkt 920 als Endprodukt hergestellt wird. Das Produkt 920 kann analysiert werden zum Bestimmen von Produktqualitätsparameterwerten QW. Wenn die Edukte 910, 912 unterschiedliche Prozessstufen innerhalb der Produktionsanlage 900 durchlaufen, werden Prozessparameterwerte von ein oder mehreren Prozessparametern PW1 bis PWn durch Sensoren S1 bis Sn der Produktionsanlage 900 erfasst. Diese Prozessparameterwerte PW1 bis PWn werden zu identischen und/oder verschiedenen Zeiten T1 bis Tn erfasst. Dem aus den Edukten 910, 912 hergestellten Produkt ist eine Herstellungszeit Tq, beispielsweise der Zeitpunkt der Fertigstellung des Produkts zugeordnet. Anhand von Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Prozess kann für jeden der Sensoren S1 bis Sn jeweils eine sensorspezifische zeitliche Verschiebung zwischen einem Zeitpunkt T1 bis Tn eines Erfassens eines Prozessparameterwerts PW1 bis PWn durch den entsprechenden Sensor S1 bis Sn und einem Fertigstellen einer Einheit des Produkts 920, während deren Herstellung der entsprechende Prozessparameterwerte PW1 bis PWn erfasst wurde. Somit lassen sich die erfassten Prozessparameterwerte PW1 bis PWn unter Verwendung der sensorspezifischen zeitlichen Verschiebungen zeitlich den Produkteinheiten zuordnen deren Produktionsprozess sie beschreiben bzw. beeinflusst haben. Dies zeitlichen Verschiebungen können unabhängig von den erfassten Prozessparameterwerte PW1 bis PWn sein oder von einem oder mehreren dieser Prozessparameterwerte abhängen. Umfassen die Prozessparameterwerte beispielsweise einen Wert für eine Durchflussgeschwindigkeit einer Materialkomponente zum Herstellen des Produkts 920 durch ein Rohr, so kann die zeitliche Verschiebung der Erfassungszeiten flussaufwärts angeordneter Sensoren gegenüber dem Fertigstellungszeitpunkt Tq des Produkts 920 von der Zeit abhängen, welche die Materialkomponente bzw. ein für den Prozess notwendiger Teil der Materialkomponente zum Durchfluss durch das Rohr benötigt. Bei dem Prozess kann es sich um einen Batchprozess handeln, in welchem vordefinierte Batches der Edukte 910, 912 bereitgestellt werden und aus diesen ein Batch des Produkts 920 hergestellt wird. In diesem Fall kann es sich bei einer Produkteinheit beispielsweise um einen Batch des Produkts 920 handeln. Alternativ kann es sich um einen kontinuierlichen Produktionsprozess handeln, bei welchem Edukte 910, 912 als kontinuierliche Materialströme zugeführt und das hergestellte Produkt als ein kontinuierlicher Materialstrom gewonnen wird. In diesem Fall kann es sich bei einer Produkteinheit beispielsweise um eine Stichprobe aus dem Produktmaterialstrom handeln.
-
11 veranschaulicht ein Verfahren zum Trainieren eines Machine-Learning-Moduls, beispielsweise eines künstlichen neuronalen Netzes, eines computerimplementierten Vorhersagemodells zum Vorhersagen von Produktqualitätsparameterwerten für ein oder mehrere Qualitätsparameter eines durch eine chemische Produktionsanlage hergestellten chemischen Produkts, wie sie beispielsweise schematisch in 10 veranschaulicht wird. Die Produktionsanlage umfasst eine Mehrzahl von Sensoren t, welche jeweils dazu konfiguriert sind im Betrieb der Produktionsanlage Prozessparameterwerte für ein oder mehrere Prozessparameter eines von der Produktionsanlage ausgeführten chemischen Prozesses zur Herstellung des chemischen Produkts zu erfassen.
-
In Block 1000 werden Trainingsdaten für das Trainieren des Machine-Learning-Moduls bereitgestellt. Diese Trainingsdaten umfassen für eine Mehrzahl von durch die Produktionsanlage hergestellten Produkteinheiten jeweils für ein oder mehrere Qualitätsparameter der jeweiligen Produkteinheit bestimmte Produktqualitätsparameterwerte als Trainingsproduktqualitätsparameterwerte. Diese Produktqualitätsparameterwerte werden beispielsweise im Zuge einer Qualitätsanalyse hergestellter Produkteinheiten, etwa in einem Labor, bestimmt. Diesen Trainingsproduktqualitätsparameterwerten ist beispielsweise jeweils eine Herstellungszeit der Produkteinheit, für welche sie bestimmt wurden, zugeordnet. Ferner können die Trainingsdaten von jedem der Sensoren jeweils eine Mehrzahl von Prozessparameterwerte als Trainingsprozessparameterwerte umfassen, welche während der Herstellung der Produkteinheiten erfasst wurden, für welche die Trainingsproduktqualitätsparameterwerten bestimmt wurden. Den Trainingsprozessparameterwerten sind beispielsweise jeweils eine Erfassungszeit und ein Identifikator des erfassenden Sensors zugeordnet.
-
In Block 1002 werden a priori Informationen über die Produktionsanlage und den von der Produktionsanlage ausgeführten Prozess zusammengefasst. Diese a priori Informationen umfassen zeitliche Ablaufinformationen über einen zeitlichen Ablauf des ausgeführten Prozesses innerhalb der Produktionsanlage.
-
In Block 1004, wird für jeden der Sensoren jeweils eine sensorspezifische zeitliche Verschiebung zwischen einer Erfassungszeit eines der durch den entsprechenden Sensor erfassten Trainingsprozessparameterwerte und einer Herstellungszeit der Produkteinheit, während deren Herstellung der entsprechende Trainingsprozessparameterwert erfasst wurde, bestimmt. Diese Verschiebung kann von ein oder mehreren der gewählten Prozessparameterwerten abhängen oder von diesen unabhängig sein. Das Bestimmen erfolgt jeweils unter Verwendung der zeitlichen Ablaufinformationen und die bestimmten sensorspezifischen zeitlichen Verschiebungen der Sensoren werden jeweils den durch den jeweiligen Sensor erfassten Trainingsprozessparameterwert zugordnet.
-
In Block 1006 werden die Trainingsprozessparameterwerte jeweils zu den ein oder mehreren Trainingsproduktqualitätsparameterwerten einer der Produkteinheiten zugeordnet, während deren Herstellungsprozess der jeweilige Trainingsprozessparameterwert erfasst wurde. Das Zuordnen erfolgt unter Verwendung der Erfassungszeit des jeweiligen Trainingsprozessparameterwerts, der sensorspezifischen zeitlichen Verschiebung des den jeweiligen Trainingsprozessparameterwert erfassenden Sensors und der Herstellungszeit der jeweiligen Produkteinheit.
-
In Block 1008 wird schließlich das Machine-Learning-Modul unter Verwendung der einander zugeordneten Trainingsprozessparameterwerte und Trainingsproduktqualitätsparameterwerte trainiert. Dabei werden die jeweiligen Trainingsproduktqualitätsparameterwerte zum Bereitstellen von Ausgabedaten und die jeweils zugeordneten Trainingsprozessparameterwerte zum Bereitstellen von Eingabedaten des Machine-Learning-Moduls für das Trainieren verwendet.
-
12 zeigt ein exemplarisches Computersystem 930 zum Trainieren eines Machine-Learning-Moduls eines computerimplementierten Vorhersagemodells 210 zum Vorhersagen von Produktqualitätsparameterwerten. Das Computersystem 930 umfasst einen Prozessor 932 und einen Speicher 934. In dem Speicher 934 ist beispielsweise das zu trainierende Vorhersagemodell 210 gespeichert. Ferner sind in dem Speicher Programminstruktionen gespeichert, deren Ausführen der durch den Prozessor 932 das Computersystem 930 dazu veranlassen, ein Verfahren zum Trainieren des Vorhersagemodells 210 auszuführen. Das Computersystem 930 kann ferner eine Nutzerschnittstelle 936 umfassen, welche Eingabe- und Ausgabevorrichtungen für eine Interaktion eines Nutzers mit dem Computersystem 930 bereitstellt. Ferner kann das Computersystem 930 eine Kommunikationsschnittstelle 939 umfassen, über welche das Computersystem 930 Trainingsdaten zum Trainieren des Vorhersagemodells 210 empfangen kann. Diese Trainingsdaten umfassen Prozessparameterwerte 200, welche von Sensoren 946 einer von einem Steuersystem 942 gesteuerten Produktionsanlage 900 erfasst wurden, sowie von einem Analysesystem 950, etwa in einem Labor, bestimmte Produktqualitätsparameterwerte 240 von Produkteinheit, für deren Herstellungsprozess die Prozessparameterwerte 200 erfasst wurden. Die Prozessparameterwerte 200 werden beispielsweise in einer Speichervorrichtung 944 der Produktionsanlage 900 gespeichert und dem Computersystem 930 über eine Kommunikationsverbindung, z.B. über ein Netzwerk, bereitgestellt. Alternativ kann das Computersystem 930 auch Bestandteil der Produktionsanlage 900, etwa von deren Steuersystem 942, sein. Nach einer weiteren alternativen Ausführungsform werden die Prozessparameterwerte 200 in einer externen Speichervorrichtung, etwa in der Cloud, gespeichert, aus welcher das Computersystem 930 die Prozessparameterwerte 200 herunterladen kann. Die Produktqualitätsparameterwerte 240 werden beispielsweise in einer Speichervorrichtung 954 des Analysesystems 950 gespeichert und dem Computersystem 930 über eine Kommunikationsverbindung, z.B. über ein Netzwerk, bereitgestellt. Alternativ werden die Produktqualitätsparameterwerte 240 in einer externen Speichervorrichtung, etwa in der Cloud, gespeichert, aus welcher das Computersystem 930 die Produktqualitätsparameterwerte 240 herunterladen kann.
-
Nachdem das Vorhersagemodell 210 trainiert ist, kann das Computersystem 930, das trainierte Vorhersagemodell zum Vorhersagen von Produktqualitätsparameterwert aktuell durch die Produktionsanlage 900 hergestellter Produkteinheiten nutzen. Ferner kann das trainierte Vorhersagemodell zum Detektieren von Anomalien und zum Bestimmen von Empfehlungen zum Einstellen von Prozessparameterwerten zum erzielen gewünschter Zielproduktqualitätsparameterwerte verwendet werden. Schließlich kann das Computersystem 930 dazu konfiguriert sein, dass trainierte Vorhersagemodell unter Verwendung weiterer Trainingsdaten zusätzlich zu trainieren. Insbesondere kann so ein kontinuierliches Trainieren des Vorhersagemodells implementiert werden.
-
Bezugszeichenliste
-
- 100
- Prozessparameterwerte
- 120
- Trainiertes Vorhersagemodel
- 121
- Datenbereinigungsmodul
- 122
- Datenaggregationsmodul
- 123
- Merkmalsextraktionsmodul
- 124
- Datennormalisierungsmodul
- 125
- Hauptkomponentenanalysemodul
- 126
- Machine-Learning-Modul
- 127
- Normalisierungsmodul
- 130
- vorhergesagte Produktqualitätsdaten
- 200
- Trainingsprozessparameterwerte
- 210
- untrainiertes Vorhersagemodul
- 211
- Datenbereinigungsmodul
- 212
- Datenaggregationsmodul
- 213
- Merkmalsextraktionsmodul
- 214
- Datennormalisierungsmodul
- 215
- Hauptkomponentenanalysemodul
- 216
- Machine-Learning-Modul
- 217
- Datennormalisierungsmodul
- 240
- gemessene Trainingsproduktqualitätsparameterwerte
- 245
- Trainingsdatensatz
- 250
- a priori Zusatzinformationen
- 251
- a priori Zusatzinformationen (Datenbereinigung)
- 252
- a priori Zusatzinformationen (Datenaggregation)
- 253
- a priori Zusatzinformationen (Merkmalsextraktion)
- 254
- a priori Zusatzinformationen (Datennormalisierung)
- 255
- a priori Zusatzinformationen (Hauptkomponentenanalyse)
- 256
- a priori Zusatzinformationen (Machine-Learning)
- 257
- a priori Zusatzinformationen (Datennormalisierung)
- 340
- gemessene Produktqualitätsparameterwerte
- 360
- Klassifizierungsfunktion
- 362
- Anomalieereignis
- 420
- zusätzlich trainiertes Vorhersagemodel
- 421
- Datenbereinigungsmodul
- 422
- Datenaggregationsmodul
- 423
- Merkmalsextraktionsmodul
- 424
- Datennormalisierungsmodul
- 425
- Hauptkomponentenanalysemodul
- 426
- Neuronales-Netz-Modul
- 427
- Normalisierungsmodul
- 460
- Klassifizierungsfunktion
- 462
- Eingabe
- 464
- Ausgabe
- 500
- Prozessparameterwerte
- 501
- Auswahlalgorithmus
- 502
- steuerbare Prozessparameter
- 503
- Merkmalseliminierungsalgorithmus
- 504
- steuerbare Prozessparameter (Einfluss auf Qualitätsvorhersage)
- 530
- Produktqualitätsparameterwerte
- 551
- Informationen über Produktionsanlage
- 555
- statistisches Maß
- 560
- skalare Funktion
- 580
- gewünschte Produktqualitätsparameterwerte
- 590
- Optimierungsalgorithmus
- 591
- iteratives Anpassen
- 592
- empfohlene Prozessparameterwerte
- 593
- Einschränkungen
- 594
- Eingabefunktion
- 596
- Ausgabefunktion
- 598
- Benutzeroberfläche
- 600
- Prozessparameterwerte
- 640
- Produktqualitätsparameterwerte
- 700
- gemessener Produktqualitätsparameterwert
- 730
- vorhergesagter Produktqualitätsparameterwert
- 735
- Vertrauensintervall
- 820
- Eingabemodul
- 821
- Produktqualitätsparameterwert
- 822
- Toleranzbereich
- 840
- Ausgabemodul
- 842
- empfohlener Prozessparameterwert
- 843
- verwendete Prozessparameterwerte
- 900
- Produktionsanlage
- 910
- Edukt
- 912
- Edukt
- 920
- Produkt
- 930
- Computersystem
- 932
- Prozessor
- 934
- Speicher
- 936
- Nutzerschnittstelle
- 938
- Kommunikationsschnittstelle
- 942
- Steuersystem
- 944
- Speicher
- 946
- Sensoren
- 950
- Qualitätsanalysesystem
- 952
- Computersystem
- 954
- Speicher