-
[GEBIET DER ERFINDUNG]
-
Die vorliegende Erfindung betrifft eine Werkzeugmaschine.
-
[ALLGEMEINER STAND DER TECHNIK]
-
Wenn eine Bearbeitung unter Verwendung einer Werkzeugmaschine durchgeführt wird, wird ein Werkstück unter Verwendung eines Werkzeugs in Abhängigkeit von einer Route, einer Geschwindigkeit und einer Spindeldrehzahl bearbeitet, die von einem Programm bestimmt werden. Für eine solche Bearbeitung ist eine Steuerung bekannt, die ausgestaltet ist, Bearbeitungsbedingungen, wie beispielsweise eine Spindeldrehzahl und eine Zufuhrgeschwindigkeit, anzupassen, derart dass weder Rattern noch Werkzeugabrieb/Werkzeugbruch auftritt, um zu vermeiden, dass Einflüsse von Rattern und Werkzeugabrieb/Werkzeugbruch während der Bearbeitung auf der bearbeiteten Oberfläche auftreten (siehe zum Beispiel Patentliteratur 1).
-
[ENTGEGENHALTUNGSLISTE]
-
[PATENTLITERATUR]
-
[PATENTLITERATUR 1]
Veröffentlichung des
Japanischen Patents Nr. 6063013
-
[KURZDARSTELLUNG DER ERFINDUNG]
-
[TECHNISCHE AUFGABE]
-
Es besteht indes ein Nachteil, dass, wenn eine tatsächliche Schneidlast eine erwartete Schneidlast überschreitet, die Zunahme der Schneidlast zu einer Zunahme des Synchronisationsfehlers und selbst erregter Schwingung führt, wobei die Erhöhung des Synchronisationsfehlers dazu führt, dass eine weitere Erhöhung der Schneidlast aufgrund von Einflüssen des Abriebs und dergleichen des Werkzeugs bei der Bearbeitung auftritt, die eine Synchronisation zwischen Drehvorgängen des Werkzeugs und des Werkstücks und Synchronisation zwischen Drehvorgängen und Zufuhrvorgängen erfordert, wie beispielsweise Walzfräsen, bei dem die Bearbeitung durchgeführt wird, während das Werkstück synchron zur Drehung und Bewegung des Werkzeugs gedreht wird.
-
Obgleich es erforderlich ist, einen Raum zu sichern, um zu verhindern, dass die Schneidlast zu groß wird, um das Auftreten der selbst erregten Schwingung einzuschränken, besteht ein Nachteil, dass es nicht möglich ist, eine Bearbeitungsfähigkeit durch einfaches Sichern eines Raums für die Schneidlast ausreichend zu nutzen, und die Bearbeitungseffizienz dadurch verschlechtert wird.
-
Eine Aufgabe der Erfindung besteht darin, eine Werkzeugmaschine bereitzustellen, die in der Lage ist, das Auftreten von selbst erregter Schwingung zu verhindern und auch die Verschlechterung der Bearbeitungseffizienz bei der Bearbeitung zu verhindern, wenn Synchronisation zwischen Drehung und Bewegung des Werkzeugs und Drehung eines Werkstücks erforderlich ist.
-
[LÖSUNG DER AUFGABE]
-
Ein Aspekt der Erfindung zielt auf eine Werkzeugmaschine ab, die umfasst: eine Spindel, die bewirkt, dass ein Werkzeug sich dreht und bewegt; einen Werkstück-Drehmechanismus, der bewirkt, dass ein Werkstück sich dreht; eine Steuereinheit, die die Spindel und den Werkstück-Drehmechanismus gemäß Befehlen von einem Programm steuert; und eine Schneidlast-Detektionseinheit, die eine Schneidlast detektiert, die von dem Werkzeug auf das Werkstück übertragen wird, wobei die Steuereinheit eine Schneidroute steuert, derart dass eine Schneidtiefe des mit dem Werkzeug geschnittenen Werkstücks in einer Region mit einer niedrigen Schneidlast größer als die Schneidtiefe in einer Region mit einer hohen Schneidlast innerhalb eines solchen Bereichs ist, dass die von der Schneidlast-Detektionseinheit detektierte Schneidlast die vorbestimmte Last nicht überschreitet.
-
Gemäß dem Aspekt ist es möglich, in einem Fall, in dem die Steuereinheit die Spindel und den Werkstück-Drehmechanismus auf eine synchronisierte Weise steuert und das an dem Werkstück-Drehmechanismus angebrachte Werkstück mit dem an der Spindel angebrachten Werkzeug geschnitten wird, das Werkstück durch die Schneidroute zu bearbeiten, die die Schneidlast in der Region mit der niedrigeren Schneidlast erhöht, indem die Schneidtiefe so eingestellt wird, dass sie in der Region, in der die von dem Werkzeug auf das Werkstück übertragene Schneidlast, die von der Schneidlast-Detektionseinheit detektiert wurde, niedrig ist, größer ist als in der Region mit der hohen Schneidlast. Da eine Schneidroute mit einer Schneidlast, die eine vorbestimmte Last nicht überschreitet, typischerweise in der Region mit der hohen Schneidlast ausgewählt wird, ist es möglich, die Bearbeitung effizient durchzuführen und dadurch eine Bearbeitungszeit zu verkürzen, indem verhindert wird, dass die Schneidlast zu groß wird, das Auftreten von selbst erregter Schwingung verhindert wird und aufgrund des geringen Kontakts zwischen dem Werkstück und dem Werkzeug eine tiefe Schneidtiefe in der Region mit der niedrigen Schneidlast einzustellen.
-
In dem vorhergehenden Aspekt kann die Steuereinheit die Spindel in einer Richtung steuern, in der ein Abstand zwischen einer Drehachse des von dem Werkstück-Drehmechanismus gedrehten Werkstücks und einer Drehachse des von der Spindel gedrehten Werkzeugs in der Region mit der niedrigen Schneidlast länger ist als in der Region mit der hohen Schneidlast.
-
Mit dieser Ausgestaltung ist es möglich, die Schneidroute einfach anzupassen, das Auftreten von selbst erregter Schwingung bei der Bearbeitung zu verhindern und auch die Verschlechterung der Arbeitseffizienz zu verhindern.
-
In dem vorhergehenden Aspekt kann die Steuereinheit eine Einrichtung zum maschinellen Lernen umfassen, die maschinelles Lernen von Anpassungsparametern für Bearbeitungsbedingungen und einen Anpassungsbetrag der Anpassungsparameter beim Schneiden, das mit dem Werkzeug auf dem Werkstück durchgeführt wird, durchführt, wobei die Einrichtung zum maschinellen Lernen eine Zustandsbeobachtungseinheit, die Zustandsdaten erfasst, die Informationen sind, die einen Bearbeitungszustand beim Schneiden angeben, eine Belohnungsberechnungseinheit, die eine Belohnung basierend auf den Zustandsdaten und Belohnungsbedingungen berechnet, eine Bearbeitungsbedingungs-Anpassungslerneinheit, die maschinelles Lernen der Anpassung der Bearbeitungsbedingungen durchführt, und eine Bearbeitungsbedingungs-Anpassungseinheit umfassen kann, die als eine Anpassungsaktion Zielparameter für die Anpassung der Bearbeitungsbedingungen und den Betrag der Anpassung basierend auf einem Ergebnis des maschinellen Lernens der Anpassung der Bearbeitungsbedingungen, das durch die Bearbeitungsbedingungs-Anpassungslerneinheit durchgeführt wird, und den Zustandsdaten entscheidet und die Bearbeitungsbedingungen beim Schneiden basierend auf der Anpassungsaktion anpasst, wobei die Bearbeitungsbedingungs-Anpassungslerneinheit maschinelles Lernen der Anpassung der Bearbeitungsbedingungen als die Anpassungsaktion basierend auf den von der Zustandsbeobachtungseinheit nach einem Bearbeitungsvorgang erfassten Zustandsdaten basierend auf den ausgegebenen Bearbeitungsbedingungen nach der Anpassung und der von der Belohnungsberechnungseinheit berechneten Belohnung durchführen kann, und als die Belohnungsbedingungen eine negative Belohnung angeordnet wird, wenn Schwingung auftritt, eine positive Belohnung angeordnet wird, wenn das mit dem Werkzeug auf dem Werkstück durchgeführte Schneiden die Schneidlast erhöht, ohne einen vorbestimmten Lastbereich zu überschreiten, und eine negative Belohnung angeordnet wird, wenn die Schneidlast verringert wird oder die Schneidlast die vorbestimmte Last überschreitet.
-
Mit dieser Ausgestaltung ist es möglich, durch maschinelles Lernen einfach über eine Schneidroute zu entscheiden, die in der Lage ist, das Auftreten von selbst erregter Schwingung bei der Bearbeitung zu verhindern und auch die Verschlechterung der Bearbeitungseffizienz zu verhindern.
-
[VORTEILHAFTE WIRKUNGEN DER ERFINDUNG]
-
Eine erfindungsgemäße Wirkung besteht darin, dass es möglich ist, das Auftreten von selbst erregter Schwingung zu verhindern und auch die Verschlechterung der Bearbeitungseffizienz bei der Bearbeitung zu verhindern, wenn Synchronisation zwischen Drehung und Bewegung des Werkzeugs und Drehung eines Werkstücks erforderlich ist.
-
Figurenliste
-
- [1] 1 ist ein Blockdiagramm, das eine Werkzeugmaschine gemäß einer Ausführungsform der Erfindung veranschaulicht.
- [2] 2 ist ein Blockdiagramm, das ein Beispiel für eine Steuereinheit veranschaulicht, die in der Werkzeugmaschine von 1 angeordnet ist.
- [3] 3 ist eine Darstellung zur Erklärung einer Grundidee eines Algorithmus zum Lernen durch Verstärkung in der in 1 veranschaulichten Werkzeugmaschine.
- [4] 4 ist ein Flussdiagramm, das einen Ablauf des maschinellen Lernens in der in 1 veranschaulichten Werkzeugmaschine veranschaulicht.
- [5] 5 ist eine schematische Ansicht zur Erklärung eines Bearbeitungspfades der Werkzeugmaschine im Stand der Technik.
- [6] 6 ist eine schematische Ansicht zur Erklärung des Kontaktbetrags zwischen dem Werkzeug und dem Werkstück in dem in 5 veranschaulichten Bearbeitungspfad.
- [7] 7 ist ein Schaubild, das eine zeitliche Änderung der Motorlast bei der Grobbearbeitung veranschaulicht, die drei Mal durch den Bearbeitungspfad in 5 durchgeführt wird.
- [8] 8 ist eine schematische Ansicht zur Erklärung des Kontaktbetrags zwischen dem Werkzeug und dem Werkstück in einem in 1 veranschaulichten optimierten Bearbeitungspfad der Werkzeugmaschine.
- [9] 9 ist eine schematische Ansicht zur Erklärung des in 1 veranschaulichten optimierten Bearbeitungspfads der Werkzeugmaschine.
- [10] 10 ist ein Schaubild, das eine zeitliche Änderung der Motorlast bei der Grobbearbeitung, die drei Mal durch den in 9 veranschaulichten Bearbeitungspfad durchgeführt wird, im Vergleich zu der in 7 veranschaulichten zeitlichen Änderung veranschaulicht.
- [11] 11 ist ein Schaubild, das ein Beispiel für eine Struktur veranschaulicht, die sich von einer Struktur der in 7 veranschaulichten Motorlast unterscheidet.
- [12] 12 ist ein Schaubild, das ein weiteres Beispiel für eine Struktur veranschaulicht, die sich von der Struktur der in 7 veranschaulichten Motorlast unterscheidet.
-
[BESCHREIBUNG VON AUSFÜHRUNGSFORMEN]
-
Eine Werkzeugmaschine 1 gemäß einer Ausführungsform der Erfindung wird nachfolgend mit Bezug auf die Zeichnungen beschrieben.
-
Die Werkzeugmaschine 1 gemäß der Ausführungsform umfasst eine Spindel 2, die bewirkt, dass ein Werkzeug X sich dreht und bewegt, einen Werkstück-Drehmechanismus 3, der bewirkt, dass ein Werkstück W sich dreht, und eine Steuereinheit 4, die die Spindel 2 und den Werkstück-Drehmechanismus 3 gemäß Befehlen von einem Programm P steuert, wie in 1 veranschaulicht. Die Steuereinheit 4 ist mittels eines Speichers und eines Prozessors ausgeführt.
-
Die Steuereinheit 4 analysiert das von dem Speicher gelesene Programm P, steuert die Spindel 2 und den Werkstück-Drehmechanismus 3 in der Werkzeugmaschine 1 basierend auf den Steuerdaten, die als ein Ergebnis der Analyse erhalten werden, und bearbeitet das Werkstück W. Die Werkzeugmaschine 1 umfasst einen Sensor, der eine Position, eine Geschwindigkeit und eine Drehzahl des Werkzeugs X und eine Drehzahl des Werkstücks W detektiert, das in der Zeichnung nicht veranschaulicht ist, und einen Sensor, der eine Last (Schneidlast), die während der Bearbeitung auf den Motor der Spindel 2 wirkt, und Schwingung des Motors detektiert. Zum Beispiel werden die Position, die Geschwindigkeit und die Drehzahl des Werkzeugs X und die Drehzahl des Werkstücks W von einem Kodierer detektiert, eine Last, die auf den Motor wirkt, wird von einem Stromsensor detektiert (Schneidlast-Detektionseinheit: in der Zeichnung weggelassen) und Schwingung des Motors wird von einem Schwingungssensor (in der Zeichnung weggelassen) detektiert.
-
Die Steuereinheit 4 kann Zustandsdaten und Bestimmungsdaten über diese Sensoren erfassen. Die Steuereinheit 4 umfasst eine Zustandsbeobachtungseinheit 5, die die Zustandsdaten von jedem Bauteil der Werkzeugmaschine 1 erfasst, eine Bestimmungsdaten-Erfassungseinheit 6, die die Bestimmungsdaten erfasst, und eine Einrichtung 7 zum maschinellen Lernen, die als eine künstliche Intelligenz dient, die maschinelles Lernen durchführt.
-
Die Zustandsbeobachtungseinheit 5 beobachtet die Position des Werkzeugs X, die Drehzahl und die Zufuhrgeschwindigkeit der Spindel 2 und die von den Steuerdaten erfasste Drehzahl des Werkstücks W, die als ein Ergebnis der von dem Programm P der Steuereinheit 4 durchgeführten Analyse erhalten wurden, als Zustandsdaten, die einen Bearbeitungszustand betreffen, und erfasst die beobachteten Zustandsdaten in der Einrichtung 7 zum maschinellen Lernen. Die erfassten Zustandsdaten werden in der Einrichtung 7 zum maschinellen Lernen gespeichert und werden in eine Belohnungsberechnungseinheit 8 und eine Wertfunktions-Aktualisierungseinheit 9 eingegeben, die nachfolgend beschrieben wird.
-
Die eingegebenen Zustandsdaten können entweder Daten, die in einem neuesten Bearbeitungsvorgang erfasst wurden, oder Daten sein, die in einem vergangenen Bearbeitungsvorgang erfasst wurden. Es ist auch möglich, Zustandsdaten, die in einem anderen Steuersystem oder einem zentralisierten Verwaltungssystem gespeichert sind, einzugeben, zu speichern und auszugeben.
-
Die Bestimmungsdaten-Erfassungseinheit 6 erfasst Daten, die eine Motorlast der Spindel 2 angeben, und Schwingungsdaten, die von dem Sensor erfasst wurden, als Bestimmungsdaten und gibt die Bestimmungsdaten an die Belohnungsberechnungseinheit 8 der Einrichtung 7 zum maschinellen Lernen aus.
-
Es wird angenommen, dass die Werkzeugmaschine 1 und die Steuereinheit 4 mit typischen Ausgestaltungen einer Werkzeugmaschine und einer numerischen Wertsteuerung angeordnet sind und auf eine ausführliche Beschreibung davon wird in der Beschreibung bis auf Ausgestaltungen verzichtet, die insbesondere erforderlich sind, um erfindungsgemäße Vorgänge zum maschinellen Lernen zu erklären. Gemäß der in 2 veranschaulichten Ausgestaltung entspricht die Einrichtung 7 zum maschinellen Lernen einem Agenten und jede in der Werkzeugmaschine 1 bis auf die Einrichtung 7 zum maschinellen Lernen angeordnete Ausgestaltung entspricht einer Umgebung.
-
Die Zustandsdaten, wie beispielsweise die Position, die Geschwindigkeit und die Drehzahl des Werkzeugs X und die Drehzahl und dergleichen des Werkstücks W bei der Bearbeitung unter Verwendung des Bearbeitungswerkzeugs 1, die von der Zustandsbeobachtungseinheit 5 erfasst wurden, und die Bestimmungsdaten, wie beispielsweise die Motorlast und die Schwingungsdaten, die von der Bestimmungsdaten-Erfassungseinheit 6 erfasst wurden, werden als Informationen zum Angeben einer Umgebung in die Einrichtung 7 zum maschinellen Lernen eingegeben. Dies sind Daten, die von jedem Bauteil der Werkzeugmaschine 1 erfasst wurden, und Daten, die von der Steuereinheit 4 erfasst wurden.
-
In der Ausführungsform wird ein Befehl zum Anpassen eines Bearbeitungspfades des Werkzeugs X und zum Anpassen einer Schneidtiefe als Ausgabedaten in einer Aktionsausgabe eingesetzt, die die Einrichtung 7 zum maschinellen Lernen an die Umgebung ausgibt.
-
In der Ausführungsform werden eine Motorlast (eine positive Belohnung und eine negative Belohnung), das Auftreten von Abrieb/Bruch des Werkzeugs X (negative Belohnung), das Auftreten von Schwingung (negative Belohnung) und dergleichen als Belohnungen eingesetzt, die als Reaktion auf das maschinelle Lernen anzuordnen sind. Ein Bediener kann auf geeignete Weise einstellen, welche Daten als eine Grundlage zur Entscheidung über eine Belohnung einzusetzen sind.
-
Die Einrichtung 7 zum maschinellen Lernen führt maschinelles Lernen basierend auf den Zustandsdaten, den Bestimmungsdaten und der Belohnung durch, die vorhergehend beschrieben wurden. Beim maschinellen Lernen werden (1) die Beobachtung eines Zustand st einer Umgebung unter Verwendung des Agenten, (2) die Auswahl einer Aktion at , die der Agent selbst basierend auf dem beobachteten Zustand st und vergangenem Lernen und Ausführen der Aktion at einsetzen kann, (3) ein Wechsel von dem Zustand st zum nächsten Zustand st+1 der Umgebung aufgrund der Ausführung der Aktion at , (4) der Empfang einer Belohnung rt+1 unter Verwendung des Agenten basierend auf einem Zustandswechsel als ein Ergebnis der Aktion at und (5) das Fortsetzen des Lernens unter Verwendung des Agenten basierend auf dem Zustand st , der Aktion at , der Belohnung rt+1 und dem Ergebnis des vergangenen Lernens zwischen dem Agenten und der Umgebung an einer spezifischen Taktzeit t durchgeführt, wie in 3 veranschaulicht.
-
Insbesondere entsprechen die Anpassung des Bearbeitungspfades (Schneidroute) und die Anpassung der Schneidtiefe, die an der Spindel 2 und dem Werkstück-Drehmechanismus 3 durchgeführt werden, der Aktion at , ein Wert, der basierend auf dem Zustand st+1 bewertet und berechnet wird, der neu als ein Ergebnis des Durchführens der Aktion at erhalten wird, entspricht einer Belohnung rt+1 und das Lernen wird durch ihr Anwenden auf einen Wertfunktion-Aktualisierungsausdruck gemäß dem Algorithmus zum maschinellen Lernen durchgeführt.
-
Die Einrichtung 7 zum maschinellen Lernen umfasst eine Belohnungsberechnungseinheit (Einheit zum Berechnen der Belohnung) 8, eine Wertfunktion-Aktualisierungseinheit (Bearbeitungsbedingungs-Anpassungslerneinheit) 9 und eine Entscheidungsfindungseinheit (Bearbeitungsbedingungs-Anpassungseinheit) 10. Die Einrichtung 7 zum maschinellen Lernen kann in der Steuereinheit 4 angeordnet sein oder kann in einem Personal Computer oder dergleichen außerhalb der Steuereinheit 4 angeordnet sein, wie in 2 veranschaulicht.
-
Die Belohnungsberechnungseinheit 8 berechnet eine Belohnung unter Verwendung der Zustandsdaten und der Bestimmungsdaten, die von der Zustandsbeobachtungseinheit 5 oder der Bestimmungsdaten-Erfassungseinheit 6 basierend auf Bedingungen erfasst wurden, unter denen eine Belohnung beim maschinellen Lernen, die von einem Bediener oder dergleichen eingestellt wird, angeordnet wird, und gibt die Belohnung an die Wertfunktions-Aktualisierungseinheit 9 aus.
-
Die Belohnung umfasst eine positive Belohnung und eine negative Belohnung und kann auf geeignete Weise eingestellt werden.
-
Die Belohnungsberechnungseinheit 8 analysiert die von der Zustandsbeobachtungseinheit 5 und der Bestimmungsdaten-Erfassungseinheit 6 eingegebenen Daten basierend auf den eingestellten Belohnungsbedingungen und gibt die berechnete Belohnung an die Wertfunktions-Aktualisierungseinheit 9 aus.
-
Nachfolgend werden Beispiele für Belohnungsbedingungen beschrieben, die von der Belohnungsberechnungseinheit 8 eingestellt werden.
-
„Belohnung 1: Auftreten von Abrieb/Bruch des Werkzeugs X (negative Belohnung)“
-
Wenn der Abrieb des Werkzeugs X mit dem Betrag, der nicht kleiner als ein vorbestimmter Bezugswert ist, während der Bearbeitung unter Verwendung der Werkzeugmaschine 1 auftritt, wird gemäß dem Grad desselben eine negative Belohnung angeordnet. Wenn ein Bruch des Werkzeugs X auftritt, wird eine negative Belohnung angeordnet.
-
„Belohnung 2: Auftreten von Schwingung (negative Belohnung)“
-
Wenn Schwingung mit dem Betrag, der nicht kleiner als ein vorbestimmter Bezugswert ist, während der Bearbeitung unter Verwendung der Werkzeugmaschine 1 auftritt, wird gemäß dem Grad derselben eine negative Belohnung angeordnet.
-
„Belohnung 3: Motorlast (positive Belohnung, negative Belohnung)“
-
Wenn die gemessene Motorlast während der Bearbeitung, die nach der Anpassung vorhergehender Bearbeitungsbedingungen für die Werkzeugmaschine 1 durchgeführt wird, innerhalb eines Bereichs zunimmt, der derart ist, dass die Motorlast einen vorbestimmten Bezugswert (vorbestimmte Last) nicht überschreitet, wird eine positive Belohnung gemäß dem Grad derselben angeordnet. Wenn der vorbestimmte Bezugswert überschritten wird oder die Motorlast abnimmt, wird eine negative Belohnung angeordnet.
-
Die Wertfunktions-Aktualisierungseinheit 9 führt maschinelles Lernen basierend auf den von der Zustandsbeobachtungseinheit 5 erfassten Zustandsdaten und der von der Belohnungsberechnungseinheit 8 berechneten Belohnung durch. Die Entscheidung über die für das Lernen verwendete Wertfunktion erfolgt gemäß dem anzuwendenden Lernalgorithmus. Wenn Q-Learning, der einer von repräsentativen Algorithmen zum Lernen durch Verstärkung ist, verwendet wird, wird zum Beispiel das Lernen durch Aktualisieren einer Aktionswertfunktion Q (st , at ) gemäß Math. 1 durchgeführt.
-
Hier stellt α einen Lernkoeffizienten dar,
γ stellt eine Diskontierungsrate dar und diese sind innerhalb der Bereiche 0 < α ≤ 1 und 0 < γ ≤ 1 definiert.
-
Die Entscheidungsfindungseinheit 10 wählt eine Aktion at (eine Aktion mit dem höchsten Wert), mit der die Belohnung in der Zukunft (rt+1 + rt+2 + ...) in dem gegenwärtigen Zustand st maximal ist, unter Verwendung einer durch vergangenes Lernen erzeugten Wertfunktion aus. Zum Zweck des Lernfortschritts wird beim Lernen auch eine zufällige Aktion bei einer spezifischen Wahrscheinlichkeit bei der Auswahl einer Aktion unter Verwendung der Entscheidungsfindungseinheit 10 ausgewählt (ε-Greedy-Verfahren).
-
Unter Bezugnahme auf das Flussdiagramm in 4 wird ein Ablauf des maschinellen Lernens beschrieben, das von der Wertfunktions-Aktualisierungseinheit 9 durchgeführt wird.
-
Zuerst erfasst, wenn das maschinelle Lernen gestartet wird, die Zustandsbeobachtungseinheit 5 Daten, die einen Bearbeitungszustand der Werkzeugmaschine 1 betreffen, und die Bestimmungsdaten-Erfassungseinheit 6 erfasst Bestimmungsdaten (Schritt S1).
-
Die Wertfunktions-Aktualisierungseinheit 9 gibt einen gegenwärtigen Zustand st basierend auf den den Bearbeitungszustand betreffenden Daten, die von der Zustandsbeobachtungseinheit 5 erfasst wurden, und den von der Bestimmungsdaten-Erfassungseinheit 6 erfassten Bestimmungsdaten an (Schritt S2).
-
Die Entscheidungsfindungseinheit 10 wählt eine Aktion at basierend auf einem vergangenen Lernergebnis und dem in Schritt S2 angegebenen Zustand st aus (Schritt S3).
Als Nächstes führt die Werkzeugmaschine 1 die in Schritt S3 ausgewählte Aktion at aus (Schritt S4).
-
Dann werden die Erfassung von Zustandsdaten unter Verwendung der Zustandsbeobachtungseinheit 5 und die Erfassung der Bestimmungsdaten unter Verwendung der Bestimmungsdaten-Erfassungseinheit 6 durchgeführt (Schritt S5). In diesem Stadium hat sich der Zustand der Werkzeugmaschine 1 aufgrund der im Schritt S4 ausgeführten Aktion at mit dem zeitlichen Übergang von einer Taktzeit t zu einer Taktzeit t+1 geändert.
-
Die Belohnungsberechnungseinheit 8 berechnet eine Belohnung rt+1 basierend auf Daten eines in Schritt S5 erfassten Bewertungsergebnisses (Schritt S6).
-
Dann fährt die Wertfunktions-Aktualisierungseinheit 9 mit dem maschinellen Lernen basierend auf dem in Schritt S2 angegebenen Zustand st , der in Schritt S3 ausgewählten Aktion at und der in Schritt S6 berechneten Belohnung rt+1 fort (Schritt S7) und die Verfahren von Schritt S2 werden wiederholt.
-
Auf diese Weise setzt die Einrichtung 7 zum maschinellen Lernen das Lernen durch Wiederholen von (1) bis (5), wie vorhergehend beschrieben, fort. Es ist möglich, das Lernen durchzuführen, um durch zusätzliches Lernen an eine neue Umgebung angepasst zu werden, sogar wenn die Einrichtung 7 zum maschinellen Lernen in der neuen Umgebung platziert wird, nachdem das Lernen in einer gewissen Umgebung beendet wurde. Durch eine Anwendung zur Anpassung des Bearbeitungspfades und der Schneidtiefe, die von der Steuereinheit 4 durchgeführt wird, die die Werkzeugmaschine 1 zur Bearbeitung des Werkstücks W steuert, ist es somit möglich, die Anpassung des Bearbeitungspfades und dergleichen in kurzer Zeit durch Durchführen von zusätzlichem Lernen in einer neuen Umgebung zusätzlich zu vergangenem Lernen der Anpassung des Bearbeitungspfades und dergleichen sogar in einer Anwendung zum Steuern einer neuen erfindungsgemäßen Werkzeugmaschine 1 zu lernen.
-
Wenn die Werkzeugmaschine 1 bewirkt, dass das Werkzeug X sich dreht und bewegt, bewirkt, dass das Werkstück W sich synchron mit der Drehung und der Bewegung des Werkzeugs X dreht, und auch Bearbeitung, wie zum Beispiel Walzfräsen, durchführt, wird im Fall eines typischen Bearbeitungspfades Grobbearbeitung eine Vielzahl von Malen, zum Beispiel drei Mal, durchgeführt und Feinbearbeitung wird ein Mal unter Beibehaltung einer konstanten Schneidtiefe in Bezug auf das Werkstück W durchgeführt, wie in 5 veranschaulicht.
-
In diesem Fall ändert sich die Motorlast, wie in 7 veranschaulicht, da die Beträge des Kontakts zwischen dem Werkzeug X und dem Werkstück W zum Zeitpunkt des Beginns des Schneidens des Werkstücks W und zum Zeitpunkt des Beendens des Schneidens des Werkstücks W mit dem Werkzeug X bei der Grobbearbeitung gering sind, wie in 6 veranschaulicht.
-
In diesem Fall erfordert das Durchführen des Schneidens zum Zeitpunkt des Beginns des Schneidens des Werkstücks W und zum Zeitpunkt des Beendens des Schneidens des Werkstücks W indes mehr Zeit und die Schneidzeit als Ganzes verlängert sich, wenn eine Schneidtiefe eingestellt wird, die derart ist, dass die Motorlast während des Schneidens die maximal zulässige Last (vorbestimmte Last) nicht überschreitet.
-
Gemäß der Ausführungsform wird der Bearbeitungspfad in einer Richtung angepasst, in der die Schneidlast zum Zeitpunkt des Beginns des Schneidens und zum Zeitpunkt des Beendens des Schneidens zunimmt, wenn die Schneidlast gering ist, und die Schneidtiefe zum Zeitpunkt des Beginns des Schneidens und zum Zeitpunkt des Beendens des Schneidens, wenn die Schneidlast gering ist, erhöht sich somit, wie in 8 veranschaulicht. Das heißt, zum Erhalten einer konstanten Schneidtiefe in dem Bearbeitungspfad im Stand der Technik sind die Beträge des Kontakts zwischen dem Werkzeug X und dem Werkstück W zum Zeitpunkt des Beginns des Schneidens und zum Zeitpunkt des Beendens des Schneidens gering und der Raum in der Motorlast ist mehr als ausreichend.
-
Währenddessen setzt die Ausführungsform den Bearbeitungspfad ein, der die Schneidtiefe zum Zeitpunkt des Beginns des Schneidens und zum Zeitpunkt des Beendens des Schneidens erhöht, wenn die Schneidlast gering ist, wie in 9 veranschaulicht. Das heißt, die Steuereinheit 4 steuert die Spindel 2 in der Richtung, in der der Abstand zwischen der Drehachse des von dem Werkstück-Drehmechanismus 3 gedrehten Werkstücks W und die Drehachse des von der Spindel 2 gedrehten Werkzeugs X in der Region mit der niedrigen Motorlast länger ist als in der Region mit der hohen Motorlast. Dies weist den Vorteil auf, dass die Schwankung des Betrags des Schneidens vom Beginn des Schneidens bis zum Ende des Schneidens, jedes Mal, wenn Grobbearbeitung durchgeführt wird, stabilisiert wird, der Betrag des Schneidens bei der Grobbearbeitung, die ein Mal durchgeführt wird, sich erhöht, die Schneidzeit als Ganzes verkürzt wird und die Bearbeitungseffizienz somit verbessert wird, wie in 10 veranschaulicht.
-
Es besteht ein Vorteil, dass es möglich ist, den Bearbeitungspfad in einer Richtung anzupassen, in der die Motorlast abnimmt, und dadurch das Auftreten von selbst erregter Schwingung aufgrund eines Synchronisationsfehlers zwischen der Drehung des Werkzeugs X und der Drehung des Werkstücks W durch Anordnen einer negativen Belohnung für das Auftreten von Schwingung bei der Bearbeitung einzuschränken.
-
Obgleich in der Ausführungsform die Aktionswertfunktion, die in Q-Learning verwendet wird, beispielhaft als eine Wertfunktion dargestellt wurde, kann stattdessen eine Zustandswertfunktion verwendet werden, die in TD-Learning verwendet wird, der ein Algorithmus zum Lernen durch Verstärkung ist. Als die Zustandswertfunktion kann eine durch Math. 2 dargestellte Zustandswertfunktion beispielhaft dargelegt werden.
-
-
Beim Lernen durch Verstärkung sind eine Vielzahl von Agenten mit einem Netzwerk oder dergleichen verbunden, um ein System zu konstruieren, Informationen, die Zustände s, Aktionen a, Belohnungen r und dergleichen betreffen, werden unter den Agenten gemeinsam genutzt und zum Lernen in den Agenten verwendet, und die entsprechenden Agenten können somit effizientes Lernen durch verteiltes Lernen durch Verstärkung durchführen, in dem die entsprechenden Agenten das Lernen unter Berücksichtigung von auch Umgebungen von anderen Agenten durchführen. Gemäß der Ausführungsform ist es immer noch möglich, zu bewirken, dass die Vielzahl von Agenten, die eine Vielzahl von Umgebungen steuern, die Anpassung von Bearbeitungsbedingungen, die von der Steuereinheit 4 durchgeführt wird, die die Werkzeugmaschine 1 zum Bearbeiten des Werkstücks W steuert, effizient durch das verteilte maschinelle Lernen in einem Zustand zu lernen, in dem die Vielzahl von Agenten über ein Netzwerk oder dergleichen verbunden sind.
-
Als Algorithmen zum Lernen durch Verstärkung sind verschiedene Verfahren, wie beispielsweise Q-Learning, ein SARSA-Verfahren, TD-Learning und ein AC-Verfahren gut bekannt und ein beliebiger von den Algorithmen kann als ein Algorithmus eingesetzt werden, der in der Ausführungsform angewandt wird.
-
Obgleich in der Ausführungsform als ein Beispiel der Fall beschrieben wurde, in dem die Steuereinheit 4 den Bearbeitungspfad derart durch das maschinelle Lernen optimiert, dass die Schneidtiefe des Werkstücks W, das mit dem Werkzeug X in der Region mit der niedrigen Motorlast geschnitten wird, größer als die Schneidtiefe in der Region mit der hohen Motorlast innerhalb eines Bereichs ist, der derart ist, dass die Motorlast eine maximal zulässige Last nicht überschreitet, ist die Ausführungsform nicht darauf beschränkt.
-
Das heißt, die Steuereinheit 4 kann die Spindel 2 ohne Verwendung von maschinellem Lernen in einer Richtung steuern, in der der Abstand zwischen der Drehachse des von dem Werkstück-Drehmechanismus 3 gedrehten Werkstücks W und der Drehachse des von der Spindel 2 gedrehten Werkzeugs X in der Region mit der niedrigen Motorlast länger ist als in der Region mit der hohen Motorlast. Der Bearbeitungspfad kann durch Wiederholen von Bearbeitung unter Änderung des Bearbeitungspfades innerhalb eines Bereichs optimiert werden, der derart ist, dass die Motorlast die maximal zulässige Last nicht überschreitet.
-
Die Form der Motorlast, die den Bearbeitungspfad gemäß der Ausführungsform optimiert, ist nicht auf die Trapezform, wie in 7 und 10 veranschaulicht, beschränkt und die Ausführungsform kann auf eine Motorlast in einer beliebigen Form angewandt werden, wie in 11 und 12 veranschaulicht.
-
Bezugszeichenliste
-
- 1
- Werkzeugmaschine
- 2
- Spindel
- 3
- Werkstück-Drehmechanismus
- 4
- Steuereinheit
- 5
- Zustandsbeobachtungseinheit
- 7
- Einrichtung zum maschinellen Lernen
- 8
- Belohnungsberechnungseinheit (Einheit zum Berechnen der Belohnung)
- 9
- Wertfunktions-Aktualisierungseinheit (Bearbeitungsbedingungs-Anpassungslerneinheit)
- 10
- Entscheidungsfindungseinheit (Bearbeitungsbedingungs-Anpassungseinheit)
- P
- Programm
- W
- Werkstück
- X
- Werkzeug
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-