Zusammenfassung
In diesem Beitrag wird DaMoQ vorgestellt, eine Erweiterung zur MATLAB-Toolbox SciXMiner, um die Datenqualität von Eingangsdaten für Regressionen zu bewerten. Bei SciXMiner handelt es sich um eine Open-Source-MATLAB-Toolbox zur automatisierten Bild- und Datenanalyse. In DaMoQ werden verschiedene Muster ungleichmäßiger Verteilungen in Datensätzen quantifiziert und visualisiert. Während die Visualisierungen dem Anwender einen schnellen Einblick in den vorliegenden Datensatz geben, wird die Quantifizierung für eine aggregierte Bewertung der einzelnen Eingangsgrößen sowie des Datensatzes genutzt. Anhand Benchmark-Datensätze und einer Anwendung für Labyrinthdichtungen wird gezeigt, dass die Kriterien und Visualisierungen von DaMoQ nicht nur ähnliche Ergebnisse wie eine visuelle Analyse der Streuwolkendiagramme liefern, sondern auch visuell schwer erkennbare Phänomene identifizieren.
Abstract
We propose DaMoQ, an extension package of the data analysis MATLAB toolbox SciXMiner, to assess the quality of input data in regression problems. DaMoQ quantifies inhomogeneity and visualizes patterns of data distributions in order to evaluate the quality of a given dataset and its features. We use two benchmark datasets and a real world dataset for modelling the labyrinth seal discharge coefficient to show the similarity of DaMoQ results to a visual inspection of the data.
Über die Autoren
Wolfgang Doneit ist Mitarbeiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT).
Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen
Prof. Dr.-Ing. Ralf Mikut ist außerplanmäßiger Professor an der Fakultät für Maschinenbau des KIT und Projektleiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT). Forschungsschwerpunkte: Computational Intelligence, Data Mining, Biosignalanalyse, Bildverarbeitung, Regelungstechnik, Robotik, Bewegungsanalyse, Modellierung von Energiesystemen.
Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen
PD Dr.-Ing Lutz Gröll ist Projektleiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT). Forschungsschwerpunkte: Modellierung verfahrenstechnischer Anlagen, Parameteridentifikation, Regelungstheorie.
Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen
Dr.-Ing. Tim Pychynski war Mitarbeiter am Institut für Thermische Strömungsmaschinen (ITS) am Karlsruher Institut für Technologie (KIT) und ist Forschungsingenieur der Robert Bosch GmbH.
Robert Bosch GmbH, Robert-Bosch-Campus 1, 71272 Renningen
Dr.-Ing. Markus Reischl ist Projektleiter für das Projekt TELMYOS am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT) und Mitglied der Heidelberg Karlsruhe Research Partnership. Hauptarbeitsgebiete: Mensch-Maschine-Schnittstellen, Bildverarbeitung, Bioinformatik, Data-Mining.
Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen
©2017 Walter de Gruyter Berlin/Boston