Data Science Forum Rhein-MainBericht über unsere Veranstaltung am 25. April 2024
Am 25.04.2024 fand das erste Event der GDS Regionalgruppe Rhein-Main in den Räumlichkeiten der Frankfurt School of Finance & Management statt. Es gab viele spannende Beiträge mit einem regen Austausch mit den Teilnehmern. Ein kleines Highlight war die Podiumsdiskussion, von der man viele Denkanstöße mitnehmen konnte.
Welcome Speech Prof. Dr. Göran Kauermann (GDS e.V.)
Zu Beginn stellte sich die Regionalgruppe Rhein-Main vertreten durch Lothar B. Blum. Jacek Haußner und Dr. Martha Krakowski vor. Anschließend ergänzte Prof. Dr. Kauermann als Vorstandsvorsitzender der GDS allgemeine Inhalte der GDS und leitete zum Start des Forum über.
Generative KI in der industriellen Qualitätsprüfung: Erzeugung synthetischer Bilddaten Prof. Dr.-Ing. Marco Huber (Fraunhofer IPA, Universität Stuttgart)
Marco Huber präsentierte in seiner Keynote einen faszinierenden Rückblick auf die Entwicklung von den ersten Computern bis hin zur Künstlichen Intelligenz.
Er griff einen spannenden Fakt auf, dass der Ursprung von GenAI im Jahr 1948, als Claude Shannon in seinem Werk "A Mathematical Theory of Communication" erstmals von "n-Grammen" sprach.
Nach einer kurzen Einleitung in LLMs leitete Herr Huber zum Hauptthema seiner Keynote über: die Verwendung von GenAI in der industriellen Qualitätsprüfung. Er erläuterte, wie GenAI zur Bilderzeugung genutzt werden kann, um Beispiele von fehlerhaften Produkten in der Produktion zu vermehren, wobei er herausstellte, dass die Simulation von Kratzern besonders herausfordernd sei.
Als Lösung der Problems präsentierte er die vom Fraunhofer IPA entwickelten Defect Transfer GANs, welche auf die Generierung von Schadensbildern spezialisiert seien. Besonders interessant war die Erweiterung dieses Konzepts, bei der segmentierte Masken übergeben werden können, um noch präzisere Schadensbilder zu erzeugen. Hubers Keynote bot insgesamt einen spannenden Einblick in die neuesten Entwicklungen im Bereich der Künstliche Intelligenz, insbesondere in der automatisierten Bilderzeugung für industrielle Anwendungen.
OpenStreetMap – Optimierung des Glasfaserausbaus mittels OpenData Alexander Kleine (1&1 Versatel)
Alexander Kleine gab in seinem Vortrag einen umfassenden Überblick über die Nutzung von öffentlich verfügbaren GeoDaten insbesondere in Hinblick auf die Optimierung des Glasfaserausbaus. Er betonte die allgemeine Bekanntheit und Nutzung von Google Maps und lenkte dann das Interesse auf die wirtschaftlichen Möglichkeiten, die sich aus der Nutzung von OpenStreetMap ergeben können.
Besonders beeindruckt zeigte er sich von der Größe des OpenData-Datensatzes. Sein Vortrag bot einen fundierten Einblick in die Vor- und Nachteile der Nutzung von OpenStreetMap aus wirtschaftlicher Perspektive und regte zur weiteren Diskussion über die potenziellen Einsatzmöglichkeiten von OpenData an.
Anomaliedetektion im Finanzumfeld Intelligente Unterstützung in der Abrechnungsprüfung Dr. Stefanie Schwaar (Fraunhofer IWTM)
Stefanie Schwaar präsentierte in ihrem Vortrag drei exemplarische Projekte aus dem Bereich der Abrechnungsprüfung. Sie begann mit einem Projekt, welches föderiertes Training umfasste, um eine effiziente und datenschutzkonforme Nutzung von Informationen zu ermöglichen. Beim zweiten Projekt lag der Fokus auf der Entwicklung und Optimierung datengestützter Prozesse, wie zum Beispiel die automatische Zuordnung von E-Mails. Das dritte Projekt umfasste die Erstellung maßgeschneiderter interaktiver Analysedashboards, die auf individuelle Bedürfnisse der Kunden zugeschnitten werden können und fortschrittliche KI-Methoden integrieren. Zusammenfassend demonstrierte Stefanie Schwaar die vielfältigen Anwendungsmöglichkeiten von Datenanalysen und KI im Bereich der Abrechnungsprüfung.
Der Blick in die Black-Box Machine Learning und Erklärbarkeit im Zeitalter der Regulierung Christophe Krech (experian)
Christope Krech zeigte sehr anschaulich die praktischen Auswirkungen und Vorteile der Einführung von XAI-Methoden wie LIME und SHAP. Einen Blick in die "Black-Box" der KI Modelle zu werfen ist nicht nur für die Nutzer relevant, sondern auch für die Data Scientist um zum Beispiel Bias zu erkennen und somit zu verhindern, aber auch weil der Gesetzgeber es fordert. LIME versucht dabei nicht das gesamte und sehr komplexe Modell als Ganzes zu erklären, sondern eine einzelne Beobachtung. SHAP ist darauf aufbauend eine Kombination von LIME und Shapley Values. Shapley Values zeigen die Bedeutung einzelner Features oder Variablen bei der Vorhersage auf. Data Scientist profitieren von der Kombination SHAP mit XGBoost.
Effective Machine Learning made easy! Alexander Zender (Hochschule Darmstadt)
Alexander Zender behandelte in seinem Vortrag das Thema "ontologiebasiertes maschinelles Lernen". Dabei präsentierte er ein innovatives Tool für die Evaluation von Modellen diverser AutoML-Bibliotheken.
Das Tool ermögliche unter Anderem, Data Scientists zu unterstützen, indem es ihnen einen ersten Eindruck von geeigneten Modellen vermittele.
Besonders interessant war die Live-Demonstration des Tools während des Vortrags. Diese zeigte anschaulich die Funktionsweise und den Nutzen des Tools für Modellvergleiche. Insgesamt bot sein Vortrag einen aufschlussreichen Einblick in die Möglichkeiten von ontologiebasiertem maschinellem Lernen und die praktische Anwendung in der Modellbewertung.
Panel Discussion Prof. Dr. Marco Huber, Dr. Stefanie Schwaar, Christophe Krech
Die Panel Diskussion als persönliches Highlight fand mit einigen Speakern des Data Science Forums statt. Unter dem Thema "Zukunft der Data Science - Herausforderungen und Möglichkeiten" würde übergreifend das Thema generative AI und die damit verbundene Regulierung besprochen. Die Teilnehmer haben neben ihrem Fachwissen auch Bezug zu ihren Vorträgen eingebracht, sodass die Teilnehmer aktiv an der Panel Diskussion teilgenommen haben und dadurch ein sehr interessanter Austausch stattgefunden hat. Besonders das Thema AI Act wurde kontrovers, sachlich und fachlich diskutiert.