Prof. Dr. rer. nat. Gero Szepannek
Lehrangebot
- BMSIB2600 - Analytical Statistics
- DSKIM1010 - Explorative Datenanalyse und Visualisierung
- DSKIM1110 - Statistische Grundlagen von Machine Learning
- DSKIM1700 - Data Science / KI Projekt
- LTM8B1800 - Analytical Statistics
- LTMB3900 - Data Science in Tourism
- WINFB2300 - Statistik
- WINFB3400 - Data Science for Business
- WINFB3720 - Methoden der empirischen Forschung
Sprechstunde: Mittwochs 17.30 - 18.30 Uhr nach Voranmeldung
Bei Interesse an einem Abschlussarbeitsthema im Bereich Machine Learning / Data Science / Statistik können Studierende gerne per Email Kontakt mit mir aufnehmen.
- seit 2016: Professur für Statistik, Wirtschaftsmathematik und Machine Learning an der HOST
- 2009 - 2016: Head of Scoring & Rating Models (Santander Consumer Bank / Santander Consumer Group)
- 2008: Promotion an der TU Dortmund: "Mustererkennung zur Informationsextraktion aus simulierten Aktionspotenzialen des Hörnervs" (Zusammenarbeit mit Fraunhofer IDMT)
- 2004: Diplom in Statistik an der TU Dortmund: „Verfahren zur Klassifikation und Visualisierung vieler Klassen in hochdimensionalen Räumen“
- 2000/2001: Studium in Rennes (Frankreich) am ENSAI
Forschungsgebiete:
- Maschinelles Lernen
- Erklärbarkeit von Black Box Modellen
- Clusteranalyse bei gemischten Datentypen
- Fairness von Machine Learning Modellen
- Computational Statistics
- Sensometrie
- Kausale Inferenz
- Text Mining & Sentimentanalyse
Angewandte Forschung:
- Credit Scoring & IRBA
- Geschmacksdatenanalyse
- Data Literacy
- Customer Relationship Management
- Medizinische Diagnostik
- Spracherkennung & Music Information Retrieval
- Implementation of the k prototypes algorithm in R in the clustMixType package.
- Extension of the k-prototypes algorithm for clustering of large mixed-type data with ordinal variables.
- Cluster validation for mixed-type data.
- Paper on imputation strategies for mixed-type data.
- A general framework (TAX4CS) for the use of XAI in order to improve transparency and auditability of ML models in credit scoring.
- Paper on methodology (xgrove) to analyze complexity vs. appropriateness of an explanation.
- Development of an index to measure and quantify the fairness of credit scoring models.
- Hyperparameter Tuning with imbalanced classes.
- Paper on quantifying explainability of a ML models by partial dependence plots.
- mlr3shiny: state-of the art machine Learning without programming. Github repository.
- Overview on the Landscape of R Packages for Open Source Scorecard Modelling.
- Article introducing the mlr machine learning framework.
- German translation of a comic book on reponsible machine learning by P.Biecek, A.Kozak and A.Zawada.
- Interpretable Machine Learning has also been the focus theme of the AG DANK 2018 fall symposium (cf. below). The results of its satellite contest can be found here.
- Framework for transparency and auditability of ML models in credit scoring (TAX4CS).
- Development of an index to measure and quantify the fairness of credit scoring models.
- Overview on the Landscape of R Packages for Open Source Scorecard Modelling.
- Credit Scoring for imbalanced classes.
- Overview on the Landscape of R Packages for Open Source Scorecard Modelling.
- R package clustmixtype (k-Prototypes Clustering for Mixed Variable-Type Data).
- R package mlr3shiny (Graphical user interface for machine learning in R using mlr3).
- R package xgrove to analyze complexity vs. accuracy of an explanation.
- R package xPDPy (Computing the explainability of a ML model by partial dependence plots).
- R package for Heteroscedastic discriminant analysis using R.
- Book on Applications in Statistical Computing.
- Organization of stRalsund R user meetings (cf. below).
- German translation of a comic book on reponsible machine learning by P.Biecek, A.Kozak and A.Zawada.
- Why we should teach causal inference.
- Article on teaching machine learning.
- Enhancing data science learning through the use of images.
For a list of my publications cf.e.g.Google Scholar or ResearchGate.
Projekt im Rahmen der hochschulinternen Forschungsprojektförderung. Laufzeit: 1.1.2024 - 31.12.2024.
Die Hochschule Stralsund ist Bestandteil des Kompetenzzentrums für Digitalisierung: Mittelstand 4.0-Kompetenzzentrum Rostock, das im Rahmen der Förderinitiative Mittelstand 4.0 des Bundesministeriums für Wirtschaft und Energie im Jahr an den Start ging.
Unter der Konsortialführerschaft der IT-Initiative MV e.V. begleiten die Hochschule Stralsund, das Institut für Implantattechnologie und Biomaterialien e.V. (IIB e.V.), die Universitätsmedizin Rostock Versorgungsstrukturen GmbH und die Hochschule Neubrandenburg regionale mittelständische Unternehmen auf dem Weg in die Digitalisierung. Unternehmen aus den Bereichen Tourismus und Gesundheitswirtschaft stehen dabei im Vordergrund.
Im Fokus steht die Sensibilisierung für Chancen und Potentiale, die die Digitalisierung mit sich bringt. Neben der Sensibilisierung und Information wird das Kompetenzzentrum auch Schulungen anbieten, Workshops durchführen und die interessierten Unternehmen bei konkreten Umsetzungsprojekten begleiten. Anhand sogenannter Demonstratoren können sich Unternehmen im Vorfeld anschauen, wie Digitalisierung funktioniert. Im Fokus stehen hierbei insbesondere die Tourismusbranche sowie Data Science.
Das Stralsunder Teilprojekt DigiTOUR wurde in der ersten Förderphase durch Prof. Dr. Gero Szepannek vertreten, der von Prof. Dr. Michael Klotz, Prof. Dr. Björn Jacobsen, Prof. Dr. Jasminko Novak und Projekt-Mitarbeitenden sowie Studierenden begleitet wird. Das Projekt wird unter dem Förderkennzeichen 01MF17005E vom Bundesministerium für Wirtschaft und Energie unterstützt. Projektlaufzeit: 01.10.2017 - 30.09.2020
Umsetzung des WWM Algorithmus zur Identifikation einer Wechselwirkungsmatrix von Herb-drug interaktionen im Rahmen eines Unterauftrags des Kompetenznetzes Komplementärmedizin in der Onkologie (KOKON). Projektlaufzeit: 01.07.2019 - 31.08.2019.
Erstellung von deutschsprachigen Lehrmaterial zur Responsible Machine Learning. Kooperation mit der Scientific Foundation SmarterPoland.pl. Projektlaufzeit: 01.06.2022 – 31.10.2022.
Untersuchungsgegenstand des Projektes sind touristische Entwicklungsprojekte in Transformations- und Schwellenländern. Mit Hilfe von Instrumentarien des Text Mining sollen wahrgenommene Qualitätskriterien der Nutzer identifiziert und untersucht werden. Kooperation mit der HTW Berlin. Projektlaufzeit: 1.8.2019 - 31.7.2020.
Das Teilprojekt im Rahmen des Landesprogramms „Digitale Lehre“ in Mecklenburg-Vorpommern (Laufzeit: 1.5.2020 bis 31.12.2023) identifiziert für Dozierenden Möglichkeiten zur didaktischen Konzeption ergänzender digitaler Lehrangebote.
Auf dem Lernmanagementsystem Ilias der Hochschule Stralsund finden sich zahlreiche Informationen, Ideen, Anregungen und Handreichungen sowie die Möglichkeit zum Austausch der Lehrenden untereinander. Für alle Mitarbeitenden der HOST ist der Zugang zu den dort bereitgestellten Materialien möglich über den folgenden Link. Projektmitarbeitende sind Steve Sydow (Steve.Sydow@hochschule-stralsund.de) und Rabea Aschenbruck (Rabea.Aschenbruck@hochschule-stralsund.de).
Teilprojekt im Rahmen des Landesprogramms Digitale Lehre in Mecklenburg/Vorpommern (Laufzeit: 1.3.2020 bis 31.12.2023).
Analyse des Effektes von Hyperparametern tiefer neuronaler Netzwerke zur Tonhöhen- und Instrumentenklassifikation aus der simulierten Antwort des menschlichen Hörnervs.
Projekt im Rahmen der MINT-Mentoring - Nachwuchsförderung für Studierende in Vorbereitung auf eine Karriere in der Forschung.
Projektlaufzeit: 01.08.2022 – 31.12.2022.
- Produktevaluierung der Tourismusregion Waren/Müritz (01.01. - 31.12.2017)
- Erwartungshaltung von Gesundheitstourismusgästen am Beispiel der Region Rostock/Warnemünde (01.01. - 31.12.2018)
- Untersuchung des Einflusses von Hyperparametern tiefer neuronaler Netze (01.01. - 31.12.2019)
- Identifikation eines zweckmäßigen Umfangs der Anwendung von Maschinenintelligenz (01.01. - 31.12.2020)
- Modellierung der neuronalen Antwort zur Tonhöhenwahrnehmung von Menschen (01.01. - 31.12.2021)
- Entwicklung einer sensorischen Landkarte der Stralsunder Biersorten in kooperation mit der Störtebeker Braumanufaktur GmbH. Laufzeit (01.09.- 31.12.2023)
HanseYachts AG
MakerPort Stralsund
Mecklenburger Backstuben
Störtebeker Braumanufaktur
Strelapark
Tourismuszentrale Rostock & Warnemünde
Vogelpark Marlow
Waren (Müritz) Kur- und Tourismus GmbH
- Leiter Kompetenzzentrum AI & Machine Learning, Institute for Applied Computer Science (IACS)
- Leiter der Arbeitsgruppe Datenanalyse und Numerische Klassifikation (DANK)
- Gesellschaft für Klassifikation (GfKl)
- German Data Science Society (GDS)
- European Network for Business and Industrial Statistics (ENBIS)
- Arbeitsgruppe Statistical Literacy
- B.Sc. Emil Gallmeister
- B.Sc. Dominic Henning
- B.Sc. Anika Sick
- B.Sc. Jakob Steinbrink
- Einführung in Machine Learning ohne Programmierkenntnisse
- Responsible Machine Learning
- Credit Scoring mit R
- Programmieren in R und SAS
- Beratung in statistischen Fragestellungen
- Date: October 26th and 27th, 2018
- Location: Stralsund University of Applied Sciences, Building 21 ('Wirtschaft'), Room 326
- Focus Theme: Interpretable Machine Learning
- Registration: There is no conference fee. If you want to attend to the meeting or give a talk please write an email to gero.szepannek@hochschule-stralsund.de by October 15th, 2017. Note that talks are not restricted to the focus theme.
- Keynote: Mateusz Staniak (Warsaw University of Technology): DALEX: Descriptive mAchine Learning EXplanations. Tools for exploration, validation and explanation of complex machine learning models.
- Program
- Joint Dinner at Fritz Braugasthaus
- Hotel Recommendations:
- Hotel Rügenblick (Closest hotel to the campus, embrace hotel, +49 (0) 3831 3569 39-0, Please ask for Hochschule Stralsund special rates.)
- Hotel Hafenresidenz (Located in the city center directly at the border of the sea, +49 (0) 3831 2821 20, Please ask for special rates of faculty of economics at Hochschule Stralsund.)
- Younior Hotel (Hostel located close to the railway station, +49 (0) 800 60 60 880.)
- Public Transport:
- Some Destinations: Hiddensee, Kraniche, Fähren
- Data Analysis Competition:
- Competition 1: Predicting Ebay Prices
- Competition 2: Car Configuration Data
- Rabea Aschenbruck: „The k Prototypes Algorithm for Clustering Mixed-Type Data“
- Anna Denkowska, Stanisław Wanat: "Systemic Risk Modeling in the Insurance Sektor based on the Copula-DCC-GARCH-MST-DTW model"
- Grzegorz Korbela: "Modeling human mortality with the usage of macroeconomic factors"
- Krystian Szczęsny, Stanisław Wanat: "Risk Aggregation in Solvency Capital Requirement: Deep Neural Networks, C-vine Copulas in identifying marginal distributions and multidimensional copula"
- Gero Szepannek: „mlr3shiny – a Graphical User Interface for State of the Art Machine Learning”, „Measuring Fairness of Credit Scoring Models”
- Jan Wosnitza: „Calibration of PD Models and Quantification of their General Estimation Error (MoC C)”
Vorträge:
- Marta Nai Ruscone (Universita di Genova): Model based clustering with the packages mclust - teigen - mixsmsn
Vorträge:
- "Application of R in the analysis of the influence of macroeconomic policy on life expectancy", Anna Denkowska and Grzegorz Korbela (Cracow University of Economics),
- "dataquieR — Data Quality Assessments with R“, Stephan Struckmann (Uniklinikum Greifswald Greifswald).
Vorträge:
- "Deskriptive Datenanalysen im Tidyverse", Lars Koppers (Science Media Center, Köln)
- "mlr3shiny – State-of-the-Art Machine Learning Made Easy", Laurens Tetzlaff (Jheronimus Academy of Data Science, 's-Hertogenbosch, NL)
Vorträge:
- "As fast as it gets? Challenging R(cpp) with Julia", Philipp Wittenberg & Philipp Adämmer (Helmut Schmidt Universität Hamburg)
- "Pathway/Disease enrichment analysis using Bioconductor package", Neetika Nath (Institut für Bioinformatik, Universitätsmedizin Greifswald)
- "Schnittmengenvisualisierung mit ComplexUpSet - ein Anwendungsbeispiel in der Blutkulturdiagnostik", Marcus Vollmer (Institut für Bioinformatik, Universitätsmedizin Greifswald)
Vortrag:
- "Die perfekte Grafik mit R - base schlägt gg", Ulrike Grömping (BHT Berlin). Link zu den Folien.
Vorträge:
- "Einführung in Bayesverfahren mit R", Christian Röver (Universität Göttingen)
- "Ergebnisse Performance Coding Challenge", Mario Trouillier (Universität Greifswald), Download Challenge
Vorträge:
- "Circular visualization in R & having fun", Yvonne Gladbach (Universität Rostock)
- "Dimensionsreduktion... von PCA bis HDA -- Heteroskedastische Diskriminanzanalyse (und wofür sie gut ist)", Gero Szepannek (Hochschule Stralsund)
Prof. Dr. rer. nat.
Gero Szepannek
Statistik, Wirtschaftsmathematik und Machine Learning
Tel:
+49 3831 45 6672
Room:
322, Haus 21