Assoziationsregeln für Hochdimensionale Stammdaten

Es gibt mehrere Herangehensweisen für Assoziationsregeln in großen Datensätzen. Als typische Anwendungsgebiete gelten die Warenkorb-Analyse, medizinische Diagnostik, biomedizinische Literatur, Proteinsequenzen, Volkszählungsdaten, logistische Regression und Betrugserkennung. Es gibt allerding kaum bekannte Ansätze für Assoziationsregeln im Bereich der Stammdaten (engl. Master Data).

Stammdaten sind jedoch ein Schlüsselfaktor für Unternehmen heutzutage. Sie sind die einzige Quelle für Geschäftsobjekte im gesamten Unternehmen. Die Qualität der Stammdaten ist von entscheidender Bedeutung für die Organisationen, da Geschäftsentscheidungen von ihr abhängen. Deshalb ist mehr Einsatz erforderlich, um eine hohe Qualität der Stammdaten zu gewährleisten. Normalerweise nutzen Organisationen regelbasierte Ansätze, um Mängel in den Stammdaten zu ermitteln. Eine Definition dieser Regeln ist für Organisationen aber einerseits außerordentlich teuer, und andererseits eingeschränkt durch die Verfügbarkeit von Ressourcen mit entsprechender Fachkompetenz.

Das Ziel dieses Projekt war es, mittels vorgeschlagener Validierungsregeln zu bewerten, inwiefern die Anwendung von Ansätze wie denen der Assoziationsregeln den Experten für Stammdaten als mögliche Unterstützung dienen können. SAP hat zu diesem Zweck Daten innerhalb des SDILs zur Verfügung gestellt. Lesen Sie die Projektergebnisse unter: http://www.sdil.de/downloads/sdic-2016-konferenzband.pdf#page=48

Projektpartner

KIT, SAP

Ansprechpartner

Dr. Peter Neumayer, peter.neumayer@sap.com

Zeitraum

Jan 2016 – Aug 2016