Das Auffinden verborgener Muster und Trends in Unmengen von Datenbeständen erfordert enorme Rechenleistungen. Die Anstrengungen werden jedoch meist mit gänzlich neuen und oft gewinnbringenden Erkenntnissen belohnt.
Der explosionsartige Anstieg der Unternehmensdaten hat den Datenmanagern, deren Aufgabe es ist, die ständig wachsenden Informationsmengen sinnvoll zu verwalten, fast pausenloses Kopfzerbrechen bereitet. Angesichts des Drucks, erkennbare Werte aus diesen Daten zu gewinnen, haben viele von ihnen sich komplexen Data-Mining-Systemen zugewandt, die auf der Suche nach zuvor unbekannten Beziehungen riesige Informationsmengen mithilfe von übernatürlich intelligenten mathematischen Algorithmen durchsieben.
Data-Mining wurde bisher zwar als Möglichkeit zur Wertmaximierung jeder Art von Unternehmensdaten verkauft, seine Stammkunden beschränken sich jedoch bis jetzt größtenteils auf die höhere Wirtschaftsebene - Finanzdienstleister, große Einzelhandelsunternehmen, Telekommunikationsunternehmen und Regierungen bzw. Verwaltungen.
Finanzämter verwenden es zur Suche nach Diskrepanzen in den eingereichten Steuerformularen. Banken verwenden es zur Erkennung von Kreditkartenbetrug und für die Profilerstellung von Kunden, die mit gewisser Wahrscheinlichkeit Bankrott erklären oder ihre Kreditverbindlichkeiten nicht erfüllen könnten. Strafverfolgungsbehörden verwenden es zur Aufdeckung von Geldwäsche. Versicherungsunternehmen verwenden es zur Erkennung betrügerischer Ansprüche. Und Einzelhändler analysieren mithilfe von Data-Mining Verkaufstrends, um das Verbraucherverhalten systematisch zu beobachten und die Warenvorräte in den Lagern entsprechend anzupassen.
In einem sehr bekannt gewordenen Beispiel für die Macht dieser Technologie setzte die Australische Börsenaufsichtsbehörde (Securities and Investment Commission) NetMap ein, das Querverweise der Beziehungen zwischen den verschiedenen Daten in einem bestimmten Fall herstellt, und konnte damit 1996 einen von Simon Hannes (damals leitender Angestellter der Macquarie Bank) durchgeführten Insider-Handel aufdecken.
Die Technologie hat sogar beim italienischen Fußballclub AC Mailand einen Platz gefunden, der den CleverPath Predictive Analysis Server von Computer Associates einsetzt, um physiologische, orthopädische und mechanische Daten zu analysieren, die aus einer Vielzahl von Quellen gewonnen werden. Das System durchsucht die Daten, um Faktoren zu identifizieren, die in der Vergangenheit zur Verletzung eines Spielers geführt haben könnten, und setzt anschließend CAs Technologie ,Neugents' ein, mit deren Hilfe aktuelle Daten überwacht und Spezialisten beim Auftreten einer ähnlichen Situation gewarnt werden, die potenziell zur Verletzung eines Spielers führen könnte.Im Kern geht es beim Data-Mining um das Erschaffen nützlicher Informationen durch die Identifizierung zuvor unbekannter Beziehungen innerhalb eines gegebenen Datensatzes. Trotz seiner Nützlichkeit sind die praktischen Einschränkungen bezüglich der Akzeptanz des Data-Mining auf seine hohen Kosten (die Implementierungskosten belaufen sich oft auf siebenstellige Beträge) und die Komplexität zurückzuführen, welche sich ergibt, wenn man Anwendungen und Datenbanken in Tools integrieren muss, die nie unter dem Gesichtspunkt der Anwenderfreundlichkeit entwickelt wurden.
Dies hat zu einer frustrierenden Realität geführt: Zwar haben viele Unternehmen erfolgreich so genannte Data-Warehouses implementiert - riesige Datenbanken, die große Mengen an historischen Daten zur Analyse und Wiederverwendung enthalten -, doch waren die meisten nicht in der Lage, diese Daten für mehr als einfache Berichte zu verwenden, wie sie auch mit Hilfe einfacher Tools erstellt werden können. Und tatsächlich: während schon seit Jahren relativ ausgereifte Tools zur Business-Analyse zur Verfügung stehen, enthüllte eine kürzlich von Teradata unter 50 australischen Führungskräften durchgeführte Umfrage, dass fast die Hälfte von ihnen das Gefühl hat, nicht über ausreichend Informationen zu verfügen, um intelligente Geschäftsentscheidungen zu treffen.
Da sie immer auf der Suche nach neuen Wegen der optimalen Ausnutzung der gesammelten Daten sind, interessieren sich Unternehmen auch weiterhin für Data-Mining, um bislang unbekannte Dinge über ihre Geschäftstätigkeit zu erfahren. Die letzte von IDC durchgeführte Untersuchung des Marktes für Business-Intelligence-Lösungen (BI) - eine Kategorie, in die auch Data-Mining, Executive Reporting und andere Werkzeuge zur Datenanalyse fallen - sagte voraus, dass der asiatisch-pazifische Markt bis zum Jahr 2006 um jährlich 23 Prozent auf 3,3 Mrd. US-Dollar anwachsen werde. In einem anderen Bericht prognostozierte die Aberdeen Group, der weltweite Markt für solche Analyse-Tools werde von 4 Mrd. US-Dollar im Jahr 2001 bis 2005 auf 11 Mrd. US-Dollar ansteigen.
Ein Großteil dieses Wachstums wird dadurch verursacht werden, dass man Data-Mining einsetzt, um die in Unternehmens-Data-Warehouses vorhandenen Daten in bessere Übersichten über das Kundenverhalten zu verwandeln - was die Geschäftsstrategien wiederum grundlegend verändern könnte.Natürlich wollen Unternehmen mehr über ihre Betriebsabläufe und ihre bestmöglichen Erfolgschancen erfahren. Die Darstellung von IDC ist daher doppelt interessant, denn sie bestätigt, dass BI trotz des derzeitigen Sinkens der Gesamtausgaben für IT einer der wenigen Bereiche ist, der sich eines positiven Wachstums erfreuen kann. Trotz seiner Kosten ist Data-Mining anscheinend vor der Rezession gefeit: Sein Wertschöpfungsansatz macht Data-Mining zu einem entscheidenden Verbündeten bei der Identifizierung und beim Setzen strategischer Prioritäten, die einem von wirtschaftlich schwierigen Zeiten hart getroffenen Unternehmen die Kehrtwende ermöglichen können.
In einer Studie über den Geschäftswert von Business-Analytics fand IDC kürzlich heraus, dass die erfolgreiche Einführung und Verwendung von Analytics bei nordamerikanischen und europäischen Unternehmen Kapitalrenditen (ROI) zwischen 17 und 2000 Prozent erbrachte, wobei der durchschnittliche ROI bei 112 Prozent lag. Mehr als die Hälfte der Unternehmen hatte einen ROI von 101 Prozent oder mehr, und ein ganzes Fünftel der Befragten erfuhr einen ROI von 1000 Prozent oder darüber. Insgesamt belief sich der durchschnittliche Amortisationszeitraum auf 1,6 Jahre, und die Projekte waren im Mittel 4,5 Mio. US-Dollar wert. Gemeinsam mit anderen Veränderungen der Geschäftsabläufe wie z.B. CRM eingesetzt, lieferte Analytics einen durchschnittlichen ROI von 55 Prozent.
Diese Zahlen präsentieren ein überzeugendes Argument für Business Analytics, und Data-Mining macht einen bedeutenden Teil davon aus. Es ist möglich, zu diesem Zweck ein recht überzeugendes Geschäftsmodell um die Einführung solcher Technologien herum zu konstruieren, bei der es sich sowohl um eine lohnende Investition in neue Umgebungen handelt als auch um einen großen Schritt nach vorn für Unternehmen, die in der Vergangenheit größere Investitionen in Data-Warehouses getätigt haben. Wie die Zahlen von IDC zeigen, werden die möglichen Renditen tatsächlich nur von der Vorstellungskraft beschränkt.In der Vergangenheit wurde der Data-Mining-Markt von proprietären Produkten bestimmt, die auf Enterprise-Data-Warehouses aufgesetzt wurden oder die Erweiterungen dieser Warehouses selbst waren. Data-Mining wurde als eigenständige Aktivität angesehen, in der ein fähiger Analyst komplexe Suchparameter definierte und die Tools dann in das Data-Warehouse einspeiste und auf Ergebnisse wartete.
Trafen die Ergebnisse dann ein, waren sie für gewöhnlich nutzbringend: Sie zeigten, dass sich zwei oder mehr Produkte gut zusammen verkaufen ließen oder dass ein bestimmter Kundentyp im vergangen Monat mehr Ansprüche auf Fundsachen anmeldete. Egal um was für Daten es sich handelte, der größte Mangel des Data-Mining bestand darin, dass es eine gewisse Zeit dauern konnte, bis sich die Geschäftspraktiken auf die erkannten Beziehungen eingestellt hatten.
Dieses Problem war häufig das Ergebnis der architektonischen und technischen Schwierigkeiten, die das Data-Mining mit sich brachte. Deshalb wurde OLAP geboren (OnLine Analytical Processing), eine Werkzeugkategorie, die es Analysten ermöglicht, mehrere Dimensionen aus einem größeren Datensatz zu ziehen und anschließend die Beziehungen zwischen diesen Sätzen zu untersuchen. In den Jahren seit seiner Einführung hat OLAP als Weg zur Auffindung von Mustern in großen Datenmengen eine ständig wachsende Anhängerschaft gewonnen. Dennoch wird auch OLAP nur vom Menschen gesteuert und erkennt nur die Muster, die es auch erkennen soll. Außerdem ist OLAP von Natur aus sehr beschränkt, denn seine Funktionsweise basiert auf dem Ignorieren vieler anderer Datensätze.
Beim Data-Mining im eigentlichen Sinne geht es darum, eine Methodologie zur Datenanalyse einzuführen, die als Obermenge für die beschränkten Möglichkeiten von OLAP dienen kann. Jedoch hat sich dies in der Vergangenheit als schwierig erwiesen, allein schon aufgrund der riesigen Datenmengen und der damit verbundenen Zeit, die zur Verarbeitung dieser Daten benötigt wird.Nachdem sie erkannt haben, dass die Verbesserung dieser Situation eine bedeutende Möglichkeit zur Produktdifferenzierung darstellt, sind viele Hersteller von Datenbanken und Enterprise-Anwendungen in letzter Zeit dazu übergegangen, den Nutzen des Data-Mining zu vergrößern, indem sie es als Echtzeit-Funktion positionieren, die in Business-Informationssysteme integriert ist.
"Wir haben DB2 mit Data-Mining-Algorithmen ausgestattet, um Dinge wie Echtzeit-Segmentierung beim Eintreffen von Transaktionen möglich zu machen", so Janet Perna, weltweite General-Managerin für Data-Management bei IBM. "Das große Problem mit der Data-Mining-Technologie war, dass bisher allgemein angenommen wurde, man brauche einen Doktortitel, um die Technologie verwenden zu können. Diese Technologien entwickeln sich jedoch zu einem Bestandteil der Dateninfrastruktur, und in dem Maße, in dem mehr und mehr Fähigkeiten in die Data-Engine integriert werden, werden sie sich immer mehr zu Mainstream-Anwendungen entwickeln."
Zu diesem Zweck hat IBM seinen DB2 OLAP Server kürzlich um eine Menge an Data-Mining-Funktionen ergänzt und bietet zusätzliche Funktionen über seinen DB2 Intelligent Miner an, der in Echtzeit Ergebnisse aus DB2-Daten und PMML-Daten (Predictive Model Markup Language) zusammenträgt. PMML ist eine XML-basierte Markup-Sprache, die bereits in der Version 2.1 vorliegt und in einer Vielzahl von Data-Mining- und Enterprise-Anwendungen unterstützt wird. Diese Sprache beschreibt Eingaben in Data-Mining-Modelle, die Transformationen, die zur Vorbereitung von Daten für das Data-Mining verwendet werden, und die Parameter, welche die Data-Mining-Modelle definieren.
Microsoft für seinen Teil plant Yukon, das nächste größere Release von SQL Server, um sieben zusätzliche Data-Mining-Algorithmen zu ergänzen. SQL Server verfügt bereits seit seiner 2000er Version über OLAP-Fähigkeiten und Unterstützung für Clustering und "Entscheidungsbaum"-Data-Mining-Algorithmen.
Terry Clancy, Microsofts Marketing-Manager für Data-Access-Produkte, räumt ein, dass die Konzentration des Unternehmens auf OLAP seine Markenstärke im Data-Mining-Bereich geschwächt hat. Mit dem Erscheinen von Yukon plant Microsoft allerdings, diese Situation mit neuen Partnern und neuer Marketing-Strategie zu verbessern und den Data-Mining-Markt insgesamt anzusprechen. Damit steht das Unternehmen jedoch nicht allein: SAP, Peoplesoft, i2 und weitere Hersteller von Enterprise-Anwendungen ergänzen ihre Kernanwendungen momentan um Analytics-Funktionen zum Ausbau von deren Fähigkeit, Daten bereits während der Entstehung zu verarbeiten.Da es so datenintensiv ist, erfordert Echtzeit-Data-Mining beträchtliche Hardware-Investitionen, um Analytics neben der Verarbeitung der alltäglichen Transaktionen ausführen zu können, die für den Betrieb eines Unternehmens erforderlich sind. Alle Betriebssysteme und Datenbankkombinationen haben von der kontinuierlichen Beschleunigung der Server-Prozessorgeschwindigkeiten profitiert, aufgrund der Echtzeit-Data-Mining erst möglich wurde.
Oracle ist dieses Problem mit der Förderung seiner Oracle-on-Linux-Plattform für Data-Mining angegangen, vor allem aufgrund der anerkannten Skalierbarkeit und Robustheit der Linux-Plattform und Oracles eigener Clustering-Technologie RAC (Real Application Clusters).
"Sie kann [...] auf Clustern von Linux-Servern eingesetzt werden, was Enterprise-Datenmanagement ermöglicht - jedoch mit hoher Zuverlässigkeit", so Roland Slee, Direktor für Business- und Technologielösungen bei Oracle Australia. "Wir haben Kunden, die Datenbanken auf Intel-basierten Servern mit sehr hohen Taktgeschwindigkeiten einsetzen. Dank der Unterstützung für transparentes Clustering erhält man Skalierbarkeit und Erschwinglichkeit und kann von den Data-Mining-Funktionen profitieren. Nach Oracles Erfahrung sind diese [Computing-]Zyklen bei Verwendung von Linux-Clustern preiswerter und leistungsfähiger als in jeder anderen Umgebung."
Dies ist jedoch nur eine Perspektive. In dem Maße, in dem sowohl RISC- als auch Intel-Prozessoren immer weiter die Exponentialkurve von Moores Law nach oben klettern, werden die Server, die für das Funktionieren von Echtzeit-Data-Mining nötig sind, schnell im Preis fallen. Das bedeutet, dass Data-Mining heute preiswerter ist und einer breiteren Menge von Unternehmen als je zuvor zur Verfügung steht.Jetzt, da Echtzeit-Data-Mining eine praktische Realität wird, ist es an der Zeit, sich zu überlegen, wie es existierende Geschäftsprozesse verbessern könnte. Anstatt Unternehmen zu zwingen, regelmäßig Berichte über die Vorlieben ihrer Kunden zu erstellen, ermöglicht es Echtzeit-Data-Mining beispielsweise einer Call-Center-Anwendung, das Data-Warehouse abzufragen, sobald ein Kunde anruft. Dieser Entscheidungsbaum-Ansatz erlaubt es dem System des Call-Center-Agents, die auf dem Bildschirm ausgegebenen Aufforderungen anzupassen und das Gespräch zu einem positiveren und gewinnträchtigeren Abschluss zu bringen.
Man bedenke zum Beispiel den Fall eines Mobilfunkunternehmens, das ständig darum kämpft, seine Kunden in einer Umgebung hoher Abwanderung, starken Wettbewerbs und sehr niedriger Kundentoleranz zu behalten. Ein Kunde hat beispielsweise in der Vergangenheit schon mehrfach beim Kundendienst angerufen und sich über schlechten Empfang beschwert und ruft nun erneut an.
Mit Hilfe konventioneller Methoden dürfte es dem Call-Center-Mitarbeiter schwer fallen, viel über die Kontakte zu erfahren, die der Kunde in der Vergangenheit mit dem Unternehmen hatte - es sei denn, sie hatten bereits persönlich eine hitzige Diskussion. Dadurch sind sich beide Seiten nicht über die Falle bewusst, in die sie tappen können, wodurch wiederum die Möglichkeit einer Konfrontation entsteht.
Arbeitet während des Gesprächs eine Data-Mining-Engine im Hintergrund, könnte diese nicht nur bemerken, dass sich der Anrufer bereits mehrfach beschwert hat und daher mit Samthandschuhen angefasst werden sollte, sondern auch, dass der Anrufer in die demografische Gruppe jener Leute passt, die sich in der Vergangenheit als wechselwillig erwiesen haben. Weil er erkennt, dass der Kunde wahrscheinlich kündigen wird, wenn sich der Service nicht bessert, könnte der Call-Center-Mitarbeiter ihm Besänftiger wie kostenlose Gesprächsminuten, Vor-Ort-Austausch oder ein Upgrade des Handys anbieten, wenn er oder sie den bestehenden Vertrag erneuert oder verlängert.Diese Art des Verkaufs ist unmöglich ohne eine Chance, jene bedeutenden Gelegenheiten zu identifizieren, die sich nur in dem Zeitraum ergeben, in dem ein Unternehmen im direkten Kontakt mit seinen Kunden steht. Da diese Kontaktmomente sich höchstwahrscheinlich aus Telefongesprächen im Zusammenhang mit Rechnungs- oder Serviceproblemen ergeben, kommt dem Echtzeit-Data-Mining ein unschätzbarer Wert bei der Beurteilung einer Verkaufsgelegenheit zu, die sich vielleicht nie wieder ergibt.
"Das Data-Mining-Modell ist in der Lage, Beziehungen anhand eines feinkörnigeren Rasters zu untersuchen und mehr unübliche Kombinationen zu entdecken, die der menschliche Verstand nicht abdecken könnte", so Richard Lees, leitender Consultant bei Microsoft Australia.
"Dies waren häufig Anwendungen für die Unternehmensleitung, für die ein Team [von Technikern] eine Datenmine erstellte, um mehr über die Kunden zu erfahren. Aber Techniker neigen dazu, nach Dingen zu suchen, über die sie noch nichts wissen, und wenn diese Dinge für die Organisation nicht von Nutzen sind, dann bringen sie niemandem etwas. Wir können nun Tools für die Mitarbeiter vor Ort schaffen, mit denen diese vom Data-Mining profitieren können - und zwar ohne es zu merken."
In einer Art Eingeständnis, dass die Verwendung früherer Data-Mining-Tools für viele Kunden zu geheimnisvoll und esoterisch war, arbeiten viele Hersteller daran, ihre Anwendungen in Bundles für spezifische Zwecke zu integrieren. SPSS, das eine Reihe wichtiger Großbanken und Telekommunikationsunternehmen zu seinem Kundenstamm rechnet, entschied sich für diesen Ansatz und startete kürzlich SPSS Predictive Marketing, das bewährte Marketingprozeduren um Data-Mining-Techniken ergänzt. Mithilfe einer üblichen Webbrowser-Oberfläche können die Anwender historische Trends aufrufen und Was-wäre-wenn-Modelle untersuchen. Die Ergebnisse werden so aufbereitet, dass auch mathematisch nicht begabte Mitarbeiter etwas damit anfangen und entsprechend handeln können.
Praktisch jeder Data-Warehouse-Hersteller bringt momentan ähnliche Angebote auf den Markt. Teradata, dessen Anwenderstamm hauptsächlich aus dem Bereich Transaktionsverarbeitungssysteme für große Volumen stammt, brachte kürzlich ein Analysesystem heraus, das sich an Finanzdienstleistungsunternehmen wendet. SAS Institute folgte mit einer auf Data-Mining basierenden Anwendung für Kreditvergabekriterien (Credit-Scoring), die bereits in verschiedenen Organisationen, darunter auch der ANZ Bank, im Einsatz ist.
SPSS bietet zudem Text Mining for Clementine an - ein Lösungsansatz für das nur allzu reale Problem des Extrahierens von unstrukturierten Daten wie zum Beispiel Kommentare, die von den Call-Center-Mitarbeitern in Kundenakten eingetragen werden. Während OLAP-Cubes gut für die Verarbeitung großer Mengen numerischer Daten geeignet sind, haben sie bei der textlichen Analyse erhebliche Mängel, denn unstrukturierter Inhalt lässt sich nicht einfach für die Verarbeitung durch eine OLAP-Engine kategorisieren. An dieser Stelle erhalten Text-Mining-Engines, die von einer Reihe großer Hersteller als Standalone-Produkt angeboten werden, ihre Daseinsberechtigung.Die wachsende Profilierung der Funktionen von Data-Mining-Lösungen hat einen weiteren vorteilhaften Effekt: Sie hat dazu geführt, dass sich Entwicklungs-Kits leichter in eigenständig funktionsfähigen Einheiten bündeln lassen. Nachdem die Hersteller die Verfügbarkeit von Data-Mining-Lösungen verbessert haben, ermöglichen die neuesten Toolkit-Revisionen (viele davon auf der Grundlage von Java) es Enterprise-Entwicklern, die Data-Mining-Funktionen der verschiedenen Plattformen leicht in unternehmenseigene Anwendungen zu integrieren. Diese Flexibilität stellt im Vergleich mit den esoterischen und komplexen Oberflächen früherer Systeme eine bedeutende Verbesserung dar. Dieser Wandel sollte die Entwicklung von Analytics-Portalen erleichtern, welche die Bedürfnisse spezifischer Anwender-Communities innerhalb des Unternehmens bedienen. Anstatt als komplexe Anwendungen zu existieren, die nur von einigen wenigen technischen Analysten verwendet werden, kann die Integration von Analytics in ein Allzweck-Portal dazu beitragen, dass leistungsfähige Analyse-Tools für mehr Mitarbeiter als je zuvor zur Verfügung stehen.
Eins bleibt zu bedenken: Auch wenn die Mitarbeiter zweifelsohne von den besseren Informationen profitieren werden, können sie auch daran ersticken, wenn sie zuviel davon bekommen. "Die Oberfläche ist ganz einfach, wir müssen aber das richtige Maß an Informationen festlegen, dem die Anwender ausgesetzt sein sollen", so Colin Shearer, Vizepräsident für Analytics bei SPSS. "Sie wollen keine detaillierten Statistiken über die Akkuratheit des Vorhersagemodells sehen, sondern Dinge, die sie sofort und innerhalb ihrer eigenen Wissensbereiche interpretieren können."
Damit dies möglich wird, ist natürlich eine enge Zusammenarbeit zwischen Technikern und den Geschäftseinheiten vonnöten, so dass die entwickelten Anwendungen die Eigenheiten des Geschäfts eines jeden Unternehmens widerspiegeln können. Auch die Entwicklung konsistenter Geschäftsrichtlinien ist wichtig, damit nicht alles dem Zufall überlassen wird: Richtlinien, die mit Systemen wie Business Rules Engine von CA CleverPath durchgesetzt werden, gewährleisten konsistente Resultate und ermöglichen Überprüfungen, falls Fragen über die Mechanismen auftauchen sollten, mit deren Hilfe die Zahlen zusammengestellt werden.
"Die Art und Weise, wie Data-Mining-Technologie verkörpert wird, verändert sich momentan ziemlich drastisch", so Slee von Oracle. "Es handelt sich nicht mehr um eine Aktivität für Spezialisten, die nur von einer kleinen Zahl von Anwendern anhand einer Untermenge von Daten durchgeführt wird. Data-Mining kann nun eine Mainstram-Anwendung werden, die zusammen mit anderen Mainstream-Anwendungen von sämtlichen Anwendern benutzbar ist."Trotz aller Vorteile birgt die Implementierung von Data-Mining auch ein nicht zu vernachlässigendes Risiko. Dieses Risiko liegt nicht so sehr in den Lösungen selbst, sondern in der Tatsache, dass der richtige Einsatz der Technologie ein Gebot ohne Alternative ist. Befinden sich nicht sämtliche Daten am richtigen Ort (und auch in der richtigen Reihenfolge), wird selbst der intelligenteste Data-Mining-Algorithmus Fehlinformationen hervorbringen, welche die resultierenden Erkenntnisse verfälschen.
Führen Probleme bei der Dateneingabe beispielsweise dazu, dass die Nachnamen eines Kunden falsch oder auf mehrere Weisen geschrieben sind, wird jede Analyse der Kundendaten diesen Kunden als einen anderen Menschen mit jeweils anderen Kaufgewohnheiten behandeln. Desmond McGillevray kauft dann vielleicht gern Pringles-Kartoffelchips in dem Geschäft in Hurstville, während Desmond MacGillevray jede Menge Zahnpasta in Kogarah einkauft und Desmond McGillevry wiederum öfters Doritos in Rockdale kauft.
Natürlich wird man nicht bei jedem Lebensmitteleinkauf den Namen des Kunden notieren, aber dies ist nur ein praktisches Beispiel. Der Punkt ist der gleiche: Gibt man diese Daten in ein Data-Mining-System ein, wird dieses etwas anderes ausgeben, als wenn man ein Langzeitprofil der allgemeinen Kaufgewohnheiten von Desmond MacGillevry erstellt hätte. Überträgt man diese Art von Problem auf Hunderttausende von Kunden, kann man leicht erkennen, warum viele Unternehmen Data-Mining nicht als ein eigenständiges Projekt, sondern eher als ein Ziel betrachtet haben, das nach sorgfältiger Pflege und Verbesserung der Daten erreicht werden sollte.
Die Fähigkeit, diese Einkäufe zueinander in Verbindung zu setzen, ist Grund genug, ein Treueprogramm einzuführen, bei dem jeder Kunde eindeutig identifiziert werden kann. Das verringert wiederum das Risiko von Dateneingabefehlern und zentriert späteren Kundendienst und Marketing um einen einzigen historischen Eintrag.In vielen Fällen verschlimmern sich die Probleme mit der Datenkonsistenz, wenn Data-Mining-Tools auf Daten angewandt werden, die aus verschiedenen Enterprise-Systemen zusammengetragen wurden, zum Beispiel aus den Datenbanken für den Vertrieb, das Treueprogramm, den Kundendienst oder das Marketing. Wurde im Vorfeld nicht ausreichend an der Konsistenz der Daten gearbeitet, besteht die Wahrscheinlichkeit, dass jede dieser Datenbanken viele Kunden im Data-Warehouse auf verschiedene Weisen darstellt.
Gibt man diese Daten nun in ein Data-Mining-System ein, verfügt man über alle Zutaten für ein Informationsdesaster. Die Arbeit mit falschen Daten in dem Glauben, korrekte Daten vor sich zu haben, kann Probleme eher noch verschlimmern. Die Lösung für dieses Problem liegt in der sorgfältigen Kontrolle der Daten (automatische Werkzeuge können diesen Prozess erleichtern) und der Verbesserung der Dateneingabeprozeduren mit vereinten Kräften, um problematische Daten dauerhaft zu reparieren.
Indem sie großen Anwendergemeinschaften komplexe Analysetechniken zugänglich machten, haben die heutigen Data-Mining-Plattformen viele Schranken niedergerissen, die in der Vergangenheit ihrer Akzeptanz im Weg standen. Angesichts des erwiesenen Nutzens, den Organisationen bereits in der Vergangenheit mit Data-Mining erzielen konnten, hat das Ausspielen der Benutzerfreundlichkeitskarte ein klares und überzeugendes Geschäftsmodell geschaffen, das, mit nur ein wenig Vorstellungskraft, in der Lage sein kann, weitaus relevantere, datenfähigere Anwendungen als je zuvor anzubieten.OneSteel, der kürzlich veräußerte Geschäftsbereich zur Stahlherstellung von BHP Billiton, verwaltet außerordentlich komplexe Lieferketten, die sich aus der Koordinierung von Rohmaterialien, regionsübergreifender Logistik, Prozessfertigung und Marketing in einem überaus wettbewerbsintensiven globalen Markt ergeben.
Angesichts der Informationsmenge, die seine fast 600 Knowledge-Worker verarbeiten müssen, waren Unternehmensanalysten lange Zeit ein alltäglicher Bestandteil des 3 Mrd. Dollar schweren Unternehmens OneSteel, bei dem die meisten Analytics-Anwendungen von Cognos auf die eine oder andere Weise im Einsatz sind. Data-Mining gehört zu den neueren dieser Werkzeuge und hat zu der erfreulichen Erkenntnis geführt, dass Daten für weit mehr als nur das Füllen von Transaktionsdatenbanken verwendet werden können.
Diese Erkenntnis ergab sich, als IT- und Business-Mitarbeiter gemeinsam die interessantesten Details aus den täglich generierten Datenbergen herauszuziehen begannen. Etwa einmal täglich extrahieren Werkzeuge neue Daten über Herstellung, Vertrieb und andere Geschäftsbereiche aus JD Edwards, BPCS und anderen Systemen von OneSteel. Diese Daten werden anschließend in eine Reihe dedizierter Data-Marts geladen, die auf Microsoft SQL Server laufen (was demnächst ausgetauscht werden wird, wenn OneSteel die derzeitige Migration von SAP auf Oracle abschließt) - und dann Mitarbeitern verfügbar gemacht, die eine Vielzahl verschiedener Analysetools einsetzen.
Dieser Ansatz stellt sicher, dass die Daten stets aktuell sind. Es war jedoch eine beträchtlichen Anstrengung im Bereich Datenkonsistenz erforderlich, um so weit zu kommen, sagt Will Rigby-Jones, Manager des Knowledge-Systems von OneSteel, zu dessen Aufgabe es gehört, neue Verwendungsmöglichkeiten der Datenanalyse aufzufinden, mit denen die Manager den Geschäftserfolg steigern können.
"Die Verwendung von Data-Mining auf die geplante Art und Weise erfordert einen genuinen Bedarf des Unternehmens sowie qualitativ gute Daten, die auf korrekte Weise gewonnen und dann auf korrekte Weise zugeteilt und präsentiert werden", so Rigby-Jones weiter. "Nichts ist katastrophaler als ein Bericht, der eine Sache sagt, und [ein anderer], der etwas völlig Anderes sagt."Der Übergang von Berichten, die sich aus Hunderten von Seiten 132-spaltigen Endlospapiers zusammensetzten - was jahrelang für Manager die einzige Möglichkeit war, an Unternehmensinformationen heranzukommen -, hin zu Onscreen-Analytics erforderte ein sorgfältiges Eingehen auf die Bedürfnisse der Anwender, erklärt Rigby-Jones. Die Manager konnten sich natürlich schnell mit der neuen Fähigkeit anfreunden, Berichte, deren Zusammenstellung früher Tage in Anspruch genommen hätte, in nur wenigen Sekunden zu verfassen.
Je nach Größe des Unternehmens kann Data-Mining aber auch zu einer Datenschwemme führen und erhält damit ein uraltes Problem am Leben. Zur Vermeidung dieses Problems hat das OneSteel-Team beträchtliche Mühen aufgewandt, um Benutzeroberflächen einzurichten, die leichten Zugriff auf die für jede Anwendergruppe wichtigsten Informationen ermöglichen.
Ampelähnliche Anzeigen, die mit Cognos Metrics Manager erstellt wurden und mit Daten aus proaktivem Data-Mining und OLAP-Analysen versorgt werden, ermöglichen es Managern, leicht die Messergebnisse ausfindig zu machen, auf die näher eingegangen werden sollte, und sich dann bei Bedarf weitere Einzelheiten anzeigen zu lassen. Außerdem teilt die wachsende Verwendung Web-basierter Oberflächen Rigby-Jones mit, dass höhere Führungskräfte in steigendem Maße den Wert der Data-Mining-Umgebung erkennen.
Die Fähigkeit, wichtige Multi-Faktor-Trends ausfindig zu machen und Unternehmensdaten fast in Echtzeit bis ins kleinste Detail zu analysieren, hat die Kompetenz der Mitarbeiter bei der Verwendung von Informationen erhöht. In einem größeren Zusammenhang hat dies auch die Management-Philosophie revolutioniert, indem anschaulich geworden ist, dass selbst mehrere kleinere Geschäftsveränderungen sich zu einer bedeutsamen Geschäftsverbesserung auswachsen können. Mit den richtigen Werkzeugen, mit denen sich die relativen Verdienste solcher Veränderungen nun abwägen lassen, weiß OneSteel jetzt mehr über sein Geschäft als je zuvor.
"In der Vergangenheit ging es beim Geldverdienen nur darum, mit den geringsten Kosten den höchsten Preis zu erzielen", so Rigby-Jones. "Aber tatsächlich ist es viel mehr. Wir könnten herausfinden, dass wenn man die Buchungsrate um x Prozent erhöht, die Überstunden verringert, x Prozent an Frachtkosten einspart - dass alles zusammen ausreichen könnte, um den Gewinn im großen Stil zu beeinflussen. Versucht man aber, nur eine dieser Maßnahmen durchzuführen, ist man zum Scheitern verurteilt. Die Beziehungen sind ausschlaggebend: das Geschäft ist der Puppenspieler, und wir geben ihm die Fäden zum Ziehen."Echtzeit-Data-Mining verbessert sowohl den Zugang der Anwendergemeinschaft zu der Technologie als auch die Rolle, die das Data-Mining innerhalb alltäglicher Geschäftsabläufe spielen kann, ganz beträchtlich. An dieser Stelle geben wir einige Tipps, wie man das Beste aus seinen Daten herausholen kann:
Die Hardware. Data-Mining ist extrem rechenintensiv, vor allem, wenn es wie in einer Echtzeit-Umgebung kontinuierlich im Hintergrund ausgeführt wird. Geclusterte Server bieten die für Echtzeit nötige Skalierbarkeit, ohne die allgemeine Leistungsfähigkeit zu beeinträchtigen.
Daten bereinigen. Business-Analytics können nicht effektiv eingesetzt werden, wenn die Daten nicht sauber und konsistent sind. Trotzdem ist es vielen Unternehmen bisher nicht gelungen, die chronischen Diskrepanzen zwischen den Daten in verschiedenen Datenbanktypen zu beseitigen. Bevor man sich auf Data-Mining einlässt, sollte man seine Daten unter Kontrolle bekommen und herausfinden, wie man diesen Zustand dauerhaft beibehält. Dies erfordert in der Regel passende Systeme, jedoch ebenso auch Training für die Mitarbeiter.
Der Cube ist nicht alles. OLAP ist zwar gut für die Verarbeitung von Zahlen geeignet, es ist jedoch von Natur aus beschränkt, denn es schließt viele Informationsarten von vornherein aus. OLAP-Data-Marts lassen sich für Anwender verwenden, die konsistente, regelmäßige Berichte erstellen müssen. Wenn es jedoch um das Aufspüren neuer Trends geht, muss man den ganzen Datensatz von Data-Mining-Tools durchsuchen lassen.
Kunden respektieren kompetente Mitarbeiter. Aber sie sind auch schnell weg, wenn die Mitarbeiter nicht über die richtigen Daten zur schnellen Lösung ihrer Probleme verfügen. Echtzeit-Analytics kann ein wichtiges Werkzeug für die Verbesserung des Kundendiensts darstellen, denn damit erhalten die Kundendienstmitarbeiter genau die Informationen, die sie brauchen. Auf diese Weise können sie dann informierte Entscheidungen treffen, wenn es wichtig ist, und nicht erst später, nachdem das Gespräch längst beendet wurde.
Was zählt, liegt nicht in den Daten. Es liegt in der Art, wie man die Daten verwendet. Die Einführung von Data-Mining ist nur ein Teil der Herausforderung. Der wahre Wert der Analyse liegt in der Fähigkeit, diese Informationen auch in wirksame Geschäftsentscheidungen zu verwandeln. Man muss sicherstellen, dass die Manager sich daran gewöhnen, Data-Mining zum Aufspüren neuer und interessanter Muster in den Unternehmensdatenbanken einzusetzen.
Text ist nicht gleich Daten. Kommentare der Kunden können zu hastig eingetippten Notizen der Call-Center-Mitarbeiter werden, sie sind jedoch äußerst hilfreich, um die Meinungen der Kunden herauszufinden. Zahlen sind zwar für gewöhnlich in gut strukturierten Datenbanken enthalten, textliche Informationen werden jedoch nur selten so gut geordnet. Daher ist es schwierig, solche Informationen mit konventionellen Data-Mining-Tools zu analysieren. Will man Trends aus Textinformationen herausfiltern, benötigt man Text-Mining-Tools, die das übliche Data-Mining ergänzen.
Data-Mining ist eine Funktion. Es ist zwar in der Vergangenheit vor allem von Standalone-Produkten bereitgestellt worden, die Hersteller von Enterprise-Anwendungen bauen Data-Mining jedoch immer häufiger in ihre Datenbanken und Anwendungen ein. Dieser Ansatz könnte besonders wirksam sein, denn er ermöglicht es Data-Mining-Umgebungen, die Stärke der zugrunde liegenden Datenbank oder Anwendung auszunutzen und der Wachstumskurve dieser Anwendungen zu folgen, indem sie Fähigkeiten wie integrierte Clustering-Unterstützung einsetzen.
Daten auf intelligente Weise weitergeben. Der Einsatz von Data-Mining zur Erkennung neuer Muster in den Daten ist eine Sache, wird jedoch noch effektiver, wenn man relevante Teile dieser Daten an seine Lieferanten weitergeben kann. Wurde etwa herausgefunden, dass die Kunden besonders viel Cola kaufen, wenn sie gemeinsam mit Doritos im Preis reduziert ist? Dann sollte man sicherstellen, dass die Systeme den Lieferanten automatisch mitteilen, zusätzliche Mengen zur Erfüllung der erwarteten Nachfrage anzuliefern.
Nicht zuviel Business-Intelligence kaufen. Wie zahlreiche Anekdoten belegen, kaufen viele Unternehmen die Lizenzen für Analysetools in großen Stückzahlen, verwenden dann aber nur sehr wenige, da sich die Power-User zwar mit den Tools anfreunden, andere Anwender sie aber ablehnen. Man sollte also niedrig anfangen, die Anwendernachfrage ausloten und davon ausgehend die Anzahl der Lizenzen steigern. Ein Web-Client kann eine einfache Möglichkeit darstellen, dies problemlos zu erreichen, denn er kann neuen Anwendern je nach Bedarf leicht zur Verfügung gestellt werden.
Die Oberfläche ist entscheidend. Analysten lieben Data-Mining, denn sie können damit komplexe Datensätze untersuchen. Die meisten Anwender hassen es, denn sie müssen damit komplexe Datensätze untersuchen. Da die Zugänglichkeit ausschlaggebend für den Erfolg des Data-Mining ist, sollte man entweder Analysten haben, die eng mit den Business-Teams zusammenarbeiten, oder aber das Data-Mining in andere, anwenderfreundlichere Anwendungen integrieren, damit die Anwender die Ergebnisse stets in einem Zusammenhang zu Gesicht bekommen, der für sie von Bedeutung ist.