Massive Verbesserung der Performanz
Mechmine - die Suche nach den richtigen Informationen mittels Data-Mining
Beim Data-Mining handelt es sich um Verfahren die in Daten nach Informationen suchen. Dabei bedient man sich statistischer Verfahren, mit welchen man in typischen grossen Datenbeständen, die manuell nicht zeitgerecht bearbeitet werden könnten, nach Mustern ("patterns") und Eigenschaften sucht. Die hierzu verwendeten Methoden bzw. Algorithmen basieren z.B. auf Entscheidungsbäumen, Neuronalen Netzen, "Support Vector Machines", Genetischen Algorithmen, Diskriminant- oder Regressions-Analyse oder regelbasierter Folgerung. Der Data-Mining Prozess erfolgt stufenweise, über die Musterauslese und Extraktion zur Klassifizierung gefolgt von einer Nachbearbeitung.
Die Qualität und Performanz eines Data-Mining Systems hängt massgeblich von der Vorverarbeitung der Daten ab. Informationen die bei diesem Vorgang verloren gehen, kann der beste Algorithmus dann nicht mehr aus den Daten extrahieren. Die Datenvorverarbeitung ist essentiell, weil typische Datenzeitreihen zu lange sind um sie einem Algorithmus zuzuführen, müssen die Daten reduziert werden. Traditionelle "pre-processing" Methoden basieren auf der Fast Fourier Transform (FFT) oder Principal Component Analysis (PCA). Durch die parallele Anwendung mehrerer Verfahren und einer intelligenten Auswahlstatistik, kann die Performanz eines Data-Mining Systems massiv verbessert werden.