Zunächst erfolgten die Identifikation relevanter Informationen und der Aufbau der Datenbasis basierend auf dem CRISP-DM-Vorgehen (Cross-Industry Standard Process for Data Mining). Relevante Projektparameter waren hierbei beispielsweise Projektgröße, Projektart, Unternehmensbereich oder Ressource. Aufbauend auf der identifizierten Datenbasis wurde anschließend die Datenqualität mittels statistischer Analysen evaluiert und Transparenz über den Datensatz geschaffen, um eine bestmögliche Anwendbarkeit des Modells sicherzustellen. Die Analyse der Datenqualität war im Anschluss die Grundlage zur Auswahl der zielkonformsten Methode. Für das dargestellte Projekt stellte ein Random-Forrest-Algorithmus die Grundlage dar und wurde entsprechend trainiert. Das Ergebnis der datenbasierten Anwendung war ein um rund 80 Prozent besseres Ergebnis im Vergleich zur herkömmlichen manuellen Projektplanung.