Data Scientist – Der statistisch-mathematische Schnittstellenmanager

    Die Jobs eines Data Scientists sind vielfältig und meist sehr technisch

    Vor einigen Jahren nannte die Harvard Business Review den Data Scientist den interessanten Job des 21. Jahrhunderts. So falsch ist die Einschätzung nicht, denn im Zusammenhang mit dem sich ständig vermehrenden Datenvolumen sind die besonderen Skills dieses Professionals für viele Bereiche unumgänglich.

    Dabei ist das spezielle Skill-Set eines Data Scientists recht divers. Erstens ist das Jobfeld meist schwierig von den Aufgaben eines Data Analysts zu trennen. Zweitens braucht der Data Scientist weit mehr Fähigkeiten, als der Titel vermuten lässt. Natürlich ist das Beherrschen der entsprechenden Software unumgänglich. Doch kommt es auch darauf an, welcher Art der Job ist, für den sich ein Data Scientist bewerben will.

    Data Scientists in verschiedenen Umgebungen

    Die Basis (und ein guter Einstieg) ist es, Daten aus Datenbanken zu ziehen, sie zu ordnen und dann für Nichtexperten aufzubereiten. Darüber hinaus ist ein Data Scientist aber auch dazu da, überhaupt erst einmal eine Infrastruktur zu schaffen, die das Data Mining ermöglicht.

    Neben den technischen Vorrausetzungen gehört dazu auch, ein Mindset anzulegen, wie ein Unternehmen aus Daten Business Intelligence generieren kann. Mit anderen Worten: Ein Data Scientist ist auch ein Projekt- und Prozessmanager.

    In anderen Umgebungen, die mit Daten per se handeln, macht der Data Scientist diese Daten verkaufsfähig. Wieder andere Unternehmen suchen einen Spezialisten, der entweder für die technische oder analytische Seite ein großes Team an Data Scientists ergänzt.

    Es braucht mehr als Softwarekenntnisse

    Die großen Datenmengen werden auf Servern gespeichert

    In diesem variablen Feld müssen angehende Professionals ein großes Set an Fähigkeiten mitbringen, die weit über den technischen Aspekt hinaus gehen. Zur Grundausstattung gehören Kenntnisse in statistischen Programmiersprachen und vor allem auch in Datenbankabfrage-Sprachen wie SQL aber in jedem Fall.

    Statistisch-mathematische Kenntnisse sind auch ein Muss, wobei je nach Job Grundkenntnisse reichen. Viel wichtiger ist dabei, zu wissen, warum ein statistischer Ansatz mehr Sinn ergibt als ein anderer; Grundbegriffe und -verfahren müssen aber sitzen. Ähnliches gilt auch für die Verfahren des maschinellen Lernens und die höhere Mathematik. Auch hier variiert aber je nach Job das geforderte Expertiselevel. Je größer die Eigenverantwortung der Stelle ist, desto wichtiger wird dieses Wissen, um neue Big Data-Systeme selbstständig schaffen und zum Laufen bringen zu können.

    Da Big Data vor allem auch ungeordnete und oft unsaubere Daten enthält, braucht ein Data Scientist in jedem Fall Wissen und Kenntnisse darüber, wie er diese Lücken sinnvoll ausfüllt. Er muss Verfahren entwickeln können, Daten in ein einheitliches und sauberes Format zu gießen und gleichzeitig auch dafür sorgen können, dass das Unternehmen in Zukunft alle Daten sauber sammeln kann.

    Und schlussendlich muss der Data Scientist seine ganzen Ergebnisse auch zielgruppengerecht vermitteln können. Das geht über die reine Visualisierung hinaus, denn er muss zwar denken wie ein Data Scientist, aber mit anderen Mitarbeitern in ihrer Sprache sprechen. Und er ist letztendlich auch ein Moderator und Koordinator zwischen allen Organisationseinheiten, die von Big Data profitieren sollen. Diese Funktion will sowohl technisch, als auch sozialkompetent ausgefüllt werden.