WE ARE HIRING! | JOBS @LANA LABS

Data Science in Action: Die Spitze des Daten-Eisbergs

Data Science in Action: Die Spitze des Daten-Eisbergs
January 31, 2019 Shirin

Machine Learning definiert die Art der Fragen neu, die ein Computer beantworten kann, und meine Aufgabe als Datenwissenschaftler ist es, diese Macht in die Hände unserer Kunden zu legen.” – Josu, Data Scientist

Wenn Sie im Internet nach Data Science recherchieren, finden Sie viele verschiedene Informationen. Von generischen Erklärungsansätzen, Artikeln über die Wichtigkeit von Data Science in Unternehmen bis hin zu Diskussionen darüber, warum Data Scientist “der sexieste Job im 21. Jahrhundert” ist. Bei dieser Fülle an Informationen kann es schwierig sein, ein wirklich authentisches Bild der Datenwissenschaft zu erhalten.

data scientist

Sprechen wir also am besten persönlich mit einem Data Scientist! Und noch besser – mit einem, der in einem rasanten und innovativen Tech Start-up arbeitet. Ich habe mit Josu, Data Scientist bei Lana Labs, gesprochen, um nicht nur ein besseres Bild über Data Science und ihr Potential zu bekommen, sondern auch zu verstehen, warum große Unternehmen immer noch mit diesem Thema zu kämpfen haben.
Josu erklärt, wie kein Arbeitstag dem anderen gleicht, wie Unternehmen oft unrealistische Erwartungen haben und wie wir das volle Potential vom maschinellen Lernen (“Machine Learning”) noch nicht verstanden haben.

Hi, Josu. Danke, dass du dir die Zeit genommen hast. Kannst du dich kurz vorstellen?

Klar. Hi, ich bin Josu. Ich kam im März 2018 zu Lana Labs, um als Data Scientist zu arbeiten. Ich komme aus dem Maschinenbau, so dass die Arbeit in Data Science zunächst außerhalb meiner Komfortzone lag, aber es gefällt mir immer besser. Der Karrierewechsel war rückblickend eine sehr gute Entscheidung.

Data Scientist

Wie würdest du deinen Job in einem Satz beschreiben?

Ein Data Scientist ist eine Person, die besser in Statistik ist als jeder Softwareentwickler und besser in Softwareentwicklung als jeder Statistiker.

Wie sieht ein typischer Arbeitstag für dich aus?

Ich glaube nicht, dass wir so etwas wie einen “typischen” Arbeitstag haben, was prinzipiell eine gute Sache ist. Jedes Kundenprojekt ist eine neue Herausforderung, nicht nur durch die technische Arbeit mit neuen Systemen und neuen Daten, sondern auch da ein Verständnis für die Besonderheiten der Branche gefordert ist. Außerhalb der Projektarbeit ist intern immer viel los: Testen neuer Funktionen, Besprechung der Produkt-Roadmap, Prototyping neuer Analysen, … Da wir noch ein kleines Unternehmen sind, ist das Data Science Team so ziemlich überall involviert.

Was macht dir Spaß, als Datenwissenschaftler zu arbeiten? Was gefällt dir nicht?

Daten sind so zentral für unser Leben geworden, und die Datenwissenschaft hat sich als die Hauptdisziplin entwickelt, diese Daten in einen Mehrwert zu übersetzen. Die Arbeit in der Data Science fühlt sich heute an, wie es den Informatikern in den 60er Jahren ging: Die Disziplin schreitet so schnell voran, dass das, was vor einigen Monaten als wegweisend galt, heute obsolet ist. Es kann manchmal schwierig sein, mit dem Tempo der Entwicklung Schritt zu halten, aber die Data Science Community ist sehr offen und einladend, selbst für Menschen, die keinen Hintergrund in Mathematik oder Informatik haben.

Hältst du den Hype um Data Science für berechtigt?

Vielleicht ist die bessere Frage eher, ob der Hype um die Künstliche Intelligenz berechtigt ist. Es gab einige unglaubliche Fortschritte in dem, was Computer in den letzten Jahren leisten können, und es sieht nicht so aus, als würde das Innovationstempo nachlassen. Machine Learning wird überall sein, und ich glaube, dass wir noch nicht vollständig verstanden haben, was das für Unternehmen, für die Arbeitnehmer und für die Gesellschaft im Allgemeinen bedeutet. Ich habe das Gefühl, dass zu viel Aufmerksamkeit auf das Versprechen der allgemeinen KI (Maschinen, die wie Menschen denken) und nicht genug auf die wirklichen Probleme gerichtet ist: Wie können wir das Beste aus diesen Innovationen auf verantwortungsbewusste und ethische Weise herausholen?

Welchen Mehrwert bringen Data Scientists dem Unternehmen?

Es gibt ein altes Sprichwort in der Informatik, das besagt: “Ein Computer sollte nie eine Frage stellen, auf die er die Antwort selbst wissen sollte”. Machine Learning definiert die Art der Fragen neu, die ein Computer beantworten kann, und meine Aufgabe als Data Scientist ist es, diese Macht in die Hände unserer Kunden zu legen. Die Ergebnisse reichen von verbesserter Transparenz und Konformität über Automatisierung und Vorhersage bis hin zum Übergang zu einer vollständig digitalen Organisation.

Worin besteht der Unterschied zwischen einem Data Scientist und einem Data Analyst?

Für mich umfasst Data Science ein breiteres Themenspektrum als Data Analysis. Ein Data Analyst konzentriert sich in der Regel darauf, Daten in Erkenntnisse umzuwandeln und sie bestmöglich nutzbar zu machen. Ein Data Scientist hingegen beschäftigt sich auch mit dem Erstellen von Modellen und Vorhersagen über die Zukunft, so dass die Arbeit nicht nur auf die Vergangenheit ausgerichtet ist.

Data Scientist

Du arbeitest an Process-Mining-Projekten für Kunden von Lana Labs. Wie unterstützt du diese Projekte?

Ich betrachte unsere Projekte gerne als einen End-to-End-Ansatz, bei dem Process Mining ein Werkzeug ist, das wir zur Lösung eines größeren Problems einsetzen. Wir investieren viel Mühe, um die Branche, das Unternehmen und die Prozesse, mit denen wir arbeiten, zu verstehen, da keine zwei Prozesse gleich sind. Auf der Ergebnisseite konzentrieren wir uns darauf, Erkenntnisse zu generieren, aus denen unsere Kunden Handlungen ableiten können, damit sie den Weg zur Prozessoptimierung auch nach Abschluss des Projekts fortsetzen können. Ich glaube, dass dieser End-to-End-Ansatz Lana Labs von anderen Unternehmen auf dem Markt unterscheidet.

Nutzen Unternehmen aus deiner eigenen Erfahrung ihre Daten korrekt und effizient?

Mein Eindruck ist, dass Unternehmen, insbesondere große Konzerne, oft zu konservativ im Umgang mit ihren Daten und zu unrealistisch in ihren Erwartungen sind. Beim Aufbau von angewandter Data Science innerhalb eines Unternehmens ist es oft sinnvoller, viele kleinere Projekte durchzuführen, die es den Data Scientists ermöglichen, schneller zu iterieren und das Tempo zu erhöhen. Das Setzen unrealistischer Ziele in einem Unternehmen, das nicht über Data-Science-Kenntnisse verfügt, kann schnell dazu führen, dass Datenprojekte entpriorisiert werden und das Data Science Team die Managementunterstützung verliert.

Letzte Frage – glaubst du, dass Unternehmen in 20 Jahren noch Data Scientists brauchen werden?

Das hoffe ich doch! Scherz beiseite, ich denke, dass wir nur die Spitze des Eisbergs von dem sehen, was Machine Learning bedeutet. Im Moment nutzen wir nur die offensichtlichen Möglichkeiten: Bessere Analysen, Vorhersagen, Automatisierung, etc. Die interessanten Anwendungsfälle, die “unbekannten Unbekannten”, stehen noch bevor, sodass die nächsten 20 Jahre eine sehr aufregende Zeit werden.

Vielen Dank, Josu!

Was haben wir gelernt? Data Science ist eine schnelllebige Disziplin, mit der es manchmal schwierig ist, Schritt zu halten, selbst für Data Scientists. Daher ist es nicht verwunderlich, dass Unternehmen Schwierigkeiten haben, den richtigen Ansatz für den Aufbau von angewandter Data Science zu finden.
Obwohl das Potential des Machine Learning noch nicht ausgeschöpft ist, können die aktuellen Möglichkeiten bereits wesentlich zum Erfolg von Unternehmen beitragen. Aus diesem Grund sind wir gespannt, wie sich die Data Science und die Anwendung der Künstlichen Intelligenz – insbesondere des Machine Learning – in Zukunft entwickeln werden und wie sich dies auf unser berufliches und privates Leben auswirken wird.

Wollen Sie schon jetzt einen Eindruck davon erhalten, wie Machine Learning und angewandte Data Science Ihre digitale Transformation unterstützen? Starten Sie Ihre Geschäftsoptimierung mit LANA Process Mining.