WiWi Gast schrieb am 07.04.2024:
Wir kriegen auch hunderte Bewerbungen aber es ist so unfassbar wenig Brauchbares dabei.
Die wirklich benötigten Skills, also wofür man auch gerne gutes Gehalt zahlt, divergieren aktuell extrem von dem was die meisten Leute liefern. Ich weiß auch nicht warum.
Irgendwie glaubt jeder BWL'ler mit drei Wochen Bootcamp oder Physiker der schonmal ein LLM gerochen hat, dass er jetzt Data Science Experte ist.
Und am Ende musst du dann hunderte Leute interviewen und findest immer noch Niemanden der die Basisskills hat.
Vielleicht wird es besser wenn es genug harte Studiengänge gibt irgendwann.
Ernst gemeinte Frage: Was sind denn die Basisskills, die man braucht und die fast niemand hat? Also mir ist schon bewusst, dass ein Bootcamp (halte ich auch für Abzocke) oder eln Coursera-Zertifikat alleine nicht reicht für eine Expertenstelle. Aber hier wird so oft über promovierte Physiker etc. gelästert, dass ich mich frage, was solche quantitativ begabten Leute scheinbar falsch machen.
Idealerweise hätten wir gerne Leute, die neben Mathe/Statistik auch ML Erfahrung haben (also ein echtes Data Science Projekt, nicht ne Kaggle Challenge oder das hundertste MNIST, durchführen können).
Dazu suchen wir aber auch Leute die ein hohes Software Engineering Niveau fahren können also zB von Algorithmen zu production ready code. Und zuletzt bitte auch in technischer Tiefe über Transformer, Mamba, Jamba und co reden können.
Also im Endeffekt ist es schon hart für Berufseinsteiger. Aber sonst passt das halt nicht.
Hahaha sorry aber "über Mamba und Jamba reden können"?! Jamba ist grade mal ein paar Wochen alt und Mamba ist doch noch überhaupt nicht etabliert außerhalb von academia. Halt mal den Ball flach, ich wette ich könnte dich in 5 Minuten zu Transformer grillen und du würdest gnadenlos untergehen.
Gut, es war jetzt ein Beispiel, aber du hast den Punkt fast verstanden: Du brauchst die technische Tiefe, musst aber auch aktuell bleiben. In unserem Bereich MUSST du solche Fragen beantworten können, wenn dein Hauptaufgabengebiet in Richtung LLMs geht.
"Überhaupt nicht etabliert"... Ja und? Hast du selber noch keinen vibe check mit SSMs gemacht? Wie Wie triffst du denn eine Relevanzeinschätzung?
Aktuelle Trends zu kennen gehört zum Data Science Profil dazu und ist auch eine der Herausforderungen. Wenn ich dich nach einer Einschätzung zu DPO frage, auch wenn es nicht tagtäglich relevant ist, dann sollst du da eine fundierte Meinung haben.
Außerhalb von LLMs kannst du dir ja äquivalente Fragen überlegen.
Ich könnte im Übrigen jede Grillsession mit dir zum Thema Transformer locker überstehen. Frag dich ruhig warum ich das mit so einer Sicherheit sagen kann.
Ja - Mamba ist durch SSMs motiviert - aber was genau hat das jetzt für eine Relevanz in irgend einer größeren (deutschen) Firma? Ich versteh deinen Punkt, dass es in der Branche wichtig ist aktuell zu bleiben. Aber du tust so als würdet ihr Cutting Edge Research betreiben. Mich würde ja echt mal interessieren wo genau du arbeitest - wenn du nicht grade in einem ML Lab (von denen es in Deutschland keine wirklich relevanten gibt - ich war selbst während meinem Studium 3 Jahre bei Siemens im AI Lab und das waren offen gesagt alles Laien hinsichtlich Cutting Edge Research (wenn auch viele smart mit PhD in Physik usw.). Aber von aktuellen Themen (damals bspw. NERFs, die super relevant für die gewesen wären) hat sich keiner groß interessiert oder überhaupt was davon mitbekommen. Okay - das ist jetzt auch wieder 3 Jahre her und Deep Learning hat durch den LLM Hype mittlerweile mehr Aufmerksamkeit bekommen, aber ich hab einfach GANZ andere Erfahrungen gemacht in der Hinsicht als du sie beschreibst.
Eventuell sind vielleicht die Auswahlkriterien in den Interviews mittlerweile anders als zu der Zeit als ich mich beworben hatte - vielleicht hatte ich auch einfach nie Problem in den Bewerbungsgesprächen weil ich in dem Bereich gut bin - aber ich hatte damals Bewerbungsgespräche bei AI Teams von Porsche, BMW, Bosch, den Data Science Abteilungen von BCG/McK und ein paar anderen und fand alles was die mir über die Aufgabenbereiche erzählt haben stink langweilig. Bin letztendlich im Ausland bei nem HF gelandet - allerdings ist selbst hier das was ich mache extrem weit weg von cutting edge research. Hier legt man mehr Wert darauf die vermeintlich einfachen Dinge richtig zu machen (feature engineering, model selection etc.)... darum wie gesagt, es würde mich interessieren wo du arbeitest, weil es sich absolut nicht mit meinen Erfahrungen deckt.
antworten