Prestandaingenjör, Containers/Serverless - Verda - Distans - Globalt

Prestandaingenjör

Ersättning

Uppskattat

Tryck på det här kortet för lönediagram och fullständiga ersättningsdetaljer.

€6,667 - €9,766/månad

Expandera för full lönekontext

Se marknadsposition, jämförelsegraf för lönespann och lokaliserad lönenarrativ.

Marknadsmedian: €8,217

Datamittpunkt (overifierad): €8,217

n=188

Lönekontext: Prestandaingenjör

Hovra eller tryck på en rad för fullständig statistik (EUR/månad i det här diagrammet).

Lön i vår data — ej angiven i annonsen (Medelnivå)

€556

€814

Månadslönejämförelse för Prestandaingenjör
Marknad	Undre gräns (25:e percentilen)	Median	Övre gräns (75:e percentilen)
Lön i vår data — ej angiven i annonsen (Medelnivå)	€556/per månad	€685/per månad	€814/per månad

Publicerad: 12 maj 2026

Publicerad för 65 dagar sedan

Senast sedd i crawl: 13 juli 2026 (3d sedan)

Beräknat utgångsdatum: 16 juni 2026

Plats

Distans - Globalt

Arbetsplats

Distans

Område

Mjukvaruutveckling

Roll och ledning

Rollnivå:Medelnivå

Anställningsform

Heltid

Obligatoriska språk

Engelska

Jobbeskrivning

Verda är ett teknikföretag som bygger nästa generation av molninfrastruktur för AI. Vi driver GPU-kluster över Europa, USA och Asien, och hanterar några av de mest krävande AI/ML-arbeten i produktion idag — från frontier-modellträning till latenskänslig inferens i stor skala. Vi är ett team med låg hierarki som levererar pragmatiskt och ger ingenjörer verkligt ägarskap för systemen de bygger. Att köra ML/AI-arbeten i containrar och serverlösa miljöer verkar enkelt på en presentation men är det inte i produktion. Mellan objektlagret och GPU:erna finns ett dussin lager — bildhämtningar, nätverksfilsystem, sidu-välimuisti, modelluppladdare, runtime-initialisering — och varje lager bidrar tyst till hur lång tid ett arbete tar att bli användbart och hur snabbt det körs när det väl är igång. Vi söker en prestandaingenjör som ska äga detta område för Verdas container- och serverless GPU-plattformar. Du kommer att karakterisera var tid och genomströmning faktiskt fördelas över hela stacken och omvandla denna förståelse till konkreta förbättringar av plattformen. Kallstartlatens är ett av de mest synliga uttrycken för problemet — en 70B-modell som tar nittio sekunder att ladda är ett nittio sekunders avbrott ur användarens perspektiv — men samma grundläggande principer påverkar också steady-state inferens, träningstidssteg och checkpoint-beteende. Vi vill ha någon som förstår hur alla dessa delar samverkar. Profilera och optimera hela vägen för containeriserade ML/AI-arbeten: bilddistribution, start, viktladdning, inferensens hetaste väg. Designa och finjustera lagret mellan S3-kompatibla objektlagring och GPU-noder — förprefetchers, cachenivåer, nätverksfilsystem och lokala NVMe-layouts. Aja mätbara vinster på tid till första token, träningstidssteg och kallstartlatens över både interna tjänster och kundarbeten. Benchmarka och karakterisera verkliga arbetsbelastningar, inte syntetiska, och omvandla resultaten till plattformsändringar. Arbeta över beräknings-, nätverks- och plattformsgrupper för att ta bort flaskhalsar end-to-end, inte bara på ett lager. Publicera interna (och ibland externa) rapporter så att resten av organisationen — och våra kunder — förstår avvägningarna. Hålla sig à jour med det utvecklande ML/AI-ekosystemet.

Företagsinformation

Verda

Visade data baseras på historiska jobbannonser från vår databas.

Jobbdetaljer

3 dagar sedan Content Complete

Help us improve JobCrawls — sign in to sync saved jobs across devices, or send feedback anytime.