Return to site

Data engineer - DataEngineerics (Prague)

· Hiring

Rozšiřujeme náš technický tým (DataEngineerics) o šikovného datově-orientovaného vývojáře s přibližně 1-3 roky reálné zkušenosti práce s daty (ideálně nějaký mix SQL, Python, Spark), kterého by bavilo stavět moderní datově-analytická řešení a architektury v cloudu.

#Data Engineer #ETL/DWH/BI Developer #Data Specialist

Kdo jsme

V rámci DataSentics (boutique na datovou analytiku a strojové učení) je DataEngineerics týmem specializovaným na datové technologie a produkcionalizaci datově-analytických (BI+data science) řešení. Vznikli jsme jako mix data engineerů online světa cloudů a specialistů prostředí korporátních BI řešení a datových skladů. Spojuje nás touha dělat věci tak, aby fungovali a zároveň odpovídali standardům pro práci s daty.

Co děláme

Data, data, skriptování, programování a s tím spojena analýza a architektura. Naše řešení míří někam mezi google sheet/access/ošklivá procedura s 5000 řádky a rigidní velké procesy prorostlé datové sklady. Z nich si bereme řemeslnou zručnost (například metadata driven development, byznys slovníky, jasnou architekturu), z quick & dirty řešení zase jejich fokus a drive pro vyřešení business zadání. V rámci podnikové data governance je naše největší přidaná hodnota tam, kde je datový sklad neefektivní a zároveň je vyžadována kvalita. Například umíme držet krok s měnícími se požadavky, umíme čistit data, klidně i near-realtime/streaming, umíme komunikovat s API jiných systémů a samozřejmě si zvládneme povídat s datovým skladem.

Jak to děláme

Naše oblíbené technologie jsou cloudové služby postavené na kombinaci relačních analytických databází a zároveň méně strukturovaný svět Hadoop/Spark ekosystému, různých jezer, pythonů a dalších.

Pracujeme agilním/prototypovacím způsobem. Agile vnímáme jako definovaný proces, nikoliv jako buzzword pro nekvalitní vývoj.

Využíváme nové technologie, často experimentujeme a občas něco přepíšeme. Raději uděláme pár chyb na cestě k modernímu, škálovatelnému a efektivnímu řešení, než abychom stavěli konstrukčně stará řešení bez jediné chyby. Ten pokrok se sám jednoduše neudělá a naši zákazníci tomu rozumí.

Klíčové schopnosti, které hledáme:

  • zpracování dat (nejlépe nějaký mix SQL, Python, Spark) a práce s relačními databázemi (např. Snowflake, MS SQL, apod.), ale pokud rozumíš Teradatě, Oraclu, Informatice a dalším tradičním toolům, ty cloudové (Keboola, apod.) naženeš rychle.
  • DevOps a cloudová infrastruktura – Azure/AWS/GCP, Continous Integration, Metadata Driven Development
  • nadšení pro data, jejich struktury a jejich význam
  • nadšení pro zkoumání a experimentování s novými datovými technologiemi (streaming, distribuované systémy, nestrukturovaná data)
Co bys dělal?
  • Práci na jednotlivých klientských projektech typicky spolu s datovým architektem a data scientisty
  • Řešil bys, jak získat data, jak je pospojovat, či jinak zpracovat, jak je pročistit a tak dále distribuovat (do analytických modelů, z modelů zpátky, apod.):
  • Čištění a transformace dat pomocí SQL, Python/R, Spark
  • Práce s API rozhraní k různým online aplikacím/datovým zdrojům Facebook, Google Analytics a další.
  • Údržbu a provoz datových řešení.
V jakém případě by to pro tebe mohlo být zajímavé?
  • Rád pracuješ v malém cross-funkčním týmu na něčem co má jasný byznysový smysl a použití
  • Nechceš dělat na jedné věci, ale zajímá tě poznat více klientů/oborů/projektů a technologií
  • Vyhovuje ti spíš menší firma a spojená flexibilita (kombinace remote a kancelář, plochá struktura, apod.), ale zároveň chceš být součástí týmu lidí podobných jako ty, abys měl s kým věci řešit a vzájemně se obohacovat
  • Chceš challengovat některé tradiční myšlenky českého datového rybníčku.
  • Chceš, abys dostal prostor hledat a zkoušet nové věci
Napiš nám na info@datasentics.com a zajdeme na kafe, abychom se poznali a probrali to detailněji.
All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly