Výzkumník strojového učení pro e-commerce

Praha

Pro muže i ženy Plný úvazek

S čím se budete potkávat

CatBoost
Linux
Pandas
Python
PyTorch
Spark

Zboží.cz je jeden z předních cenových srovnávačů na českém trhu. Naše platforma se opírá o rozsáhlou databázi s téměř 200 miliony nabídek z e-commerce sektoru. Naší ambicí je vytvořit nad tímto obrovským množstvím dat ucelený produktový katalog, efektivní vyhledávač a funkční inzertní prostředí. Stojí před námi řada výzev, od datové analýzy po implementaci algoritmů strojového učení, aby bylo vyhledávání co nejrelevantnější, nabídky se správně párovaly s produkty a kategoriemi, a zákazníci tak našli přesně to, co hledají. 

Základní předpoklady 

  • Umíte programovat v jazyce Python a navrhovat efektivní algoritmy 
  • Orientujete se v problematice strojového učení 
  • Ovládáte základy Linuxu 
  • Máte praxi v oboru data science/ML alespoň jeden rok 

Součástí práce výzkumníka je 

  • Podílení se na formování zadání výzkumné úlohy a analýzy problému 
  • Samostatná práce na zadaném úkolu ve spolupráci s produkt manažery 
  • Příprava a analýza dat – Python, pandas, (Py)Spark, Polars 
  • Datově orientované řešení problémů 
  • Učení ML modelů – pracujeme se širokou škálou modelů od pravidlových systémů, logistické regrese a rozhodovacích lesů (XGBoost/CatBoost) až po hluboké neuronové sítě (PyTorch) 
  • Vyhodnocení navržených řešení, interpretace a prezentace výsledků 

Co nabízíme 

  • Zajímavou a rozmanitou práci, řešení netriviálních problémů 
  • Velká data – databáze produtků a nabídek e-shopů, logy interakcí uživatelů – možnost anotací na míru problému 
  • Dostáváme věci do produkce, přímý dopad na miliony uživatelů, 
  • Sdílení znalostí a zkušeností napříč Seznamem 
  • Osobní rozvoj – vzdělávání, reading groups a konference 
  • Super kolektiv, neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code 
  • Možnost HO (až 3 dny v týdnu) 

Na co se u nás můžete těšit

Dny volna navíc
K dovolené ještě dalších 5 dnů? No fakt. Ať už chcete třeba jen lenošit nebo vás hezké počasí naopak žene ven, užijte si volno podle vašich představ.
Dovolená o týden delší
Dovolené není nikdy dost. Proto vám ke standardním 4 týdnům dovolené přidáme ještě další týden.
Home office lze dohodnout
V kanceláři bychom vás přeci jen rádi občas potkali, ať se nedivíme, kde jste se u nás vzali. Ale že jde někdy práce líp od ruky z domácího prostředí, tomu taky rozumíme. Domluvte se s nadřízeným a jistě najdete dobrý kompromis.
Interní vzdělávání
U nás se nudit nebudete. Osobnímu i profesnímu rozvoji fandíme a nabízíme nekonečně příležitostí k seberozvoji a vzdělávání, včetně pomoci od profesionálních trenérů.
Konference
Načerpejte nové inspirace a trendy, a to buď v publiku nebo rovnou na pódiu.
Lékař online 24/7
Zdraví je jen jedno, proto nám vaše zdraví jedno není. Našeho lékaře můžete využít ve dne v noci klidně z vaší postele, ať už chcete konzultaci nebo napsat eRecept.
Ovoce do práce
Nálož vitamínů 2x měsíčně, občas i s nějakým chuťovým překvápkem.
Pet friendly
Že je maskot Seznamu pes, není úplná náhoda. Čtyřnohé kolegy vítáme, dokonce s námi chodí i na porady.
Pružná pracovní doba
Někdo je ranní ptáče a nejvíc práce udělá se svítáním, někdo zas sova a nejvíc klidu na práci má večer. Důležité jsou pro nás kvalitní výsledky, ne váš rozvrh hodin.
Sportu zdar
V Praze a Brně si můžete dát do těla v naší posilovně, ve velkých pobočkách i na hodinách jógy.
Technika na přání
Apple, Linux nebo Windows? Všechno máme a k dispozici dáme. A pokud už jste zvyklí na své vymazlené miláčky, pracujte klidně na vlastním zařízení a my vám budeme finančně přispívat.

Kde budete pracovat

Praha

Seznam.cz, a.s.
Radlická 3294/10
150 00 Praha 5 – Smíchov
Naše centrála je velmi dobře dostupná, můžete dorazit metrem na lince B, jednou z nesčetných tramvají nebo autobusem. Autobusové nádraží Na Knížecí je hned za rohem.
Metro
B – Anděl
Tramvaj
1 3 4 5 7 9 10 12 14 15 16 20 21
Bus
123 167 191

Kudy vede cesta do Seznamu

Koukněte, jak vypadá výběrko, pohovor nebo první den v Seznamu, ať se vaše cesta na vysněnou pozici obejde bez zbytečných škobrtnutí.

1 Zaslání životopisu

Dejte nám o sobě vědět, i když třeba hned nevíte, co by vám slušelo za pozici. Míst máme spousty a HR profíků taky, určitě něco vymyslíme.

2 Jak probíhá výběrko

Pokud vaše kvality pasují na pozici, zavoláme vám a probereme vzájemné představy o nástupu, náplni práce nebo finančním očekávání. Máme shodu? Rádi vás pozveme na první (nebo druhé) kolo pohovoru.

3 A je tu samotné výběrko

Výběrka probíhají online i offline, ale nebojte se žádného výslechu, je to spíš profesní pokec a upřímnosti si ceníme.

4 Je to tady! Nabídka práce

Do týmu skvěle pasujete a rádi bychom vás pasovali na Seznamáka. E-mailem vám proto pošleme oficiální nabídku práce, kde znova shrnujeme důležité body spolupráce. Všechno souhlasí? Prima, dejte nám vědět, že do toho jdete s námi.

5 Vítejte na palubě aneb Pre-onboarding

Skvěle, plácli jsme si na spolupráci. Smlouvu u nás můžete podepsat v den nástupu, ale jestli už se nemůžete dočkat, připravíme ji k podpisu i dřív. A rovnou můžete nasát informace na dobrém kafi s někým z budoucího týmu.

6 Hurá, váš první den v Seznamu

Každý začátek měsíce vítáme všechny nováčky u nás na centrále v Praze. Vyřešíme potřebnou administrativu, předáme vám techniku, seznámíme vás s kolegy a nakonec vás provedeme po našem labyrintu.

7 Adaptace aneb jééé, funguje to!

Na začátku to vypadá možná trochu chaoticky, ale nebojte, máme promakaný systém školení pro každou pozici, takže co neumíte, rádi naučíme.

8 Umíte vše levou zadní? Pak je tu interní vzdělávání

Po rozpačitém začátku jste už profíci v oboru, gratulujeme. A protože umět všechno je nuda, náš tým trenérů vám rád poradí s dalším rozvojem. A nabídka je nekonečně bohatá, vybrat si můžete z našeho e-learningu nebo školení přímo na míru.

Časté dotazy

Jak v týmu Výzkumu spolupracujeme s datovými centry?

Seznamácká interní datová centra se starají o provoz několika výzkumných Hadoop clusterů, které nám umožňují rychlé zpracování velkých a rychlých dat. Dále pro nás provozují několik GPU clusterů, ty pak umožňují trénink a inferenci stovek modelů strojového učení, včetně LLM modelů, které jsou základem služeb Seznamu.

Jak ve Výzkumu pracujeme s velkými jazykovými modely?

Pracujeme s nimi často, ve zkratce můžeme říct, že je učíme i používáme. Encoder modely (ze kterých získáváme sémantickou reprezentaci textu) používáme i vytváříme v projektech už léta, některé naše modely poskytujeme s open-source licencí komunitě (Small-E-Czech, RetroMAE). Obecné a univerzální generativní jazykové modely v Seznamu sami vytváříme, čímž se může chlubit jen hrstka výzkumných pracovišť z celé střední Evropy. Naším cílem je vytvořit model, který umí česky jako ještě žádný jiný. Tak nám držte palce.

Jaké využíváme ve Výzkumu technologie?

Na projektech využíváme převážně Python (Numpy, Pandas, Polars, Dask, Scipy, PyTorch a další), Spark, Docker, Git. 

S jakými školami za tým Výzkumu spolupracujeme?

Jsme v kontaktu s technickými fakultami skoro všech českých vysokých škol. Tradičními partnery jsme už s ČVUT, VUT, MUNI a UK. Vybrané výzkumné skupiny aktivně podporujeme (například CIIRC ČVUT), s některými plánujeme společné projekty (třeba s VUT, ČVUT nebo UK). Na MUNI a UK příležitostně přednášíme jako externí lektoři. Samozřejmě podporujeme také neakademickou komunitu jako MLMU, MLPrague a jiné konference a pořádáme i vlastní odborná setkání a meetupy.

Jak využíváme Machine Learning pro naše projekty?

Ve Vyhledávání textu, obrázků, zpráv a videí využíváme strojové učení (ML) pro zpracování uživatelských dotazů, analýzu obsahu dokumentů (například webových stránek nebo obrázků), návrhy dotazů (včetně našeptávače, souvisejících dotazů a trending topics), hodnocení relevance dokumentů k uživatelskému dotazu (předvýběr výsledků, filtrování, řazení) nebo například pro vydávání chytrých karet a přímých odpovědí. Generativní jazykové modely používáme pro interakci s uživatelem a pro lepší formování odpovědí.

V Skliku se Machine Learning využívá na výběr optimální reklamy, detekci fraudových kliků, segmentaci uživatelů, modelování online chování, optimalizaci online aukcí a kampaní.

V Doporučování nám strojové učení pomáhá při personalizaci doporučování a detekce clickbaitu.

Tým Mapy.cz zas strojové učení chválí při rozpoznávání obrazu, detekci anomálií, relevanci výsledků hledání. 

Pro Zboží.cz je ML nepostradatelné při kategorizaci a shlukování inzerátů, relevanci výsledků hledání a na rozpoznávání parametrů výrobků.

Zajímá vás tato pozice?

Zajímá vás tato pozice?