Machine Learning výzkumník pro doporučovací systémy

Praha

Pro muže i ženy OZP Plný úvazek

Vytváříme doporučovací systém, který každému uživateli vybírá články na míru podle jeho preferencí. Uživatelů i dat je hodně a baví nás to.

S čím se budete potkávat

Docker
GitLab
Hadoop
Jupyter
Python
Spark
TensorFlow

V týmu doporučovacích systémů se věnujeme analýze chování a preferencí uživatelů, abychom mohli nabídnout personalizovaný obsah na míru každému uživateli. Vyvíjíme modely strojového učení, které dokáží z milionů položek vybrat jednotky, které nakonec ukážeme uživateli. Doporučujeme články, videa, podcasty a další obsahové položky, které máme v databázi. Co se týká ML modelů, typickým příkladem je kolaborativní filtrování, které předpovídá zájmy uživatele na základě preferencí dalších uživatelů. Dále pak obsahové filtrování, které doporučuje položky porovnáním obsahu položek s profilem uživatele, nebo hybridní modely, které kombinují obě tyto metody dohromady. V neposlední řadě vyvíjíme modely, které klasifikují položky z naší databáze, pomáhají nám lépe pochopit daný obsah a jejich výstup je využíván v dalších částech doporučovacího systému.

Kdo bude váš nadřízený

Radek Tomšů

Programátor výzkum senior

V roce 2018 jsem v Seznamu začal jako vývojář doporučovacích systémů. Po roce jsem přešel do Oddělení výzkumu, kde pracuju dodnes. Naším úkolem je vybrat uživateli ten nejlepší obsah, který by ho mohl zajímat. Máme k dispozici velké množství dat a moderní technologie, které neustále rozvíjíme.

Co Vás čeká? 

  • Rozvoj doporučovacího systému, který denně slouží milionům uživatelů. 
  • Vytváření ML modelů, které vybírají ten nejrelevantnější obsah pro každého uživatele. 
  • Analyzování dat a zjišťování nových poznatků o uživatelích, obsahu a vším souvisejícím. 
  • Práce s Big Data posbíraná v rámci provozu celého Seznam.cz. 
  • State of the art z pohledu technologií i algoritmů. 
  • Možnost realizovat a otestovat vlastní nápady. 
  • Práce v týmu, nebudete na věci sám.

S jakými technologiemi pracujeme? 

  • Python, Jupyter, Spark. 
  • Modely v TensorFlow, Vowpal… 
  • Jazykové modely Elektra, Small-E-Czech, ChatGPT…
  • Ostatní: Gitlab, Docker, AirFlow, SQL, Tableau, Hadoop..

Koho hledáme? 

  • Máte praktické zkušenosti v oblasti strojového učení, datové analýzy a statistiky. 
  • Baví vás práce s daty, dokážete z nich vyčíst zajímavé informace a data správně interpretovat. 
  • Umíte pracovat samostatně, aktivně komunikovat a zároveň práce v týmu Vám nedělá problémy. 
  • Vyžadujeme kandidáta se solidními základy ve strojovém učení, programování a algoritmizaci. 

Co nabízíme? 

  • Kreativní prostředí – budete moci realizovat vlastní nápady a postupy. 
  • Velký dopad – budete se podílet na rozvoji doporučovacího systému, který denně využívají miliony uživatelů. 
  • Osobní rozvoj – široká možnost vzdělávání v rámci projektů, vyhrazený čas na vzdělávání podle vlastní volby, účast na odborných konferencích, prezentace výzkumu na interních a externích akcích, předávání znalostí napříč týmy. 
  • Týmovou spolupráci – budete spolupracovat s dalšími výzkumníky a výzkumnými týmy, předávat si navzájem informace a znalosti a společně hledat vhodné cesty a řešení.
  • Neformální prostředí – všichni si tady tykáme a nemáme předepsaný dress code.

Co je v Seznamu taky bezva

Dny volna navíc
K dovolené ještě dalších 5 dnů? No fakt. Ať už chcete třeba jen lenošit nebo vás hezké počasí naopak žene ven, užijte si volno podle vašich představ.
Home office lze dohodnout
V kanceláři bychom vás přeci jen rádi občas potkali, ať se nedivíme, kde jste se u nás vzali. Ale že jde někdy práce líp od ruky z domácího prostředí, tomu taky rozumíme. Domluvte se s nadřízeným a jistě najdete dobrý kompromis.
Interní vzdělávání
U nás se nudit nebudete. Osobnímu i profesnímu rozvoji fandíme a nabízíme nekonečně příležitostí k seberozvoji a vzdělávání, včetně pomoci od profesionálních trenérů.
Lékař online 24/7
Zdraví je jen jedno, proto nám vaše zdraví jedno není. Našeho lékaře můžete využít ve dne v noci klidně z vaší postele, ať už chcete konzultaci nebo napsat eRecept.
Pružná pracovní doba
Někdo je ranní ptáče a nejvíc práce udělá se svítáním, někdo zas sova a nejvíc klidu na práci má večer. Důležité jsou pro nás kvalitní výsledky, ne váš rozvrh hodin.
Technika na přání
Apple, Linux nebo Windows? Všechno máme a k dispozici dáme. A pokud už jste zvyklí na své vymazlené miláčky, pracujte klidně na vlastním zařízení a my vám budeme finančně přispívat.

Kde budete pracovat

Praha

Seznam.cz, a.s.
Radlická 3294/10
150 00 Praha 5 – Smíchov
Naše centrála je velmi dobře dostupná, můžete dorazit metrem na lince B, jednou z nesčetných tramvají nebo autobusem. Autobusové nádraží Na Knížecí je hned za rohem.
Metro
B – Anděl
Tramvaj
4 5 7 9 10 12 15 16 20
Bus
120 123 137 167 191

Kudy vede cesta do Seznamu

Koukněte, jak vypadá výběrko, pohovor nebo první den v Seznamu, ať se vaše cesta na vysněnou pozici obejde bez zbytečných škobrtnutí.

1 Zaslání životopisu

Dejte nám o sobě vědět, i když třeba hned nevíte, co by vám slušelo za pozici. Míst máme spousty a HR profíků taky, určitě něco vymyslíme.

2 Jak probíhá výběrko

Pokud vaše kvality pasují na pozici, zavoláme vám a probereme vzájemné představy o nástupu, náplni práce nebo finančním očekávání. Máme shodu? Rádi vás pozveme na první (nebo druhé) kolo pohovoru.

3 A je tu samotné výběrko

Výběrka probíhají online i offline, ale nebojte se žádného výslechu, je to spíš profesní pokec a upřímnosti si ceníme.

4 Je to tady! Nabídka práce

Do týmu skvěle pasujete a rádi bychom vás pasovali na Seznamáka. E-mailem vám proto pošleme oficiální nabídku práce, kde znova shrnujeme důležité body spolupráce. Všechno souhlasí? Prima, dejte nám vědět, že do toho jdete s námi.

5 Vítejte na palubě aneb Pre-onboarding

Skvěle, plácli jsme si na spolupráci. Smlouvu u nás můžete podepsat v den nástupu, ale jestli už se nemůžete dočkat, připravíme ji k podpisu i dřív. A rovnou můžete nasát informace na dobrém kafi s někým z budoucího týmu.

6 Hurá, váš první den v Seznamu

Každý začátek měsíce vítáme všechny nováčky u nás na centrále v Praze. Vyřešíme potřebnou administrativu, předáme vám techniku, seznámíme vás s kolegy a nakonec vás provedeme po našem labyrintu.

7 Adaptace aneb jééé, funguje to!

Na začátku to vypadá možná trochu chaoticky, ale nebojte, máme promakaný systém školení pro každou pozici, takže co neumíte, rádi naučíme.

8 Umíte vše levou zadní? Pak je tu interní vzdělávání

Po rozpačitém začátku jste už profíci v oboru, gratulujeme. A protože umět všechno je nuda, náš tým trenérů vám rád poradí s dalším rozvojem. A nabídka je nekonečně bohatá, vybrat si můžete z našeho e-learningu nebo školení přímo na míru.

Časté dotazy

Využíváte k učení i umělou inteligenci?

I budoucnost firemního vzdělávání bude ovlivněna automatizací, AI i virtuální realitou. Osobní kontakt a "živé" trenéry nahrazovat ale nebudeme. Nové technologie využíváme jako nástroje pro zefektivnění vzdělávání.

Jak v týmu Výzkumu spolupracujeme s datovými centry?

Seznamácká interní datová centra se starají o provoz několika výzkumných Hadoop clusterů, které nám umožňují rychlé zpracování velkých a rychlých dat. Dále pro nás provozují několik GPU clusterů, ty pak umožňují trénink a inferenci stovek modelů strojového učení, včetně LLM modelů, které jsou základem služeb Seznamu.

Jaké využíváme ve Výzkumu technologie?

Na projektech využíváme převážně Python (Numpy, Pandas, Polars, Dask, Scipy, PyTorch a další), Spark, Docker, Git. 

S jakými školami za tým Výzkumu spolupracujeme?

Jsme v kontaktu s technickými fakultami skoro všech českých vysokých škol. Tradičními partnery jsme už s ČVUT, VUT, MUNI a UK. Vybrané výzkumné skupiny aktivně podporujeme (například CIIRC ČVUT), s některými plánujeme společné projekty (třeba s VUT, ČVUT nebo UK). Na MUNI a UK příležitostně přednášíme jako externí lektoři. Samozřejmě podporujeme také neakademickou komunitu jako MLMU, MLPrague a jiné konference a pořádáme i vlastní odborná setkání a meetupy.

Jak využíváme Machine Learning pro naše projekty?

Ve Vyhledávání textu, obrázků, zpráv a videí využíváme strojové učení (ML) pro zpracování uživatelských dotazů, analýzu obsahu dokumentů (například webových stránek nebo obrázků), návrhy dotazů (včetně našeptávače, souvisejících dotazů a trending topics), hodnocení relevance dokumentů k uživatelskému dotazu (předvýběr výsledků, filtrování, řazení) nebo například pro vydávání chytrých karet a přímých odpovědí. Generativní jazykové modely používáme pro interakci s uživatelem a pro lepší formování odpovědí.

V Skliku se Machine Learning využívá na výběr optimální reklamy, detekci fraudových kliků, segmentaci uživatelů, modelování online chování, optimalizaci online aukcí a kampaní.

V Doporučování nám strojové učení pomáhá při personalizaci doporučování a detekce clickbaitu.

Tým Mapy.cz zas strojové učení chválí při rozpoznávání obrazu, detekci anomálií, relevanci výsledků hledání. 

Pro Zboží.cz je ML nepostradatelné při kategorizaci a shlukování inzerátů, relevanci výsledků hledání a na rozpoznávání parametrů výrobků.

Jak se v týmu Výzkumu dále vzděláváme?

Pro každý výzkum je konstantní vzdělávání naprosto zásadní a ne jinak je tomu i v Seznamu. Máme přístupy k vědeckým článkům a publikacím a aktivně navštěvujeme i přínosné konference, přednášky, nebo tématické kurzy a nechybíme ani na meetupech.

Zajímá vás tato pozice?

Zajímá vás tato pozice?