Výzkumník strojového učení

Brno

Pro muže i ženy Plný úvazek

S čím se budete potkávat

CatBoost
Docker
Git
Linux
Pandas
Python
PyTorch
Spark

Ve výzkumu řešíme širokou škálu úloh pro Seznam vyhledávání z oblasti strojového učení, zejména zpracování webových stránek, textu či uživatelského chování, příležitostně i obrazu. Jelikož jsme zavedená firma se spoustou uživatelů, máme tak k dispozici velké množství různorodých dat, jejichž kvalitu zaručuje tým Bussiness Inteligence. Jako výzkum řešíme projekt od samého nápadu a formování zadání, přes přípravu dat a návrh hlavních metrik až po spolupráci na nasazení. Modely učíme na našich dedikovaných serverech s grafickými kartami pro větší výpočty. Udržování si přehledu v aktuálních trendech je nedílnou součástí naší práce, proto klademe velký důraz na vzdělávání ať už samostudiem nebo v pravidelných organizovaných reading groups. Výzkumníci mají možnost vycestovat na konferenci či přednášet na univerzitách.

Jsme tak trochu univerzální tým – řešíme zkrátka to, co je zrovna potřeba. Díky tomu se pravidelně dostáváme k pestré škále problémů i různým modalitám. Naši práci je možné potkat napříč celým vyhledáváním. Podílíme se například na enkódování HTML dokumentů, zlepšování relevance a vektorového vyhledávání v obrázkovém vyhledávání, detekci entit v dotazu) nebo třeba detekci botů. Stavíme na moderních, state-of-the-art algoritmech, které si ladíme na míru konkrétním problémům s využitím dat anotovaných našimi vlastními anotátory. Velkým benefitem je také náš vlastní GPU cluster, díky kterému můžeme rychle experimentovat i škálovat. Na projektech rádi přemýšlíme společně, takže se pravidelně potkáváme v kanceláři až třikrát týdně. A když už jsme tam, po obědě si ke kávě často střihneme i partičku ping-pongu.

Co od vás očekáváme

  • Umíte programovat v jazyce Python a navrhovat efektivní algoritmy
  • Orientujete se v problematice strojového učení
  • Ovládáte základy Linuxu
  • Máte vystudovanou vysokou školu relevantní k pozici

Co můžete očekávat

  • Podílení se na formování zadání výzkumné úlohy a analýzy problému
  • Příprava a analýza dat – Python, pandas, (Py)Spark, Polars
  • Učení ML modelů – pracujeme se širokou škálou modelů od rozhodovacích lesů (XGBoost/CatBoost) až po hluboké neuronové sítě (PyTorch)
  • Aplikace state-of-the-art metod pro zpracování jazyka a obrazu
  • Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
  • Vyhodnocení navržených řešení, interpretace a prezentace výsledků
  • Předávání modelů a kódu do produkce např. pomocí Docker containerů
  • Zajímavou a rozmanitou práci, řešení netriviálních problémů
  • Velká data, možnost anotací
  • Vyrábíme prototypy pro řešení těžkých problémů,
  • Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
  • Vlastní výkonné servery, dedikovaná výpočetní kapacita
  • Sdílení znalostí a zkušeností napříč Seznamem
  • Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
  • Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
  • Možnost HO (až 3 dny v týdnu)

Jak probíhá výběrové řízení

  1. Zaslání CV
    Jakmile od vás obdržíme životopis, pečlivě si ho prostudujeme. Pokud budete odpovídat našim představám, ozveme se vám telefonicky.
  2. Telefonní prescreen (cca 10 minut)
    Krátce si zavoláme, abychom si ověřili základní informace – například vaše motivace, dostupnost nebo jazykové znalosti.
  3. Rozhodnutí o postupu
    Na základě prescreenu se manažer rozhodne, zda vás pozve do další fáze výběrového řízení.
  4. Technické úkoly (2 týdny na vypracování)
    Pokud postoupíte, obdržíte zadání dvou úkolů:
    • online programovací úloha,
    • případová studie zaměřená na oblast machine learningu.
  5. Osobní pohovor
    V případě, že budou technické úlohy vypracovány na odpovídající úrovni, pozveme vás na osobní pohovor.
    Pobavíme se o vašem řešení, vaší dosavadní praxi, znalostech i o samotné pozici. Prostor bude i na vaše dotazy.
  6. Rozhodnutí a nabídka
    Po prvním kole pohovoru si obvykle manažeři udělají jasno. Pokud budete tím správným kandidátem, zašleme vám pracovní nabídku.

Kdo bude váš nadřízený

Barbora Rišová

Vedoucí týmu výzkumu

V Seznamu na oddělení Výzkumu pracuju od roku 2020. Díky komplexnosti Vyhledávání jako služby neustále narážím na nové výzvy a neprobádané problémy. S týmem jsme se podíleli na vývoji několika komponent, čímž jsme vylepšili zážitek mnoha uživatelů. Naši práci jsem představila na mezinárodní konferenci Machine Learning Prague 2024. V Seznamu si nejvíce cením skvělého kolektivu, uvolněné atmosféry a možnosti posouvat a ovlivňovat směr výzkumu/Vyhledávání.

Co je v Seznamu taky bezva

Dny volna navíc
K dovolené ještě dalších 5 dnů? No fakt. Ať už chcete třeba jen lenošit nebo vás hezké počasí naopak žene ven, užijte si volno podle vašich představ.
Dovolená o týden delší
Dovolené není nikdy dost. Proto vám ke standardním 4 týdnům dovolené přidáme ještě další týden.
Fandíme rodinám
Zkombinovat práci a rodinu je důležité, proto jsme založili firemní školku Seznámek, aby si byly děti i rodiče vždycky nablízku.
Home office lze dohodnout
V kanceláři bychom vás přeci jen rádi občas potkali, ať se nedivíme, kde jste se u nás vzali. Ale že jde někdy práce líp od ruky z domácího prostředí, tomu taky rozumíme. Domluvte se s nadřízeným a jistě najdete dobrý kompromis.
Interní vzdělávání
U nás se nudit nebudete. Osobnímu i profesnímu rozvoji fandíme a nabízíme nekonečně příležitostí k seberozvoji a vzdělávání, včetně pomoci od profesionálních trenérů.
Konference
Načerpejte nové inspirace a trendy, a to buď v publiku nebo rovnou na pódiu.
Ovoce do práce
Nálož vitamínů 2x měsíčně, občas i s nějakým chuťovým překvápkem.
Pet friendly
Že je maskot Seznamu pes, není úplná náhoda. Čtyřnohé kolegy vítáme, dokonce s námi chodí i na porady.
Pružná pracovní doba
Někdo je ranní ptáče a nejvíc práce udělá se svítáním, někdo zas sova a nejvíc klidu na práci má večer. Důležité jsou pro nás kvalitní výsledky, ne váš rozvrh hodin.
Technika na přání
Apple, Linux nebo Windows? Všechno máme a k dispozici dáme. A pokud už jste zvyklí na své vymazlené miláčky, pracujte klidně na vlastním zařízení a my vám budeme finančně přispívat.

Kde budete pracovat

Brno

Seznam.cz, a.s.
The Campus Science Park – Budova C
Palachovo náměstí 797/4
625 00 Brno – Starý Lískovec
Nejbližší zastávka je Nemocnice Bohunice. Pokud jste přijeli vlakem, na nádraží skočte do šaliny č. 8 a za 20 minut jste u nás. Parkovat lze v podzemních garážích nebo v okolních oblastech Campus Square.
Šalina
8
Bus
40 50 51 69 E56
Trolejbus
25 37

Kudy vede cesta do Seznamu

Koukněte, jak vypadá výběrko, pohovor nebo první den v Seznamu, ať se vaše cesta na vysněnou pozici obejde bez zbytečných škobrtnutí.

1 Zaslání životopisu

Dejte nám o sobě vědět, i když třeba hned nevíte, co by vám slušelo za pozici. Míst máme spousty a HR profíků taky, určitě něco vymyslíme.

2 Jak probíhá výběrko

Pokud vaše kvality pasují na pozici, zavoláme vám a probereme vzájemné představy o nástupu, náplni práce nebo finančním očekávání. Máme shodu? Rádi vás pozveme na první (nebo druhé) kolo pohovoru.

3 A je tu samotné výběrko

Výběrka probíhají online i offline, ale nebojte se žádného výslechu, je to spíš profesní pokec a upřímnosti si ceníme.

4 Je to tady! Nabídka práce

Do týmu skvěle pasujete a rádi bychom vás pasovali na Seznamáka. E-mailem vám proto pošleme oficiální nabídku práce, kde znova shrnujeme důležité body spolupráce. Všechno souhlasí? Prima, dejte nám vědět, že do toho jdete s námi.

5 Vítejte na palubě aneb Pre-onboarding

Skvěle, plácli jsme si na spolupráci. Nástupní dokumenty podepíšete elektronicky klidně ještě před nástupem. Žádné papírování, šetříme přírodu. A když budete chtít, můžeme se rovnou domluvit na kafe s někým z týmu, ať se naladíte na naši atmosféru.

6 Hurá, váš první den v Seznamu

Každý začátek měsíce vítáme všechny nováčky u nás na centrále v Praze. Vyřešíme potřebnou administrativu, předáme vám techniku, seznámíme vás s kolegy a nakonec vás provedeme po našem labyrintu.

7 Adaptace aneb jééé, funguje to!

Na začátku to vypadá možná trochu chaoticky, ale nebojte, máme promakaný systém školení pro každou pozici, takže co neumíte, rádi naučíme.

8 Umíte vše levou zadní? Pak je tu interní vzdělávání

Po rozpačitém začátku jste už profíci v oboru, gratulujeme. A protože umět všechno je nuda, náš tým trenérů vám rád poradí s dalším rozvojem. A nabídka je nekonečně bohatá, vybrat si můžete z našeho e-learningu nebo školení přímo na míru.

Časté dotazy

Mohu mít v kanceláři psa?

Jsme dog friendly kancelář, takže Seznamáci si běžně do práce čtyřnohé mazlíčky vodí. Ke slušnosti ovšem patří zeptat se ostatních, zda nemají třeba alergii. 

Jak v týmu Výzkumu spolupracujeme s datovými centry?

Seznamácká interní datová centra se starají o provoz několika výzkumných Hadoop clusterů, které nám umožňují rychlé zpracování velkých a rychlých dat. Dále pro nás provozují několik GPU clusterů, ty pak umožňují trénink a inferenci stovek modelů strojového učení, včetně LLM modelů, které jsou základem služeb Seznamu.

Jak ve Výzkumu pracujeme s velkými jazykovými modely?

Pracujeme s nimi často, ve zkratce můžeme říct, že je učíme i používáme. Encoder modely (ze kterých získáváme sémantickou reprezentaci textu) používáme i vytváříme v projektech už léta, některé naše modely poskytujeme s open-source licencí komunitě (Small-E-Czech, RetroMAE). Obecné a univerzální generativní jazykové modely v Seznamu sami vytváříme, čímž se může chlubit jen hrstka výzkumných pracovišť z celé střední Evropy. Naším cílem je vytvořit model, který umí česky jako ještě žádný jiný. Tak nám držte palce.

Jaké využíváme ve Výzkumu technologie?

Na projektech využíváme převážně Python (Numpy, Pandas, Polars, Dask, Scipy, PyTorch a další), Spark, Docker, Git. 

S jakými školami za tým Výzkumu spolupracujeme?

Jsme v kontaktu s technickými fakultami skoro všech českých vysokých škol. Tradičními partnery jsme už s ČVUT, VUT, MUNI a UK. Vybrané výzkumné skupiny aktivně podporujeme (například CIIRC ČVUT), s některými plánujeme společné projekty (třeba s VUT, ČVUT nebo UK). Na MUNI a UK příležitostně přednášíme jako externí lektoři. Samozřejmě podporujeme také neakademickou komunitu jako MLMU, MLPrague a jiné konference a pořádáme i vlastní odborná setkání a meetupy.

Jak se v týmu Výzkumu dále vzděláváme?

Pro každý výzkum je konstantní vzdělávání naprosto zásadní a ne jinak je tomu i v Seznamu. Máme přístupy k vědeckým článkům a publikacím a aktivně navštěvujeme i přínosné konference, přednášky, nebo tématické kurzy a nechybíme ani na meetupech.

Zajímá vás tato pozice?

Zajímá vás tato pozice?