Výzkumník strojového učení pro vyhledávání

Praha

Pro muže i ženy OZP Plný úvazek

S čím se budete denně potkávat

CatBoost
GitLab
Pandas
Python
Spark

Internetové vyhledávání je technologicky pokročilá mašinerie, který zahrnuje použití strojového učení v mnoha svých komponentách – od počítání relevance dotazu a webové stránky, přes řazení výsledků či kvantifikaci zpětné vazby uživatelů, až po základní zpracování a pochopení obsahu webových stránek.

Náš pražský výzkumný tým se právě těmito aplikacemi zabývá. Vyvíjíme prototypy modelů v Pythonu, našimi každodenními nástroji jsou PyTorch, PySpark, CatBoost, Docker, K8 (mimo jiné). Máme spoustu dat a další si neustále vytváříme (manuálně či automaticky), v závislosti na potřebách projektu. Disponujeme silnou flotilou vlastního hardwaru (GPU clustery, Hadoop), takže nedostatek výpočetní kapacity není naší starostí.

Kromě plně industriálního zaměření jsme aktivní i v publikační činnosti (z nedávné doby můžeme zmínit: CWRCzech: 100M Query-Document Czech Click Dataset and Its Application to Web Relevance Ranking a Some Like It Small: Czech Semantic Embedding Models for Industry Applications), návštěvách konferencí a snažíme se věnovat čas také sebevzdělávání a neformálním týmovým stmelovacím aktivitám (fotbálek, discgolf nebo třeba deskovky).

Základní předpoklady

  • Umíte programovat v jazyce Python a navrhovat efektivní algoritmy
  • Orientujete se v problematice strojového učení
  • Ovládáte základy Linuxu
  • Máte praxi v oboru alespoň 1 rok

Součástí práce výzkumníka je

  • Podílení se na formování zadání výzkumné úlohy a analýzy problému
  • Příprava a analýza dat – Python, pandas, (Py)Spark, Polars
  • Učení ML modelů – pracujeme se širokou škálou modelů od rozhodovacích lesů (XGBoost/CatBoost) až po hluboké neuronové sítě (PyTorch)
  • Aplikace state-of-the-art metod pro zpracování jazyka a obrazu
  • Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
  • Vyhodnocení navržených řešení, interpretace a prezentace výsledků
  • Předávání modelů a kódu do produkce např. pomocí Docker containerů

Co nabízíme

  • Zajímavou a rozmanitou práci, řešení netriviálních problémů
  • Velká data, možnost anotací 
  • Vyrábíme prototypy pro řešení těžkých problémů,
  • Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
  • Vlastní výkonné servery, dedikovaná výpočetní kapacita
  • Sdílení znalostí a zkušeností napříč Seznamem
  • Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
  • Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
  • Možnost HO (až 3 dny v týdnu)

Kdo bude váš nadřízený

Veronika Krejčířová

Vedoucí oddělení výzkumu

V Seznamu jsem od roku 2016 a pořád mě to baví - práce výzkumníka je kreativní, různorodá, napínavá a dává spoustu příležitostí učit se něco nového. Málokde totiž najdete tolik zajímavých úkolů a všelijakých dat, se kterými si můžete hrát. Od doby, co vedu výzkumné oddělení, je sice hraní méně a schůzek více. Na druhou stranu ale můžu lépe ovlivňovat, na čem budeme na výzkumu pracovat a tím směřovat celé vyhledávání.

Na co se u nás můžete těšit

Dny volna navíc
K dovolené ještě dalších 5 dnů? No fakt. Ať už chcete třeba jen lenošit nebo vás hezké počasí naopak žene ven, užijte si volno podle vašich představ.
Dovolená o týden delší
Dovolené není nikdy dost. Proto vám ke standardním 4 týdnům dovolené přidáme ještě další týden.
Fandíme rodinám
Zkombinovat práci a rodinu je důležité, proto jsme založili firemní školku Seznámek, aby si byly děti i rodiče vždycky nablízku.
Home office lze dohodnout
V kanceláři bychom vás přeci jen rádi občas potkali, ať se nedivíme, kde jste se u nás vzali. Ale že jde někdy práce líp od ruky z domácího prostředí, tomu taky rozumíme. Domluvte se s nadřízeným a jistě najdete dobrý kompromis.
Interní vzdělávání
U nás se nudit nebudete. Osobnímu i profesnímu rozvoji fandíme a nabízíme nekonečně příležitostí k seberozvoji a vzdělávání, včetně pomoci od profesionálních trenérů.
Konference
Načerpejte nové inspirace a trendy, a to buď v publiku nebo rovnou na pódiu.
Ovoce do práce
Nálož vitamínů 2x měsíčně, občas i s nějakým chuťovým překvápkem.
Pet friendly
Že je maskot Seznamu pes, není úplná náhoda. Čtyřnohé kolegy vítáme, dokonce s námi chodí i na porady.
Pružná pracovní doba
Někdo je ranní ptáče a nejvíc práce udělá se svítáním, někdo zas sova a nejvíc klidu na práci má večer. Důležité jsou pro nás kvalitní výsledky, ne váš rozvrh hodin.
Technika na přání
Apple, Linux nebo Windows? Všechno máme a k dispozici dáme. A pokud už jste zvyklí na své vymazlené miláčky, pracujte klidně na vlastním zařízení a my vám budeme finančně přispívat.

Kde budete pracovat

Praha

Seznam.cz, a.s.
Radlická 3294/10
150 00 Praha 5 – Smíchov
Naše centrála je velmi dobře dostupná, můžete dorazit metrem na lince B, jednou z nesčetných tramvají nebo autobusem. Autobusové nádraží Na Knížecí je hned za rohem.
Metro
B – Anděl
Tramvaj
1 3 4 5 7 9 10 12 14 15 16 20 21
Bus
123 167 191

Kudy vede cesta do Seznamu

Koukněte, jak vypadá výběrko, pohovor nebo první den v Seznamu, ať se vaše cesta na vysněnou pozici obejde bez zbytečných škobrtnutí.

1 Zaslání životopisu

Dejte nám o sobě vědět, i když třeba hned nevíte, co by vám slušelo za pozici. Míst máme spousty a HR profíků taky, určitě něco vymyslíme.

2 Jak probíhá výběrko

Pokud vaše kvality pasují na pozici, zavoláme vám a probereme vzájemné představy o nástupu, náplni práce nebo finančním očekávání. Máme shodu? Rádi vás pozveme na první (nebo druhé) kolo pohovoru.

3 A je tu samotné výběrko

Výběrka probíhají online i offline, ale nebojte se žádného výslechu, je to spíš profesní pokec a upřímnosti si ceníme.

4 Je to tady! Nabídka práce

Do týmu skvěle pasujete a rádi bychom vás pasovali na Seznamáka. E-mailem vám proto pošleme oficiální nabídku práce, kde znova shrnujeme důležité body spolupráce. Všechno souhlasí? Prima, dejte nám vědět, že do toho jdete s námi.

5 Vítejte na palubě aneb Pre-onboarding

Skvěle, plácli jsme si na spolupráci. Smlouvu u nás můžete podepsat v den nástupu, ale jestli už se nemůžete dočkat, připravíme ji k podpisu i dřív. A rovnou můžete nasát informace na dobrém kafi s někým z budoucího týmu.

6 Hurá, váš první den v Seznamu

Každý začátek měsíce vítáme všechny nováčky u nás na centrále v Praze. Vyřešíme potřebnou administrativu, předáme vám techniku, seznámíme vás s kolegy a nakonec vás provedeme po našem labyrintu.

7 Adaptace aneb jééé, funguje to!

Na začátku to vypadá možná trochu chaoticky, ale nebojte, máme promakaný systém školení pro každou pozici, takže co neumíte, rádi naučíme.

8 Umíte vše levou zadní? Pak je tu interní vzdělávání

Po rozpačitém začátku jste už profíci v oboru, gratulujeme. A protože umět všechno je nuda, náš tým trenérů vám rád poradí s dalším rozvojem. A nabídka je nekonečně bohatá, vybrat si můžete z našeho e-learningu nebo školení přímo na míru.

Časté dotazy

Jak vypadá Kontejnerizace a Orchestrace?

Pracujeme s Dockerem a Kubernetem pro správu a škálování aplikací v kontejnerizovaných prostředích. Zahrnujeme práci s Ansible a Terraform pro automatizaci konfigurací.

Jak řešíme IT Bezpečnost a Cloudová řešení?

Zajišťujeme bezpečnost systémů a pracujeme na cloudových řešení a infrastruktuře. Využíváme znalosti technologií jako Linux, Docker, Kubernetes, Gitlab, Nginx pro vytváření bezpečných a škálovatelných cloudových aplikací.

Jak pracujeme s Big Data?

Využíváme Spark, Hadoop, Flink a Kafka pro zpracování a analýzu velkých objemů dat. Implementujeme Elasticsearch pro full-textové vyhledávání v aplikacích.

Zajímá vás tato pozice?

Zajímá vás tato pozice?