Výzkumník strojového učení pro zpracování řeči

Praha

Pro muže i ženy Absolventi OZP Plný úvazek

Náš tým se specializuje na vývoj a zdokonalování technologií syntézy a automatického rozpoznávání řeči. Pracujeme na celé škále úkolů – od tvorby a validace dat, přes trénování modelů, až po jejich evaluaci a optimalizaci. Naše modely trénujeme na vlastním výkonném GPU clusteru. Součástí naší práce je také pravidelný prostor pro osobní a profesní rozvoj.

Jsme součástí výzkumného oddělení zaměřeného na oblast vyhledávání, což nám poskytuje možnost pracovat na široké škále projektů v oblasti strojového učení. Problematiku řešíme kolektivně a pro modelování využíváme nejmodernější postupy a technologie. Ačkoliv se zaměřujeme především na aplikovaný výzkum, snažíme se věnovat i publikování: z nedávné doby můžeme zmínit dva NLP články: CWRCzech: 100M Query-Document Czech Click Dataset and Its Application to Web Relevance Ranking a Some Like It Small: Czech Semantic Embedding Models for Industry Applications.

S čím se budete potkávat

GitLab
Linux
Pandas
Python
PyTorch
Spark

Základní předpoklady

  • Praxe v oblasti zpracování řeči.
  • Umíte programovat v jazyce Python a navrhovat efektivní algoritmy.
  • Orientujete se v problematice strojového učení.
  • Ovládáte základy Linuxu.

Kdo bude váš nadřízený

Jakub Náplava

Vedoucí týmu výzkumu

V Seznamu vedu jeden z fulltextových výzkumných týmů. Mám za sebou doktorát z ÚFALu a pětiletou zkušenost s machine learningovými modely z IBM. V Seznamu nejvíc oceňuju, že se tu můžu věnovat širokému spektru zajímavých úloh, na které dostaneme dostatek času k jejich důkladnému prozkoumání. Líbí se mi, že můžeme přicházet s vlastními výzkumnými otázkami a že výsledky naší práce se rychle nasadí do ostrého provozu. Máme k dispozici vlastní GPU cluster a in-house anotátoři nám rychle připraví potřebná data. A v neposlední řadě tu mám skvělé kolegy, se kterými si rádi zahrajeme stolní fotbálek nebo deskovky.

Součástí práce výzkumníka je

  • Podílení se na formování zadání výzkumné úlohy a analýzy problému
  • Příprava a analýza dat – Python, pandas, Polars
  • Učení ML modelů – hlavním cílem je mít co nejlepší modely pro automatické rozpoznání řeči a její syntéze, což mj. zahrnuje i spoustu menších modelů
  • Aplikace state-of-the-art metod pro zpracování řeči
  • Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
  • Vyhodnocení navržených řešení, interpretace a prezentace výsledků
  • Předávání modelů a kódu do produkce např. pomocí Docker containerů

Co nabízíme

  • Zajímavou a rozmanitou práci, řešení netriviálních problémů
  • Velká data, možnost anotací
  • Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
  • Vlastní výkonné servery, dedikovaná výpočetní kapacita
  • Sdílení znalostí a zkušeností napříč Seznamem
  • Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
  • Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code

Co je v Seznamu taky bezva

Dny volna navíc
K dovolené ještě dalších 5 dnů? No fakt. Ať už chcete třeba jen lenošit nebo vás hezké počasí naopak žene ven, užijte si volno podle vašich představ.
Dovolená o týden delší
Dovolené není nikdy dost. Proto vám ke standardním 4 týdnům dovolené přidáme ještě další týden.
Home office lze dohodnout
V kanceláři bychom vás přeci jen rádi občas potkali, ať se nedivíme, kde jste se u nás vzali. Ale že jde někdy práce líp od ruky z domácího prostředí, tomu taky rozumíme. Domluvte se s nadřízeným a jistě najdete dobrý kompromis.
Interní vzdělávání
U nás se nudit nebudete. Osobnímu i profesnímu rozvoji fandíme a nabízíme nekonečně příležitostí k seberozvoji a vzdělávání, včetně pomoci od profesionálních trenérů.
Konference
Načerpejte nové inspirace a trendy, a to buď v publiku nebo rovnou na pódiu.
Ovoce do práce
Nálož vitamínů 2x měsíčně, občas i s nějakým chuťovým překvápkem.
Pet friendly
Že je maskot Seznamu pes, není úplná náhoda. Čtyřnohé kolegy vítáme, dokonce s námi chodí i na porady.
Pružná pracovní doba
Někdo je ranní ptáče a nejvíc práce udělá se svítáním, někdo zas sova a nejvíc klidu na práci má večer. Důležité jsou pro nás kvalitní výsledky, ne váš rozvrh hodin.
Sportu zdar
V Praze a Brně si můžete dát do těla v naší posilovně, ve velkých pobočkách i na hodinách jógy.
Technika na přání
Apple, Linux nebo Windows? Všechno máme a k dispozici dáme. A pokud už jste zvyklí na své vymazlené miláčky, pracujte klidně na vlastním zařízení a my vám budeme finančně přispívat.

Kde budete pracovat

Praha

Seznam.cz, a.s.
Radlická 3294/10
150 00 Praha 5 – Smíchov
Naše centrála je velmi dobře dostupná, můžete dorazit metrem na lince B, jednou z nesčetných tramvají nebo autobusem. Autobusové nádraží Na Knížecí je hned za rohem.
Metro
B – Anděl
Tramvaj
4 5 7 9 10 12 15 16 20
Bus
120 123 137 167 191

Kudy vede cesta do Seznamu

Koukněte, jak vypadá výběrko, pohovor nebo první den v Seznamu, ať se vaše cesta na vysněnou pozici obejde bez zbytečných škobrtnutí.

1 Zaslání životopisu

Dejte nám o sobě vědět, i když třeba hned nevíte, co by vám slušelo za pozici. Míst máme spousty a HR profíků taky, určitě něco vymyslíme.

2 Jak probíhá výběrko

Pokud vaše kvality pasují na pozici, zavoláme vám a probereme vzájemné představy o nástupu, náplni práce nebo finančním očekávání. Máme shodu? Rádi vás pozveme na první (nebo druhé) kolo pohovoru.

3 A je tu samotné výběrko

Výběrka probíhají online i offline, ale nebojte se žádného výslechu, je to spíš profesní pokec a upřímnosti si ceníme.

4 Je to tady! Nabídka práce

Do týmu skvěle pasujete a rádi bychom vás pasovali na Seznamáka. E-mailem vám proto pošleme oficiální nabídku práce, kde znova shrnujeme důležité body spolupráce. Všechno souhlasí? Prima, dejte nám vědět, že do toho jdete s námi.

5 Vítejte na palubě aneb Pre-onboarding

Skvěle, plácli jsme si na spolupráci. Smlouvu u nás můžete podepsat v den nástupu, ale jestli už se nemůžete dočkat, připravíme ji k podpisu i dřív. A rovnou můžete nasát informace na dobrém kafi s někým z budoucího týmu.

6 Hurá, váš první den v Seznamu

Každý začátek měsíce vítáme všechny nováčky u nás na centrále v Praze. Vyřešíme potřebnou administrativu, předáme vám techniku, seznámíme vás s kolegy a nakonec vás provedeme po našem labyrintu.

7 Adaptace aneb jééé, funguje to!

Na začátku to vypadá možná trochu chaoticky, ale nebojte, máme promakaný systém školení pro každou pozici, takže co neumíte, rádi naučíme.

8 Umíte vše levou zadní? Pak je tu interní vzdělávání

Po rozpačitém začátku jste už profíci v oboru, gratulujeme. A protože umět všechno je nuda, náš tým trenérů vám rád poradí s dalším rozvojem. A nabídka je nekonečně bohatá, vybrat si můžete z našeho e-learningu nebo školení přímo na míru.

Časté dotazy

Jak v týmu Výzkumu spolupracujeme s datovými centry?

Seznamácká interní datová centra se starají o provoz několika výzkumných Hadoop clusterů, které nám umožňují rychlé zpracování velkých a rychlých dat. Dále pro nás provozují několik GPU clusterů, ty pak umožňují trénink a inferenci stovek modelů strojového učení, včetně LLM modelů, které jsou základem služeb Seznamu.

Jaké využíváme ve Výzkumu technologie?

Na projektech využíváme převážně Python (Numpy, Pandas, Polars, Dask, Scipy, PyTorch a další), Spark, Docker, Git. 

S jakými školami za tým Výzkumu spolupracujeme?

Jsme v kontaktu s technickými fakultami skoro všech českých vysokých škol. Tradičními partnery jsme už s ČVUT, VUT, MUNI a UK. Vybrané výzkumné skupiny aktivně podporujeme (například CIIRC ČVUT), s některými plánujeme společné projekty (třeba s VUT, ČVUT nebo UK). Na MUNI a UK příležitostně přednášíme jako externí lektoři. Samozřejmě podporujeme také neakademickou komunitu jako MLMU, MLPrague a jiné konference a pořádáme i vlastní odborná setkání a meetupy.

Zajímá vás tato pozice?

Zajímá vás tato pozice?