Výzkumník strojového učení pro zpracování řeči
Praha
Náš tým se specializuje na vývoj a zdokonalování technologií syntézy a automatického rozpoznávání řeči. Pracujeme na celé škále úkolů – od tvorby a validace dat, přes trénování modelů, až po jejich evaluaci a optimalizaci. Naše modely trénujeme na vlastním výkonném GPU clusteru. Součástí naší práce je také pravidelný prostor pro osobní a profesní rozvoj.
Jsme součástí výzkumného oddělení zaměřeného na oblast vyhledávání, což nám poskytuje možnost pracovat na široké škále projektů v oblasti strojového učení. Problematiku řešíme kolektivně a pro modelování využíváme nejmodernější postupy a technologie. Ačkoliv se zaměřujeme především na aplikovaný výzkum, snažíme se věnovat i publikování: z nedávné doby můžeme zmínit dva NLP články: CWRCzech: 100M Query-Document Czech Click Dataset and Its Application to Web Relevance Ranking a Some Like It Small: Czech Semantic Embedding Models for Industry Applications.
S čím se budete denně potkávat
Základní předpoklady
- Praxe v oblasti zpracování řeči.
- Umíte programovat v jazyce Python a navrhovat efektivní algoritmy.
- Orientujete se v problematice strojového učení.
- Ovládáte základy Linuxu.
Kdo bude váš nadřízený
Veronika Krejčířová
Vedoucí oddělení výzkumu
Součástí práce výzkumníka je
- Podílení se na formování zadání výzkumné úlohy a analýzy problému
- Příprava a analýza dat – Python, pandas, Polars
- Učení ML modelů – hlavním cílem je mít co nejlepší modely pro automatické rozpoznání řeči a její syntéze, což mj. zahrnuje i spoustu menších modelů
- Aplikace state-of-the-art metod pro zpracování řeči
- Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
- Vyhodnocení navržených řešení, interpretace a prezentace výsledků
- Předávání modelů a kódu do produkce např. pomocí Docker containerů
Co nabízíme
- Zajímavou a rozmanitou práci, řešení netriviálních problémů
- Velká data, možnost anotací
- Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
- Vlastní výkonné servery, dedikovaná výpočetní kapacita
- Sdílení znalostí a zkušeností napříč Seznamem
- Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
- Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
Na co se u nás můžete těšit
Kde budete pracovat
Praha
Radlická 3294/10
150 00 Praha 5 – Smíchov
Metro | B – Anděl |
---|---|
Tramvaj | 1 3 4 5 7 9 10 12 14 15 16 20 21 |
Bus | 123 167 191 |
Kudy vede cesta do Seznamu
Koukněte, jak vypadá výběrko, pohovor nebo první den v Seznamu, ať se vaše cesta na vysněnou pozici obejde bez zbytečných škobrtnutí.
Časté dotazy
Sdílet tuto pracovní nabídku
Podobné pracovní pozice
Python programátor pro CDN
Brno • Pro muže i ženy • OZP • Plný úvazek
Product manager
Brno, Praha • Pro muže i ženy • Plný úvazek
Python vývojář pro Vyhledávání
Bratislava, Brno, Ostrava, Plzeň, Praha, Žilina, Zlín • Pro muže i ženy • Plný úvazek
Vývojář webových frontend aplikací
Praha • Pro muže i ženy • Absolventi • OZP • Plný úvazek
Network Administrator
Praha • Pro muže i ženy • Plný úvazek