Middle/senior NLP-специалист
Прямой работодатель 2ГИС ( 2gis.ru )
Опыт работы от 3 до 5 лет
Привет! Мы расширяем NLP-команду 2ГИС и ищем несколько дата-сайентистов уровня middle или senior.
Задачи
У нас два больших проекта — товары/услуги в продукте и user generated content.
В товарах занимаемся дедупликацией товаров между различными компаниями, нормализацией, извлечением характеристик товаров, классификацией, модерацией, обнаружением аномалий и самим поиском по товарам. Подробнее о решаемых задачах можно посмотреть в докладе и на VC.
В UGC-задачах — извлечение аспектов из отзывов компаний (aspect extraction и aspect sentiment classification), модерация отзывов, суммаризация (задача multi-document summarization).
Есть ещё и прикладные исследования — adversarial attacks для дополнительного тестирования моделей, интерпретируемость моделей, confidence models.
Стек
Пишем на pytorch и иногда на tensorflow, делаем юнит-тесты, используем CI, Jenkins, Git, мёрж-реквесты и ревью — всё, что нужно для командной работы.
Требования
- Опыт работы с PyTorch и/или TensorFlow + NumPy, sklearn.
- Хорошее знание Python.
- Знание инструментов разработки и CI/CD — Git, Jenkins, GitLab, Jira.
- Опыт работы над NLP-задачами от двух лет.
- Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART и т. п.). А также классических методов —классические языковые модели, tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM.
- Опыт использования библиотек — allennlp, kenlm, transformers, nltk, pyonmttok, vowpalwabbit, gensim и т.п.
Будет плюсом опыт участия в соревнованиях по машинному обучению (Kaggle/Boosters.pro и т.п.).
Условия
- Белая зарплата и ДМС
- Удобный для тебя график работы
- Удалённая работа
- Или комфортные офисы в Новосибирске (помогаем с релокацией)
- Техника и ОС — на твой выбор (для удалёнки — доставим и поможем настроить)