⚠︎ Архивная вакансия
Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете  найти актуальные похожие вакансии

Разработчик Data Science NLP (Middle)

Прямой работодатель  Syntelly ( syntelly.com )
Москва, Россия
Джуниор • Миддл
Аналитика, Data Science, Big Data • Data Science • Machine Learning • Python • ML/AI
6 июня
Удаленная работа
Опыт работы от 1 года до 3х лет
от 160 000 до 230 000 ₽
Работодатель  Syntelly
Описание вакансии

Приглашаем в команду разработчика Data Science NLP (Middle)

Работать предстоит над ключевым продуктом Синтелли – платформой искусственного интеллекта для органической и медицинской химии.

Формат работы: удалённо с территории РФ, при желании можно приезжать в офис (Москва / Давыдково)

 

Задачи:

–  Работа с задачами извлечения кастомных именованных сущностей и различными классификациями текстов;

–  Обучение и скоринг моделей;

–  Разработка базовой логики и алгоритмов работы приложения;

–  Необходимые интеграции с внешними сервисами;

–  Тестирование и отладка приложения и отдельных компонентов;

–   Изучение статей и реализациея архитектур моделей, функций потерь, оптимизаторов по статьям;

–  Построение и отладка пайплайнов предобработки данных, обучение инференса моделей;

–  Сборка сервисов, использующих модели

 

Мы ожидаем:

–  Опыт работы: 2-3 года;

–  Уверенное владение Python 3;

–  Продвинутый пользователь Linux;

–  Опыт работы с Git;

–  Опыт с Docker и FastAPI;

–  Опыт работы по крайней мере с одной из нейросетевых библиотек глубокого обучения: PyTorch, TensorFlow/Keras;

–  Опыт квантизации моделей;

– Хорошее представление о задачах NLP, в частности, классификации интентов и извлечения именованных сущностей;

–  Понимание работы механизма внимания, энкодеров/декодеров, sequence2sequence моделей, концепции MLM обучения;

–  Хорошее представление о современных нейросетевых архитектурах (BERT, GPT-3, T5);

–  Опыт обучения кастомных токенайзеров, эмбеддеров, моделей для извлечения сущностей;

–  Базовые навыки работы с библиотеками для обработки текстов (например, nltk, pymystem, pymorphy, spacy, natasha).

 

Плюсом будет:

– Высшее образование в области естественных наук (химия, биология, физика);

– Опыт работы с линейным представлением химических структур SMILES и хемоинформатическими фреймворками (RDKit);

– Опыт работы в других областях глубокого обучения (CV, графовые нейронные сети).

Условия работы и оформления:

  • Оформление по ТК РФ с первого рабочего дня;
  • Полностью официальная заработная плата: оклад по результатам собеседования;
  • ДМС для сотрудников (включая бизнес стоматологию);
  • Испытательный срок - 3 месяца;
  • Соблюдение норм ТК РФ.

Что ждёт интересного:

  • Молодой коллектив, интересная и динамичная работа в наукоемком стартапе;
  • Возможность получения льгот (компания имеет it-аккредитацию);
  • Возможности для профессионального и карьерного роста;
  • Возможность посещения профильных мероприятий - конференции и прохождение курсов, необходимые сотруднику для развития;
  • При посещении офиса (Территориально офис находится в БЦ Верейская Плаза-3):
    - современная оснащенная кухня (в т.ч. кофе-поинты, свежие фрукты, снеки и пр.),
    - собственный тренажерный зал, оборудованный душевыми и раздевалками (+возможность заниматься с тренером, групповые занятия),
    - зона отдыха

Специализация
Аналитика, Data Science, Big DataData ScienceMachine LearningPython
Отрасль и сфера применения
ML/AI
Уровень должности
ДжуниорМиддл