Junior Data Scientist
Прямой работодатель VTB ( vtb.ru )
Москва, Россия
Джуниор
23 января
Удаленная работа • Работа в офисе
Опыт работы от 1 года до 3х лет
Опыт работы от 1 года до 3х лет
Короткая ссылка: gkjb.ru/hg3w
Описание вакансии
Наша команда занимается разработкой моделей в следующих направлениях:
- Реализация RAG-пайплайнов для поиска по внутренним Базам Знаний: разработка и дообучение отдельных компонентов пайплайна (эмбеддеры, реранкеры, классификаторы). Подбор архитектур RAG для решения задачи. Доработка алгоритмов препроцессинга документов и контента баз знаний для загрузки в векторные БД. Замер качества работы всего пайпалйна и его отдельных компонентов. Развертывание тестовых RAG-пайпланов для тестирование пользователями и их доработка, исходя из обратной связи
- Извлечение информации из документов: извлечение информации из внутренних нормативных документов, обращений ФОИВ (извлечение сущностей, DocQA, валидация качества и корректности фрагментов документа)
Требования
- высшее физико-математическое / техническое / экономическое образование
- основы линейной алгебры, теории вероятностей и математической статистики
- основы машинного обучения и методов анализа данных
- основы обработки естественного языка
- основы стандартного стека: pandas, pytorch, transformers, PEFT
- основы SQL, git
- чтение технической и научной литературы в предметной области на английском языке
Необязательно, но будет плюсом:
- умение работать с Hadoop, Spark
- умение работать с OpenSearch
- умение работать с langchain/llamaindex/haystack
- базовые знания принципов работы LLM, устройства RAG-сервисов
Условия работы
- гибридный график, расположение офиса: Москва-сити, Башня Евразия, м. Деловой центр / Выставочная
- оформление в Т1 Иннотех, аккредитованную ИТ-компанию, в качестве основного места работа. Оформление в Банк в качестве совместителя
- ДМС после испытательного срока (3 месяца)
- отпуск 31 день
- оплачиваются конференции и обучение