Data Scientist

Москва, Россия
Джуниор • Миддл
Аналитика, Data Science, Big Data • Oracle BI • Data scientist • Data Science • Machine Learning • Python • SQL • Apache Spark • MSSQL • PostgreSQL
Релокация • Удаленная работа
Опыт работы от 1 года до 3х лет
от 250 000 до 350 000 ₽
Есть файл резюме (защищен)
О себе

На данный момент Data Scientist.

Мои компетенции и опыт

Data Scientist с опытом работы в программировании на Python и с навыками в области машинного обучения, включая классическое и глубокое обучение, компьютерное зрение, обработку естественного языка. За плечами 10+ лет опыта в анализе данных и знания в области статистики, теории вероятностей, линейной алгебры и математического анализа.

Имею высшее техническое образование в сфере информационных технологий, а также опыт работы как в проектных, так и в нефтегазовых компаниях. Успешно участвовал в проектах от инициации до завершения. Умею слаженно работать в команде, при этом отличаясь самостоятельностью. Эффективно применяю свои технические навыки для решения поставленных задач.


Опыт работы: 

1) Imperia Food Co.

Реализовал проект "Программно-технический комплекс по контролю качества выпускаемой продукции".

В рамках проекта совместно с локальной командой провёл анализ бизнес-процессов предприятия, внес вклад в составление технического задания, обучил модель машинного обучения.

Результаты:
- провел анализ бизнес-процессов компании и определены требования к модернизации процесса отбраковки продукции;
- собрал и разметил датасет хлебобулочной продукции (более нужен доступ к резюме фотографий);
- обучил модель машинного обучения для классификации продукции с браком производства (350 эпох), метрики: PR = нужен доступ к резюме нужен доступ к резюме

2) Elbrus Coding Bootcamp

1. Разработал проект "Сервис по поиску аналогов лекарственных средств и лекарств по описанию симптомов".

В рамках проекта я занимался парсингом текстовой базы данных, обработкой текста, сбором данных для обучения модели компьютерного зрения. Собрал Docker образы и задеплоил бота в облачном сервисе, обеспечив доступность и функциональность для конечных пользователей.

Результаты:
- спарсил > нужен доступ к резюме строк с описанием лекарств;
- векторизовал текст (названия, описание);
- определил 40 классов лекарств, было собрано 2468 фотографий (после аугментации 5916);
- обучена модель (250 эпох), метрики: PR (all classes) = нужен доступ к резюме нужен доступ к резюме ;
- разработан телеграмм-бот;
- собрал Docker образы для запуска контейнеров в облачном сервисе;
- реализованы дополнительные функции с использованием предобученных моделей и готовых библиотек (технологии STT и TTS);
- развернул сервис в облачном сервисе.

Стек технологий: Python, модель Sentence Transformer Infloat ME5 Large, Yolo v5, OpenAI Whisper, FAISS, Docker, PostgreSQL, Yandex SpeechKit.

2. Реализовал рекомендательную систему по подбору сериалов на базе Streamlit-приложения.

В проекте я выполнил парсинг текстовой базы данных, содержащей информацию о более чем 5000 сериалах, реализовал максимально быстрый поиск по базе и успешно задеплоил систему с использованием веб-сервиса, обеспечивая эффективный и удобный доступ.

Результаты:
- спарсено нужен доступ к резюме строк с описанием сериалов;
- векторизован текст (названия, описание);
- реализован поиск по векторному сходству и поиск с использованием библиотеки FAISS;
- проект задеплоен на сервисе нужен доступ к резюме

Стек технологий: Python, модель Sentence Transformer MiniLM-L12-v2, Streamlit.

3. Разработал Streamlit-приложение для детекции морских судов на аэрокосмических снимках.

В рамках проекта я обучил модель семейства Yolo для распознавания судов на аэрофотоснимках. Кроме того, успешно задеплоил модель с использованием веб-сервиса, обеспечив поддержку загрузки нескольких файлов одновременно, что увеличило удобство и эффективность работы пользователей с сервисом.

Результаты:
- обучена модель Yolo v8 для детекции судов, в качестве датасета был взят набор данных с Kaggle;
- проект задеплоен на сервисе нужен доступ к резюме

Стек технологий: Python, модель Yolo v8, Streamlit.



Есть файл резюме (защищен)


Интересные кандидаты