Data Scientist
Москва, РоссияДжуниор • Миддл
Релокация • Удаленная работа
Опыт работы от 1 года до 3х летот 250 000 до 350 000 ₽
Опыт работы от 1 года до 3х летот 250 000 до 350 000 ₽
Есть файл резюме (защищен)
Короткая ссылка: gkjb.ru/gqW7
О себе
На данный момент Data Scientist.
Мои компетенции и опыт
Data Scientist с опытом работы в программировании на Python и с навыками в области машинного обучения, включая классическое и глубокое обучение, компьютерное зрение, обработку естественного языка. За плечами 10+ лет опыта в анализе данных и знания в области статистики, теории вероятностей, линейной алгебры и математического анализа.
Имею высшее техническое образование в сфере информационных технологий, а также опыт работы как в проектных, так и в нефтегазовых компаниях. Успешно участвовал в проектах от инициации до завершения. Умею слаженно работать в команде, при этом отличаясь самостоятельностью. Эффективно применяю свои технические навыки для решения поставленных задач.
Опыт работы:
1) Imperia Food Co.
Реализовал проект "Программно-технический комплекс по контролю качества выпускаемой продукции".
В рамках проекта совместно с локальной командой провёл анализ бизнес-процессов предприятия, внес вклад в составление технического задания, обучил модель машинного обучения.
Результаты:
- провел анализ бизнес-процессов компании и определены требования к модернизации процесса отбраковки продукции;
- собрал и разметил датасет хлебобулочной продукции (более нужен доступ к резюме фотографий);
- обучил модель машинного обучения для классификации продукции с браком производства (350 эпох), метрики: PR = нужен доступ к резюме нужен доступ к резюме
2) Elbrus Coding Bootcamp
1. Разработал проект "Сервис по поиску аналогов лекарственных средств и лекарств по описанию симптомов".
В рамках проекта я занимался парсингом текстовой базы данных, обработкой текста, сбором данных для обучения модели компьютерного зрения. Собрал Docker образы и задеплоил бота в облачном сервисе, обеспечив доступность и функциональность для конечных пользователей.
Результаты:
- спарсил > нужен доступ к резюме строк с описанием лекарств;
- векторизовал текст (названия, описание);
- определил 40 классов лекарств, было собрано 2468 фотографий (после аугментации 5916);
- обучена модель (250 эпох), метрики: PR (all classes) = нужен доступ к резюме нужен доступ к резюме ;
- разработан телеграмм-бот;
- собрал Docker образы для запуска контейнеров в облачном сервисе;
- реализованы дополнительные функции с использованием предобученных моделей и готовых библиотек (технологии STT и TTS);
- развернул сервис в облачном сервисе.
Стек технологий: Python, модель Sentence Transformer Infloat ME5 Large, Yolo v5, OpenAI Whisper, FAISS, Docker, PostgreSQL, Yandex SpeechKit.
2. Реализовал рекомендательную систему по подбору сериалов на базе Streamlit-приложения.
В проекте я выполнил парсинг текстовой базы данных, содержащей информацию о более чем 5000 сериалах, реализовал максимально быстрый поиск по базе и успешно задеплоил систему с использованием веб-сервиса, обеспечивая эффективный и удобный доступ.
Результаты:
- спарсено нужен доступ к резюме строк с описанием сериалов;
- векторизован текст (названия, описание);
- реализован поиск по векторному сходству и поиск с использованием библиотеки FAISS;
- проект задеплоен на сервисе нужен доступ к резюме
Стек технологий: Python, модель Sentence Transformer MiniLM-L12-v2, Streamlit.
3. Разработал Streamlit-приложение для детекции морских судов на аэрокосмических снимках.
В рамках проекта я обучил модель семейства Yolo для распознавания судов на аэрофотоснимках. Кроме того, успешно задеплоил модель с использованием веб-сервиса, обеспечив поддержку загрузки нескольких файлов одновременно, что увеличило удобство и эффективность работы пользователей с сервисом.
Результаты:
- обучена модель Yolo v8 для детекции судов, в качестве датасета был взят набор данных с Kaggle;
- проект задеплоен на сервисе нужен доступ к резюме
Стек технологий: Python, модель Yolo v8, Streamlit.
Есть файл резюме (защищен)
Интересные кандидаты
- ад
аналитик данных, data scientist
remote parttime office - Ссrelocate remote parttime office
- Са
Стажёр аналитик данных Data Scientist
remote parttime office - Са
Стажер/Младший аналитик данных Data Analyst
remote parttime - СА
Стажер Аналитик данных / Data Analyst Intern
remote parttime office - Спremote parttime office
- Спremote parttime office
- Спrelocate remote parttime office
- СDremote office
- СDremote office
Мы используем куки, потому что без кук наш сайт не работал бы, другие сайты не работали бы, да и вообще весь
интернет не работал бы