Junior Data Scientist / ML Engineer

Самара, Россия
Джуниор
Аналитика, Data Science, Big Data • Data scientist • Machine Learning • Python
Удаленная работа • Частичная занятость
Опыт работы менее 1 года
Есть файл резюме (защищен)
О себе

На данный момент Junior Data Scientist / ML Engineer.

Мои компетенции и опыт

Контакты:

Github: нужен доступ к резюме

Telegram: нужен доступ к резюме

Телефон: нужен доступ к резюме

 

Хард скиллы:

-Языки программирования: Python

-ML-библиотеки: Scikit-learn, PyTorch, TensorFlow, XGBoost, LightGBM

-Инструменты для анализа данных: pandas, NumPy, Matplotlib, Seaborn

-Работа с базами данных: SQL (PostgreSQL)

-Контроль версий: Git (GitHub, GitLab CI)

-Инструменты разработки: Jupyter Notebook, MLflow, CI/CD

 

Софт скиллы:

-Коммуникабельность: Способен эффективноучаствовать в обсуждениях и задавать вопросы.

-Адаптивность: Гибкость в подходе к решению задач и способность быстро адаптироваться к изменениям.

-Внимательность к деталям: Способность обращать внимание на мелочи, которые могут повлиять на результат работы. Тщателен в проверке своего кода и других задач.

 

Примеры проектов:

House Price Prediction (GitHub)

Цель проекта: Разработка модели для предсказания цен на жилье с использованием алгоритмов машинного обучения на данных из соревнования Kaggle House Prices - Advanced Regression Techniques.

Технологии: Python, Pandas, NumPy, Scikit-learn, XGBoost, Matplotlib, Seaborn, MLflow.

 

Основные достижения:

Провел исследовательский анализ данных (EDA) для выявления ключевых характеристик, влияющих на цену жилья.

Выполнена предобработка данных.

Разработал и обучил модели машинного обучения, включая Linear Regression, RandomForestRegressor, XGBoost, и LightGBM.

Использовал GridSearchCV для оптимизации гиперпараметров, достигнув высокой точности предсказания.

Внедрил MLflow для управления экспериментами и отслеживания моделей.

Модель XGBoost достигла уровня точности с минимальной средней квадратичной ошибкой (RMSE).

 

Time_Series (GitHub)

Цель проекта: Прогнозирование продаж в магазинах на основе временных рядов.

Технологии: Python, Pandas, Scikit-learn, LightGBM.

 

Основные достижения:

Произведен EDA для подробного рассмотрения полученных данных.

Предподготовка данных к использованию Prophet.

Работа в процессе (WIP).

 

MovieLens-Dataset(GitHub)

Цель проекта: Создание рекомендательной системы на основе отзывов пользователей на примере фильмов.

Технологии: Python, Pandas, Seaborn, Scikit-learn.

 

Основные достижения:

Первичный анализ данных, обьединение датасетов для подробной оценки.

Произведен исследовательский анализ данных (EDA) для подробного рассмотрения полученных данных и их зависимостей.

Работа в процессе(WIP).


Специализация
Аналитика, Data Science, Big DataData scientistMachine LearningPython
Отрасль и сфера применения

Уровень
Джуниор

Есть файл резюме (защищен)


Интересные кандидаты