Junior Data Scientist / ML Engineer

Самара, Россия

Джуниор

Аналитика, Data Science, Big Data • Data scientist • Machine Learning • Python

17 сентября в 12:48

Удаленная работа • Частичная занятость
Опыт работы менее 1 года

Есть файл резюме (защищен)

Короткая ссылка: gkjb.ru/gp6J

Пригласить

О себе

На данный момент Junior Data Scientist / ML Engineer.

Мои компетенции и опыт

Контакты:

Github: нужен доступ к резюме

Telegram: нужен доступ к резюме

Телефон: нужен доступ к резюме

Хард скиллы:

-Языки программирования: Python

-ML-библиотеки: Scikit-learn, PyTorch, TensorFlow, XGBoost, LightGBM

-Инструменты для анализа данных: pandas, NumPy, Matplotlib, Seaborn

-Работа с базами данных: SQL (PostgreSQL)

-Контроль версий: Git (GitHub, GitLab CI)

-Инструменты разработки: Jupyter Notebook, MLflow, CI/CD

Софт скиллы:

-Коммуникабельность: Способен эффективноучаствовать в обсуждениях и задавать вопросы.

-Адаптивность: Гибкость в подходе к решению задач и способность быстро адаптироваться к изменениям.

-Внимательность к деталям: Способность обращать внимание на мелочи, которые могут повлиять на результат работы. Тщателен в проверке своего кода и других задач.

Примеры проектов:

House Price Prediction (GitHub)

Цель проекта: Разработка модели для предсказания цен на жилье с использованием алгоритмов машинного обучения на данных из соревнования Kaggle House Prices - Advanced Regression Techniques.

Технологии: Python, Pandas, NumPy, Scikit-learn, XGBoost, Matplotlib, Seaborn, MLflow.

Основные достижения:

Провел исследовательский анализ данных (EDA) для выявления ключевых характеристик, влияющих на цену жилья.

Выполнена предобработка данных.

Разработал и обучил модели машинного обучения, включая Linear Regression, RandomForestRegressor, XGBoost, и LightGBM.

Использовал GridSearchCV для оптимизации гиперпараметров, достигнув высокой точности предсказания.

Внедрил MLflow для управления экспериментами и отслеживания моделей.

Модель XGBoost достигла уровня точности с минимальной средней квадратичной ошибкой (RMSE).

Time_Series (GitHub)

Цель проекта: Прогнозирование продаж в магазинах на основе временных рядов.

Технологии: Python, Pandas, Scikit-learn, LightGBM.

Основные достижения:

Произведен EDA для подробного рассмотрения полученных данных.

Предподготовка данных к использованию Prophet.

Работа в процессе (WIP).

MovieLens-Dataset(GitHub)

Цель проекта: Создание рекомендательной системы на основе отзывов пользователей на примере фильмов.

Технологии: Python, Pandas, Seaborn, Scikit-learn.

Основные достижения:

Первичный анализ данных, обьединение датасетов для подробной оценки.

Произведен исследовательский анализ данных (EDA) для подробного рассмотрения полученных данных и их зависимостей.

Работа в процессе(WIP).

Есть файл резюме (защищен)

Пригласить

Интересные кандидаты