Junior Data Scientist / ML Engineer
Самара, РоссияДжуниор
Удаленная работа • Частичная занятость
Опыт работы менее 1 года
Опыт работы менее 1 года
Есть файл резюме (защищен)
Короткая ссылка: gkjb.ru/gp6J
О себе
На данный момент Junior Data Scientist / ML Engineer.
Мои компетенции и опыт
Контакты:
Github: нужен доступ к резюме
Telegram: нужен доступ к резюме
Телефон: нужен доступ к резюме
Хард скиллы:
-Языки программирования: Python
-ML-библиотеки: Scikit-learn, PyTorch, TensorFlow, XGBoost, LightGBM
-Инструменты для анализа данных: pandas, NumPy, Matplotlib, Seaborn
-Работа с базами данных: SQL (PostgreSQL)
-Контроль версий: Git (GitHub, GitLab CI)
-Инструменты разработки: Jupyter Notebook, MLflow, CI/CD
Софт скиллы:
-Коммуникабельность: Способен эффективноучаствовать в обсуждениях и задавать вопросы.
-Адаптивность: Гибкость в подходе к решению задач и способность быстро адаптироваться к изменениям.
-Внимательность к деталям: Способность обращать внимание на мелочи, которые могут повлиять на результат работы. Тщателен в проверке своего кода и других задач.
Примеры проектов:
House Price Prediction (GitHub)
Цель проекта: Разработка модели для предсказания цен на жилье с использованием алгоритмов машинного обучения на данных из соревнования Kaggle House Prices - Advanced Regression Techniques.
Технологии: Python, Pandas, NumPy, Scikit-learn, XGBoost, Matplotlib, Seaborn, MLflow.
Основные достижения:
Провел исследовательский анализ данных (EDA) для выявления ключевых характеристик, влияющих на цену жилья.
Выполнена предобработка данных.
Разработал и обучил модели машинного обучения, включая Linear Regression, RandomForestRegressor, XGBoost, и LightGBM.
Использовал GridSearchCV для оптимизации гиперпараметров, достигнув высокой точности предсказания.
Внедрил MLflow для управления экспериментами и отслеживания моделей.
Модель XGBoost достигла уровня точности с минимальной средней квадратичной ошибкой (RMSE).
Time_Series (GitHub)
Цель проекта: Прогнозирование продаж в магазинах на основе временных рядов.
Технологии: Python, Pandas, Scikit-learn, LightGBM.
Основные достижения:
Произведен EDA для подробного рассмотрения полученных данных.
Предподготовка данных к использованию Prophet.
Работа в процессе (WIP).
MovieLens-Dataset(GitHub)
Цель проекта: Создание рекомендательной системы на основе отзывов пользователей на примере фильмов.
Технологии: Python, Pandas, Seaborn, Scikit-learn.
Основные достижения:
Первичный анализ данных, обьединение датасетов для подробной оценки.
Произведен исследовательский анализ данных (EDA) для подробного рассмотрения полученных данных и их зависимостей.
Работа в процессе(WIP).
Есть файл резюме (защищен)
Интересные кандидаты
- тQremote parttime office
- сJoffice
- рMremote
- вJremote
- ад
аналитик данных, data scientist
remote parttime office - Ф
Фронтенд-разработчик / HTML-верстальщик
remote parttime - Тд
Технический директор/CTO/Head Of Engineering/CDO
remote office - Тд
Технический директор/CTO/Head Of Engineering/CDO
remote office - Тд
- ТErelocate remote parttime office
Мы используем куки, потому что без кук наш сайт не работал бы, другие сайты не работали бы, да и вообще весь
интернет не работал бы