Site Reliability Engineering (SRE) / DevOps на проект
Центр развития ИТ-образования
( edu.mipt.ru )
Аккаунт зарегистрирован с email *@it-edu.com
Опыт работы от 3 до 5 лет
Больше трех лет минимальной командой разрабатываем свою образовательную платформу - LMS. До текущего момента фокусировались на функциональности (закрывали потребности бизнеса), теперь фокус на автоматизации разработки, выдерживании нагрузки (uptime) и показателях. Ищем человека, который поможет настроить автоматизацию разработки и масштабирование (20к+ активных пользователей в онлайне), а дальше будет следить за тем, чтобы инцидентов было как можно меньше.
Стек: Php, Vue.js, Python, MariaDB, MongoDB, Nginx, Kubernetes, Docker, Grafana, Prometeus, Zabbix, Redis, Memcached, GitLab
Чем предстоит заниматься:
- Администрирование Linux серверов (Debian, Centos);
- Настройка, тюнинг производительности и работы по отказоустойчивости, в первую очередь речь о Nginx, Php, MariaDB
- Взаимодействие с разработчиками;
- Развертывание/кластеризация сервисов (Kebernetes);
- Работа с бэкапами;
- Мониторинг, оптимизация инфраструктуры и сервисов;
- Выявление проблем и “узких мест” системы, их решение;
- Оперативная реакция на инциденты;
- Автоматизация регулярных задач.
У нашего идеального кандидата:
- опыт работы SRE/DevOps, системным/сетевым администратором, инженером IT-эксплуатации от 3-х лет;
- готовность работать с нашим стеком (смотри выше), а иногда настраивать все с нуля;
- базовый опыт программирования на любом языке;
- высокий уровень самостоятельности.
- Офис расположен по адресу: Долгопрудненское шоссе,3, БЦ Физтехпарк (МЦД Новодачная, м. Физтех).
- График работы - обсуждается
- Оформление: срочный трудовой договор в соответствии ТК РФ на 2-3 месяца, с возможностью пролонгации.