Системный инженер HPC кластеров
Прямой работодатель Авито ( career.avito.com )
Опыт работы от 3 до 5 лет
О команде
Команда инфраструктуры, которая обеспечивает весь фундамент Авито - от серверов, до внутреннего облака. Сейчас мы строим новое для себя направление, которое будет отвечать за все HPC под задачи AI и больших языковых моделей (LLM). Команде предстоит с нуля построить инфраструктуру под эти цели на базе платформы HGX/DGX, развивать и поддерживать ее.
Вам предстоит:
- Участвовать в разворачивании HPC кластера для задач ML/AI с нуля;
- Заниматься сопровождением и развитием высокопроизводительных кластеров.
Мы ждём, что вы:
- Понимаете архитектуру высокопроизводительных кластеров и принципы их построения;
- Знаете, что такое Infiniband и как строятся сети для HPC/AI/ML-кластеров;
- Имеете большой опыт работы с планировщиками распределенных вычислений (например Slurm);
- Имеете опыт работы с распределенными файловыми системами;
- Понимаете, как оптимизировать Linux для получения максимальной производительности ML кластера и IB сети;
- Умеете писать скрипты для автоматизации собственных задач
Работа у нас — это:
- Возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
- талантливая команда, готовая поддержать ваши инициативы;
- мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;
- прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;
- личный бюджет на обучение, который можно тратить на книги, курсы и конференции;
- забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
- удалёнка и замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха.