LLM engineer
Прямой работодатель Flumen ( flumen.tech )
Опыт работы любойот 400 000 до 600 000 ₽
Локация и формат работы: полная удалёнка (в том числе вне РФ), полная занятость.
Вилка: 400-600 тыс. руб. на руки + 0.25-1.5 % доля.
О нас
Мы — стартап с собственным финансированием, базируемся в Санкт-Петербурге, но планируем в скором времени переехать в Сан-Франциско. Наша миссия — создать инфраструктуру для искусственного интеллекта, расширяя его возможности и усиливая творческий потенциал людей. Сейчас мы занимаемся AI-first текстовым редактором. Работа с текстом - это очень важная часть жизни людей, и у нас есть шанс сделать так, чтобы она вся протекала через Flumen.
Чем нужно будет заниматься
- Проектировать и разрабатывать приложение на основе LLM, заниматься разработкой агентов, промпт-инжинирингом, оптимизацией запросов по API и функциональностью чата.
- Строить и оценивать качество системы Retrieval-Augmented Generation (RAG).
- Писать качественный, поддерживаемый код с использованием AI-решений для написания кода (такие как Cursor, Aider, Canvas от OpenAI и др.) в условиях высоких темпов разработки.
- Работать в режиме частых релизов и проверок гипотез для улучшения продукта.
Требования
- Опыт разработки RAG-систем, понимание различных подходов, их преимуществ и недостатков.
- Опыт проектирования приложений, знание паттернов проектирования (Knowledge mapping, OOP, DDD) и большой интерес к созданию LLM-driven продуктов.
- Опыт работы с API LLM (OpenAI, Anthropic, Gemini), оптимизация запросов и уменьшение задержек, выбор наиболее подходящих моделей и подходов для разных задач.
- Опыт работы с prompt engineering и fine-tuning LLM.
- Знание стека LLMOps (LangChain, LLamaIndex, LLMLite, Langfuse), векторных баз данных.
- Опыт работы с локальными моделями LLM.
- Уверенное владение Python, опыт работы с микросервисами на FastAPI.
- Практический опыт работы с Docker.
- Умение придумывать элегантные решения для сложных комплексных задач.
Будет плюсом
- Продуктовое мышление: понимание сильных и слабых сторон приложений, умение принимать решения с учетом потребностей пользователей.
- Опыт работы с OCR.
- Опыт работы с облачными технологиями (Yandex Cloud, GCP, GCS, AWS S3).
Этапы отбора
- Техническое интервью.
- Продуктовое интервью и на совместимость с командой
Условия
- График работы: с 9:00 до 18:00 (по МСК).
- Оформление в соответствии с ТК РФ (первый месяц возможна работа по ГПХ), возможна оплата по крипте.
- Работа по методологиям Agile и Lean Startup, быстрые темпы разработки.