LLM engineer

Прямой работодатель  Flumen ( flumen.tech )
Санкт-Петербург, Россия
Сеньор
Аналитика, Data Science, Big Data • Python • Инженер • Исследователь • Data scientist • Разработчик • Natural Language Processing (NLP) • ML/AI • SaaS/PaaS
11 октября
Удаленная работа
Опыт работы любой
от 400 000 до 600 000 ₽
Работодатель  Flumen
Описание вакансии

Локация и формат работы: полная удалёнка (в том числе вне РФ), полная занятость.

Вилка: 400-600 тыс. руб. на руки + 0.25-1.5 % доля.

 

О нас

Мы — стартап с собственным финансированием, базируемся в Санкт-Петербурге, но планируем в скором времени переехать в Сан-Франциско. Наша миссия — создать инфраструктуру для искусственного интеллекта, расширяя его возможности и усиливая творческий потенциал людей. Сейчас мы занимаемся AI-first текстовым редактором. Работа с текстом - это очень важная часть жизни людей, и у нас есть шанс сделать так, чтобы она вся протекала через Flumen.

 

Чем нужно будет заниматься

  • Проектировать и разрабатывать приложение на основе LLM, заниматься разработкой агентов, промпт-инжинирингом, оптимизацией запросов по API и функциональностью чата.
  • Строить и оценивать качество системы Retrieval-Augmented Generation (RAG).
  • Писать качественный, поддерживаемый код с использованием AI-решений для написания кода (такие как Cursor, Aider, Canvas от OpenAI и др.) в условиях высоких темпов разработки.
  • Работать в режиме частых релизов и проверок гипотез для улучшения продукта.

Требования

  • Опыт разработки RAG-систем, понимание различных подходов, их преимуществ и недостатков.
  • Опыт проектирования приложений, знание паттернов проектирования (Knowledge mapping, OOP, DDD) и большой интерес к созданию LLM-driven продуктов.
  • Опыт работы с API LLM (OpenAI, Anthropic, Gemini), оптимизация запросов и уменьшение задержек, выбор наиболее подходящих моделей и подходов для разных задач.
  • Опыт работы с prompt engineering и fine-tuning LLM.
  • Знание стека LLMOps (LangChain, LLamaIndex, LLMLite, Langfuse), векторных баз данных.
  • Опыт работы с локальными моделями LLM.
  • Уверенное владение Python, опыт работы с микросервисами на FastAPI.
  • Практический опыт работы с Docker.
  • Умение придумывать элегантные решения для сложных комплексных задач.

Будет плюсом

  • Продуктовое мышление: понимание сильных и слабых сторон приложений, умение принимать решения с учетом потребностей пользователей.
  • Опыт работы с OCR.
  • Опыт работы с облачными технологиями (Yandex Cloud, GCP, GCS, AWS S3).

Этапы отбора

  1. Техническое интервью.
  2. Продуктовое интервью и на совместимость с командой

Условия

  • График работы: с 9:00 до 18:00 (по МСК).
  • Оформление в соответствии с ТК РФ (первый месяц возможна работа по ГПХ), возможна оплата по крипте.
  • Работа по методологиям Agile и Lean Startup, быстрые темпы разработки.

Загрузка формы отклика...