Interr.io — продуктова AI-компанія, яка генерує дизайн інтер'єрів. Ми створюємо продукт, який перетворює фотографії порожніх приміщень на фотореалістичні дизайнерські концепти на основі текстових запитів користувачів.
Наша ціль — створити найрозумнішого автоматичного дизайнера на ринку.
Ми шукаємо ML Engineer, який побудує надійну інфраструктуру для запуску та масштабування цих мультимодальних моделей у продакшені, забезпечуючи низьку затримку та високу якість генерації.
Місія позиції:
Побудувати надійну, продуктивну та масштабовану ML-інфраструктуру, яка дозволить interr.io:
- Запускати та підтримувати ML/LLM-функції в продакшені.
- Забезпечувати стабільну якість результатів (боротьба з галюцинаціями).
- Оптимізувати latency, cost та reliability системи.
- Швидко експериментувати та оновлювати моделі.
Твоя головна мета: створити «серце» продукту — ML-системи, які працюють швидко, точно та стабільно.
Обов'язки та зони відповідальності:
- Production ML: Розгортання та підтримка ML/LLM-моделей у продакшені (перехід від Notebooks до мікросервісів).
- LLM Engineering: Робота з API (OpenAI, Gemini), open-source моделями та їхні fine-tuning.
- RAG Architecture: Побудова повного циклу RAG: embeddings, векторні бази (Pinecone/Qdrant), retrieval стратегії.
- Data Engineering: Побудова ETL/ELT-пайплайнів для підготовки даних під ML.
- Integration: Тісна інтеграція моделей із backend-сервісами (FastAPI/Flask).
- Optimization: Зниження затримок (latency) та вартості токенів, робота з пропускною здатністю (throughput).
- Evaluation: Створення системи автоматичних тестів і бенчмарків для оцінки якості моделей і промптів.
У нас відбудеться метч, якщо ти маєш:
- Досвід: 2.5+ років у ML Engineering / Data Science / NLP.
- Продакшн-досвід впровадження моделей.
- Python Strong: Глибокі знання Python (pandas, numpy, scikit-learn, pydantic).
- LLM Stack: Досвід з OpenAI/Anthropic API, HuggingFace, розуміння принципів Prompt Engineering.
- RAG & Vector DBs: Практичний досвід із векторним пошуком (Pinecone, Qdrant, Weaviate).
- DevOps Skills: Docker, Kubernetes (базово), CI/CD. Ти маєш розуміти, як живе твій код на сервері.
- Metrics: Розуміння, як оцінювати моделі (ROC, precision/recall, LLM eval frameworks).
Буде плюсом:
- Досвід із LangChain або LlamaIndex.
- Знання методів оптимізації (quantization, distillation, batching).
- Досвід роботи з GPU та хмарними провайдерами (AWS/GCP/Azure).
- Розуміння архітектури високонавантажених систем.
🤝Ми пропонуємо:
- Вплив: Ти будуєш архітектуру з нуля. Твої рішення визначають майбутнє продукту.
- Розвиток: Прямий шлях до позицій Lead ML Engineer або AI Architect.
- Команду: Пряма комунікація з фаундерами та сильною технічною командою.
- Ремоут формат.
Процес найму: Call з рекрутером > Intro-call із менеджером > Тестове завдання > Технічне інтерв'ю > Офер.
