Андрей Крисанов

Инженерные заметки о LLM-инфраструктуре, агентах и AI

AI & LLM консалтинг

Помогаю компаниям проектировать и внедрять LLM-сервисы, AI-агентов и инфраструктуру: от проверки гипотез до продакшена.

Мой фокус – не AI-трансформация, а инженерные задачи: создание прототипов для проверки гипотез, расчёт стоимости запуска и эксплуатации продуктов на базе больших языковых моделей, проектирование архитектуры сервисов, доведение продуктов до продакшена.

Чем могу помочь

Аудит идей и текущих решений

Если у вас уже есть AI-инициативы, прототипы или набор гипотез, могу помочь оценить:

  • где LLM действительно уместны
  • где достаточно обычной автоматизации
  • какие есть архитектурные и продуктовые риски
  • что может мешать довести решение до продакшена
  • сколько это примерно будет стоить в разработке и эксплуатации

Результат: короткий технический документ с выводами, рисками и последующими шагами.

Архитектура LLM-систем

Помогу команде спроектировать:

  • интеграцию LLM в продукт
  • корпоративного AI-ассистента
  • RAG-систему и инфраструктуру для работы с документами
  • безопасную работу с внутренними данными
  • агентный workflow
  • корпоративный AI gateway
  • платформу инференса на базе локальных моделей и своих GPU

Результат: архитектурный документ с диаграммами, описанием компонентов и их взаимодействия, а также рекомендациями по реализации.

Прототип или MVP

Цель прототипа – быстро проверить, есть ли польза от потенциального решения, можно ли удовлетворить функциональные и нефункциональные требования, какие проблемы появятся дальше.

Результат: небольшой прототип, который можно показать пользователям или руководству.

Типовые вопросы

С такими задачами ко мне можно приходить:

  • У нас есть идея внедрения LLM в наш продукт / бизнес-процесс. С чего начать? Стоит ли вообще это делать?
  • Хотим разработать корпоративный ChatGPT для сотрудников на своей инфраструктуре. Какой стек технологий выбрать?
  • Нужен ли нам RAG, агент или обычный сервис для решения этой задачи?
  • Как выбрать между внешним провайдером LLM и локальными (self-hosted) моделями?
  • Как не отправить внутренние данные во внешнюю модель?
  • Мы сделали прототип на базе LLM, но он работает нестабильно. Почему?
  • Как нам измерить качество ответов модели или понять что сервис на базе LLM не деградирует со временем?
  • Как снизить стоимость инференса?
  • Мы разработали AI-сервис, как теперь подготовить его к выводу в продакшен?

Когда я не подойду

Скорее всего, я не подойду, если вам нужна только красивая презентация про AI-стратегию в продукте или бизнесе, без инженерной работы и проверки гипотез.

Формат

Наше сотрудничество начинается со знакомства и короткого разбора задачи.

Дальше возможны варианты:

  • разовая консультация
  • технический аудит
  • архитектурный документ и обсуждение его с командой
  • создание интерактивного прототипа
  • сопровождение вашей команды
  • помощь руководителю или продуктовой команде в принятии решений

Контакт

Напишите мне в Telegram. Лучше сразу коротко описать:

  • что хотите сделать
  • есть ли уже прототип
  • какие ограничения важны: безопасность, локальные модели, бюджет, сроки
  • что уже пробовали и где застряли

Я отвечу на все сообщения, но иногда могу задерживаться с ответом из-за загрузки. Если не ответил в течение 2-3 дней, напомните о себе.