Привет, я Андрей
Инженер и иногда руководитель – пишу код, проектирую системы и разрабатываю продукты вокруг AI.
Сейчас работаю в Северстали над платформой генеративного искусственного интеллекта: локальные LLM, GPU-инференс на NVIDIA H200/H100/A100, маршрутизация запросов между моделями, безопасное исполнение агентских инструментов и многое другое. В роли архитектора и техлида помогаю командам внедрять AI в свои проекты и строить инфраструктуру для больших языковых моделей.
До этого в роли CTO в ПланФакте (#1 SaaS в сфере финансового учёта для малого и среднего бизнеса) выстроил инженерную организацию, сформировал delivery-процессы и помог командам стабилизировать и отмасштабировать сервисы. До ПланФакта работал в Берлине в Statice.ai над ML-платформой для анонимизации данных. А ещё раньше запускал первые кросс-функциональные команды в X5, первый медиа-ресурс X5 Media.
Если смотреть ещё дальше, за 15 лет успел побыть CTO финтех-стартапа, техлидом, senior-разработчиком и обычным инженером. Работал в финтехе, медиа, e-commerce и ML.
Этот блог — место, где я пишу заметки о том, что изучаю и над чем работаю: LLM-инфраструктура, агенты, разработка в эпоху AI. Пишу в основном для себя, но буду рад, если статьи окажутся полезными кому-то ещё.
Написать мне
Посмотреть код
Подписаться на блог