ИИ, агенты и инфраструктура

Тег: инфраструктура ИИ

Будущее MCP

Посмотрел доклад David Soria Parra из Anthropic про будущее MCP. В 2026 году узким местом для AI-агентов становятся уже не столько модели, а связность между разными компонентами системы: как агент подключается к инструментам, данным, приложениям, какие права доступа у него есть, как вокруг всего этого строить UX и бизнес-сценарии. Основые тезисы из доклада Дэвида с моими дополнениями.

Сколько на самом деле стоит GenAI в продакшене

Разбираемся, сколько на самом деле стоит GenAI-система в продакшене: токены, GPU, Yandex Cloud, self-hosted модели, зарплаты инженеров, эксплуатация и полная стоимость владения.

Установка DCGM Exporter в локальный Kubernetes-кластер с NVIDIA GPU

Установка NVIDIA DCGM Exporter в локальный Kubernetes-кластер под WSL2: как обойти ошибку ServiceMonitor, настроить runtimeClassName и проверить сбор GPU-метрик.

Kubernetes с доступом к GPU внутри WSL2 на ноутбуке с RTX

Локальный Kubernetes с GPU внутри WSL2: K3s + NVIDIA runtime + device plugin. Разбор проблемы с NVML/device discovery и практическое решение через runtimeClass.