Все гайды

Framework · 15 мин

AI‑пилот с KPI: как не попасть в 80% провалов Gartner

По данным Gartner (2025), больше 40% agentic AI‑проектов будут отменены к 2027 — и это уже в дополнение к общей статистике провалов, где не доходит до прода около 80% инициатив. Проблема не в модели — в постановке. Ниже фреймворк, который помогает AI дойти до прода и принести деньги.

15 мин чтения · Обновлено: апрель 2026

Почему 80% AI‑проектов не взлетают

Мы видим один и тот же паттерн: совет директоров требует «внедрите AI». Команда выбирает красивый use case (генерация описаний товаров, например), делает демо, все хлопают, через 3 месяца совет спрашивает «где выручка?» — и пилот тихо умирает.

Причины, которые мы видим чаще всего:

  • Нет зашитой метрики — «внедрили» ≠ «заработало».
  • Кейс не связан с выручкой — его не защитить перед CFO.
  • Нет observability — никто не знает, как AI ведёт себя в проде.
  • Agency работает без co‑delivery — команда клиента не в курсе, поддерживать некому.

Какие процессы дают ROI за 8 недель

Есть четыре кандидата, у которых ROI считается за 6–8 недель и виден даже скептичному CFO. Всё остальное — R&D, и его так и надо называть, а не пилотом.

1. AI‑персонализация PDP

Блоки «похожие товары» и «с этим покупают» на embedding‑поиске. KPI: +8–15% PDP конверсия, +5–10% средний чек. Лидеры в e‑com получают до 31% выручки от рекомендаций (McKinsey, 2024).

2. Semantic search для каталога

Elasticsearch + reranker. «Тёплая куртка для зимы» находит пуховики, даже если в SKU нет слова «тёплая». KPI: доля «0 результатов» → 0, CR поиска +20%.

3. Admin copilot для контент‑менеджеров

AI‑помощник в админке Битрикса: генерация описаний, SEO‑текстов, массовый апдейт карточек. KPI: время заведения SKU −60%, экономия 4.4 ч/нед на инженера (getdx, 2025).

4. Чат‑бот с escalation в CRM

RAG поверх FAQ и базы знаний + сценарная эскалация в amoCRM / Битрикс24. KPI: self‑service 60%+, first reply < 30 сек.

Outcome‑контракт: что зашить в договор

Принцип outcome‑контракта: обе стороны заинтересованы в метрике, а не в часах.

  • Base fee 60–70% — на покрытие инфраструктуры, discovery, интеграции. Эта часть не зависит от KPI.
  • Outcome bonus 30–40% — выплачивается при достижении метрики на заданном окне (например, +10% CR на PDP за 30 дней).
  • Penalty clause — если метрика просаживается более чем на 5%, agency возвращает процент base fee.
  • Observability‑доступ — клиент видит все логи, промпты, latency, ошибки. Иначе метрике нельзя доверять.
Пример KPI‑формулировки: «Конверсия PDP в корзину на когорте Frontbox vs Bitrix (A/B 50/50) за окно 30 дней. Baseline — 2.8%. Target — 3.2%. За каждые 0.1 п.п. сверху +5% от outcome bonus. Измерение — GA4 + внутренний DWH.»

Open‑source vs API — когда что выбирать

КритерийAPI (Claude / GPT)Open‑source (Llama / Qwen)
Скорость запускаДниНедели
Стоимость на единицуПеременная (per‑token)Фиксированная (GPU)
Регуляторка (152‑ФЗ, госсектор)НетДа (on‑prem)
Качество на русскомВысокоеСреднее (Qwen лучше)
Fine‑tuning под ваш доменОграниченныйПолный

Guardrails и observability

  • Логирование всех промптов и ответов с TTL 30 дней.
  • Rate‑limits на пользователя и на IP.
  • PII‑фильтры на вход и выход (никаких паспортов в логах).
  • Детекция галлюцинаций: проверка ответов на цитирование источников.
  • Kill‑switch: одна команда, и AI‑слой отключается, трафик идёт на fallback.

Как мерить эффект

Никогда не меряйте AI «на глаз». Всегда A/B‑тест: половина пользователей получает AI‑ вариант, половина — контрольный. Окно — минимум 2 недели и минимум 10 000 сессий в каждой ветке. Метрики — не «клики», а деньги: CR, AOV, LTV.

Rollout без паники

Начните с 5–10% трафика на AI‑вариант. Наращивайте каждые 3 дня при стабильных метриках. На 100% переключайтесь только после 2‑недельного окна подтверждённого лифта. Любой провал метрики — kill‑switch, разбор, починка, новый запуск.

Частые вопросы

Что считается успешным AI-пилотом?

Тот пилот, где метрика зафиксирована в договоре до старта, измеряется через A/B-тест, а результат виден CFO через 6–8 недель. «Внедрили» без числа — не пилот, а R&D.

Как долго длится пилот?

6–10 недель: 2 нед. Discovery + интеграция, 2–4 нед. A/B‑тест с минимум 10 000 сессий в каждой ветке, 2 нед. подтверждения лифта. Раньше статистически незначимо.

Что если KPI не достигнут?

Penalty clause в контракте возвращает часть base fee. Дальше — разбор гипотезы, смена use case или параметров. Провал пилота — это данные, не катастрофа.

Нужен ли GPT / Claude или подойдёт open-source?

Три вопроса: (1) Объём — API дешевле до ~1M токенов/день. (2) Регуляторка — 152-ФЗ и госсектор требуют on-prem, значит open-source. (3) Время — API запускается за дни, open-source за недели.

Как защитить данные клиентов при работе с AI API?

PII‑фильтры на вход и выход, TTL логов 30 дней, закрытые API‑ключи на стороне сервера. Для данных под 152-ФЗ — только on-prem модели.

Какой use case выбрать первым?

Тот, где ROI считается в деньгах, данные уже есть в системе и команда может сопровождать без подрядчика после handoff. Лучшие первые: персонализация PDP и semantic search — ROI виден за 6–8 недель.

Что происходит после пилота?

При подтверждённом лифте: roll-out на 100% трафика, переход на AI-ретейнер или следующий пилот. При провале метрики: kill-switch, разбор, новый use case.

Нужна ли отдельная AI-команда?

Нет. Пилот идёт с 1–2 инженерами с нашей стороны и product owner с вашей. Масштабирование — после подтверждённого лифта, не до.

Что читать дальше - Связанные материалы

Расскажите нам о своем проекте

Наши офисы

  • Россия
    Россия, Санкт-Петербург, Рижская улица, 5, корп. 1 офис 402
    +7 (967) 555-90-32
  • Казахстан
    Алма-Ата
    +7 (707) 340-29-12