← Блог

Сколько стоит внедрение ИИ-агента в 2026 году: от чего зависит цена

14 мая 2026 г. · Богдан Шишкин

Раз в неделю кто-то спрашивает: «сколько стоит сделать нам ИИ-агента». Честный ответ — «от 200 000 ₽ до бесконечности, зависит от задачи». Это раздражает. Поэтому в этой статье — конкретика: из чего складывается цена, в каком диапазоне обычно проекты, на чём можно сэкономить, а на чём не стоит.

Данные — из наших 30+ закрытых проектов 2024-2026. Рынок похожих агентств в РФ примерно в этом же диапазоне; enterprise-вендоры (Just AI, Sber AI, Yandex GPT API enterprise) стартуют выше — обычно от 1.5-2 млн.

Из чего складывается смета

ИИ-проект — это не «модель в коробке». Бюджет распадается на пять статей. Их доли могут сильно гулять, но в среднем картина такая:

СтатьяДоля от бюджетаЧто входит
Архитектура и проектирование10-15%Анализ процесса, выбор стека, схема решения
Разработка40-50%Сборка пайплайна, агенты, интеграции
Работа с данными и базой знаний20-30%Сбор, чистка, структурирование, векторизация
Тестирование и доводка10-15%Eval, проверка точности, итерации по обратной связи
Деплой и документация5-10%Запуск на инфраструктуре клиента, передача

Главное, что часто недооценивают на старте — работа с данными. На бумаге это «дайте нам ваши FAQ». На практике это 20-30% бюджета: разобрать неструктурированный материал, переписать под формат для retrieval, актуализировать, выстроить процесс обновления.

Три диапазона проектов

По нашему опыту, проекты группируются в три категории. Названия условные.

Малый: 200 000 - 500 000 ₽

Один агент, одна задача, минимум интеграций. Срок — 2-4 недели.

Что в этот бюджет попадает:

  • Чат-бот с RAG по существующей базе (FAQ, регламенты, документация)
  • Антиспам-агент в Telegram-канале или чате
  • Простая обработка входящих заявок с маршрутизацией
  • Генератор контента по шаблону

Пример из практики — How2AI. Антиспам для каналов. Один агент, одна модель, один промпт. По нашим замерам, 100% точность на тестовом наборе из 50 спам-сообщений.

Средний: 500 000 - 1 500 000 ₽

Мультиагент или один агент с несколькими интеграциями (CRM, базы данных, внешние API). Срок — 4-8 недель.

Что входит:

  • Агент в продажах с подъёмом истории клиента из CRM
  • Автоматизация комьюнити с эскалациями к модераторам
  • Обработка входящих обращений с классификацией и маршрутизацией
  • Внутренний копилот для команды (поиск по корпоративной базе, помощь в задачах)

Пример — Дельфин-клуб. Чат с 10К+ участников, агент с RAG, classifier и эскалациями. Результат: −85% нагрузки на модерацию.

Крупный: от 1 500 000 ₽

Несколько связанных агентов, глубокая интеграция в стек клиента, кастомная инфраструктура. Срок — 2-4 месяца, иногда больше.

Что входит:

  • Полноценный AI-копилот для отдела (продажи, поддержка, R&D)
  • Несколько пайплайнов с общим состоянием и оркестрацией
  • Кастомные коннекторы к самописным системам клиента
  • Аналитика и дашборды по работе агентов

Здесь мы обычно работаем итерациями: первый MVP за месяц, дальше — наращивание функциональности по приоритетам клиента.

Что влияет на цену

Когда мы оцениваем проект, смотрим на пять параметров. Каждый из них может уронить или поднять смету в 2-3 раза.

1. Состояние базы знаний. Если документация структурирована, актуальна, лежит в Notion или Confluence — это плюс одна-две недели работы. Если это «у нас всё в головах» — это минус две недели работы и реальный риск, что качество будет плавать.

2. Количество интеграций. Один источник данных (например, только Telegram) — это базовый бюджет. Telegram + CRM + почтовый клиент + биллинг — это уже +30-50% к смете на коннекторы.

3. Требования к точности. Точность 80% и точность 95% — это совершенно разные проекты. Дотягивание от 90 до 95% часто стоит столько же, сколько весь предыдущий путь.

4. Внутренняя готовность клиента. Если у клиента нет человека, который будет вести проект изнутри, проект буксует. Это не строчка в смете, но влияет на сроки и косвенно на бюджет (затягивание стоит денег).

5. Безопасность и compliance. Self-hosting, отдельный VPS, аудит безопасности, политика данных — это плюс 15-30% сверху относительно облачного развёртывания.

Что стоит уже после запуска

Часть, про которую забывают на этапе сметы. Месячные расходы на работающего агента:

СтатьяСумма (типичная)
Инференс (Claude/GPT)3 000 - 30 000 ₽
Инфраструктура (VPS, базы)1 500 - 10 000 ₽
Векторная база (если managed)0 - 5 000 ₽
Поддержка и доработки15 000 - 80 000 ₽

Инференс — самая пугающая статья на бумаге, но в реальности на средний проект он редко превышает 20 000 ₽ в месяц. По нашему опыту, в Дельфин-клубе при обработке 10-15К сообщений в день инференс стоит около 8 000 ₽ в месяц.

Поддержка — это про апдейты базы знаний, мелкие правки промптов, мониторинг качества. Без неё проект через год-два деградирует. С ней — живёт и развивается.

Где можно сэкономить

Несколько мест, где экономия реальна и безопасна.

Self-hosting вместо облаков enterprise-вендоров. Один и тот же агент в облаке Just AI и на n8n + Claude API будет стоить с разницей в 3-5 раз в пользу второго.

Поэтапное внедрение. Не пытаться сделать «всё и сразу». Начать с MVP на одной задаче, замерить эффект, потом расширять. Часто выясняется, что 80% ценности дают 20% запланированной функциональности.

Использование готовых моделей вместо fine-tuning. В 95% B2B-задач Claude Sonnet или GPT с правильным промптом и RAG работают лучше дообученной модели. Fine-tuning — это +500 000 ₽ к проекту и сомнительное улучшение качества.

Open-source стек. n8n, Postgres + pgvector, Redis, локальный Ollama для непубличных задач. Каждый из этих компонентов в коммерческом аналоге стоит в разы дороже.

Где экономить не стоит

И обратное — места, где экономия выходит дороже.

Работа с данными. Если попробовать «сэкономить» на чистке базы знаний, на выходе получаем галлюцинирующего агента, которого через два месяца выключают. Деньги на разработку при этом потрачены.

Тестирование. Eval-набор из 100-200 размеченных примеров стоит 50 000 ₽ работы аналитика, но даёт измеримое качество. Без него вы запускаете чёрный ящик и узнаёте о проблемах от клиентов.

Документация и передача. Если не сделать понятную доку — клиент через полгода зовёт вас на каждую правку. Это удобно нам, но плохо для клиента. По нашему опыту, проекты с хорошей документацией живут в 2-3 раза дольше.

«Дешевле всего — сделать один процесс хорошо, чем десять процессов плохо. Бюджет 300 000 ₽, потраченный на один реальный процесс, который заработал, лучше бюджета 1 000 000 ₽, размазанного на пять “пилотов”, которые так и остались пилотами.» — Богдан Шишкин, основатель Articortex

Как считать ROI

Простая формула, которую мы предлагаем клиентам перед стартом:

ROI (месяцы окупаемости) = Бюджет проекта / Экономия в месяц

Экономия считается через высвобожденные часы команды × часовая ставка + предотвращённые потери (упущенные лиды, ошибки).

Конкретный пример. Дельфин-клуб: −30 часов в неделю работы модераторов × ставка 1 000 ₽/час × 4 недели = 120 000 ₽ экономии в месяц. При бюджете проекта около 700 000 ₽ окупаемость — примерно 6 месяцев. Это до учёта +5% конверсии в новые членства.

В B2B-проектах разумная окупаемость — 6-12 месяцев. Если на бумаге выходит дольше — стоит пересмотреть scope.

Что дальше

Грубую оценку под вашу задачу можно получить через /calculator — там вопросник на 5 минут и предварительная вилка по бюджету.

Если хочется поговорить предметно — /contacts. Первая 30-минутная встреча бесплатная, без обязательств. Часто после неё становится понятно, нужно вам это вообще или решается одним скриптом за 50 000 ₽.

См. также:

Хотите такое же у себя?

Расскажите про задачу — оценим за один созвон.