Сколько стоит внедрение ИИ-агента в 2026 году: от чего зависит цена
Раз в неделю кто-то спрашивает: «сколько стоит сделать нам ИИ-агента». Честный ответ — «от 200 000 ₽ до бесконечности, зависит от задачи». Это раздражает. Поэтому в этой статье — конкретика: из чего складывается цена, в каком диапазоне обычно проекты, на чём можно сэкономить, а на чём не стоит.
Данные — из наших 30+ закрытых проектов 2024-2026. Рынок похожих агентств в РФ примерно в этом же диапазоне; enterprise-вендоры (Just AI, Sber AI, Yandex GPT API enterprise) стартуют выше — обычно от 1.5-2 млн.
Из чего складывается смета
ИИ-проект — это не «модель в коробке». Бюджет распадается на пять статей. Их доли могут сильно гулять, но в среднем картина такая:
| Статья | Доля от бюджета | Что входит |
|---|---|---|
| Архитектура и проектирование | 10-15% | Анализ процесса, выбор стека, схема решения |
| Разработка | 40-50% | Сборка пайплайна, агенты, интеграции |
| Работа с данными и базой знаний | 20-30% | Сбор, чистка, структурирование, векторизация |
| Тестирование и доводка | 10-15% | Eval, проверка точности, итерации по обратной связи |
| Деплой и документация | 5-10% | Запуск на инфраструктуре клиента, передача |
Главное, что часто недооценивают на старте — работа с данными. На бумаге это «дайте нам ваши FAQ». На практике это 20-30% бюджета: разобрать неструктурированный материал, переписать под формат для retrieval, актуализировать, выстроить процесс обновления.
Три диапазона проектов
По нашему опыту, проекты группируются в три категории. Названия условные.
Малый: 200 000 - 500 000 ₽
Один агент, одна задача, минимум интеграций. Срок — 2-4 недели.
Что в этот бюджет попадает:
- Чат-бот с RAG по существующей базе (FAQ, регламенты, документация)
- Антиспам-агент в Telegram-канале или чате
- Простая обработка входящих заявок с маршрутизацией
- Генератор контента по шаблону
Пример из практики — How2AI. Антиспам для каналов. Один агент, одна модель, один промпт. По нашим замерам, 100% точность на тестовом наборе из 50 спам-сообщений.
Средний: 500 000 - 1 500 000 ₽
Мультиагент или один агент с несколькими интеграциями (CRM, базы данных, внешние API). Срок — 4-8 недель.
Что входит:
- Агент в продажах с подъёмом истории клиента из CRM
- Автоматизация комьюнити с эскалациями к модераторам
- Обработка входящих обращений с классификацией и маршрутизацией
- Внутренний копилот для команды (поиск по корпоративной базе, помощь в задачах)
Пример — Дельфин-клуб. Чат с 10К+ участников, агент с RAG, classifier и эскалациями. Результат: −85% нагрузки на модерацию.
Крупный: от 1 500 000 ₽
Несколько связанных агентов, глубокая интеграция в стек клиента, кастомная инфраструктура. Срок — 2-4 месяца, иногда больше.
Что входит:
- Полноценный AI-копилот для отдела (продажи, поддержка, R&D)
- Несколько пайплайнов с общим состоянием и оркестрацией
- Кастомные коннекторы к самописным системам клиента
- Аналитика и дашборды по работе агентов
Здесь мы обычно работаем итерациями: первый MVP за месяц, дальше — наращивание функциональности по приоритетам клиента.
Что влияет на цену
Когда мы оцениваем проект, смотрим на пять параметров. Каждый из них может уронить или поднять смету в 2-3 раза.
1. Состояние базы знаний. Если документация структурирована, актуальна, лежит в Notion или Confluence — это плюс одна-две недели работы. Если это «у нас всё в головах» — это минус две недели работы и реальный риск, что качество будет плавать.
2. Количество интеграций. Один источник данных (например, только Telegram) — это базовый бюджет. Telegram + CRM + почтовый клиент + биллинг — это уже +30-50% к смете на коннекторы.
3. Требования к точности. Точность 80% и точность 95% — это совершенно разные проекты. Дотягивание от 90 до 95% часто стоит столько же, сколько весь предыдущий путь.
4. Внутренняя готовность клиента. Если у клиента нет человека, который будет вести проект изнутри, проект буксует. Это не строчка в смете, но влияет на сроки и косвенно на бюджет (затягивание стоит денег).
5. Безопасность и compliance. Self-hosting, отдельный VPS, аудит безопасности, политика данных — это плюс 15-30% сверху относительно облачного развёртывания.
Что стоит уже после запуска
Часть, про которую забывают на этапе сметы. Месячные расходы на работающего агента:
| Статья | Сумма (типичная) |
|---|---|
| Инференс (Claude/GPT) | 3 000 - 30 000 ₽ |
| Инфраструктура (VPS, базы) | 1 500 - 10 000 ₽ |
| Векторная база (если managed) | 0 - 5 000 ₽ |
| Поддержка и доработки | 15 000 - 80 000 ₽ |
Инференс — самая пугающая статья на бумаге, но в реальности на средний проект он редко превышает 20 000 ₽ в месяц. По нашему опыту, в Дельфин-клубе при обработке 10-15К сообщений в день инференс стоит около 8 000 ₽ в месяц.
Поддержка — это про апдейты базы знаний, мелкие правки промптов, мониторинг качества. Без неё проект через год-два деградирует. С ней — живёт и развивается.
Где можно сэкономить
Несколько мест, где экономия реальна и безопасна.
Self-hosting вместо облаков enterprise-вендоров. Один и тот же агент в облаке Just AI и на n8n + Claude API будет стоить с разницей в 3-5 раз в пользу второго.
Поэтапное внедрение. Не пытаться сделать «всё и сразу». Начать с MVP на одной задаче, замерить эффект, потом расширять. Часто выясняется, что 80% ценности дают 20% запланированной функциональности.
Использование готовых моделей вместо fine-tuning. В 95% B2B-задач Claude Sonnet или GPT с правильным промптом и RAG работают лучше дообученной модели. Fine-tuning — это +500 000 ₽ к проекту и сомнительное улучшение качества.
Open-source стек. n8n, Postgres + pgvector, Redis, локальный Ollama для непубличных задач. Каждый из этих компонентов в коммерческом аналоге стоит в разы дороже.
Где экономить не стоит
И обратное — места, где экономия выходит дороже.
Работа с данными. Если попробовать «сэкономить» на чистке базы знаний, на выходе получаем галлюцинирующего агента, которого через два месяца выключают. Деньги на разработку при этом потрачены.
Тестирование. Eval-набор из 100-200 размеченных примеров стоит 50 000 ₽ работы аналитика, но даёт измеримое качество. Без него вы запускаете чёрный ящик и узнаёте о проблемах от клиентов.
Документация и передача. Если не сделать понятную доку — клиент через полгода зовёт вас на каждую правку. Это удобно нам, но плохо для клиента. По нашему опыту, проекты с хорошей документацией живут в 2-3 раза дольше.
«Дешевле всего — сделать один процесс хорошо, чем десять процессов плохо. Бюджет 300 000 ₽, потраченный на один реальный процесс, который заработал, лучше бюджета 1 000 000 ₽, размазанного на пять “пилотов”, которые так и остались пилотами.» — Богдан Шишкин, основатель Articortex
Как считать ROI
Простая формула, которую мы предлагаем клиентам перед стартом:
ROI (месяцы окупаемости) = Бюджет проекта / Экономия в месяц
Экономия считается через высвобожденные часы команды × часовая ставка + предотвращённые потери (упущенные лиды, ошибки).
Конкретный пример. Дельфин-клуб: −30 часов в неделю работы модераторов × ставка 1 000 ₽/час × 4 недели = 120 000 ₽ экономии в месяц. При бюджете проекта около 700 000 ₽ окупаемость — примерно 6 месяцев. Это до учёта +5% конверсии в новые членства.
В B2B-проектах разумная окупаемость — 6-12 месяцев. Если на бумаге выходит дольше — стоит пересмотреть scope.
Что дальше
Грубую оценку под вашу задачу можно получить через /calculator — там вопросник на 5 минут и предварительная вилка по бюджету.
Если хочется поговорить предметно — /contacts. Первая 30-минутная встреча бесплатная, без обязательств. Часто после неё становится понятно, нужно вам это вообще или решается одним скриптом за 50 000 ₽.
См. также: