Контекст
Сервисная компания получала заявки через три канала (WhatsApp, Telegram, форма на сайте). Менеджеры обрабатывали в порядке очереди в рабочее время. Первый ответ — 3–4 часа медиана. На горячих заявках это критично.
Архитектура
- n8n принимает webhook’и от трёх каналов, отправляет в LLM-агент.
- Агент-классификатор на Claude определяет тип заявки (продажа / поддержка / спам / B2B) и срочность.
- Агент-ответчик генерирует персонализированный первый ответ — приветствие, уточняющий вопрос или информацию по запросу.
- Агент-саммаризатор формирует саммари клиента + BANT-оценку (бюджет / роль / потребность / сроки) для менеджера.
- amoCRM получает заявку с уже готовой картой клиента — менеджер не читает raw-сообщение.
Метрики
За 2 месяца после запуска:
- Среднее время первого ответа: 3 часа → 1 минута, медиана. Максимум — 90 секунд.
- Конверсия из заявки во встречу: +18% (атрибуция через A/B на части трафика в первый месяц)
- Затраты на ручную обработку входящих: −70% (фонд оплаты двух младших менеджеров)
Ограничения
Сложные B2B-заявки с детальным ТЗ маркируются как «требуют человека» — агент только подтверждает получение и сообщает срок. Это намеренный дизайн: имитировать экспертный ответ на нестандартной задаче — путь к разочарованию клиента и срыву сделки.