AI-агенты в Q1 2026: что изменилось? Первый квартал закрыт. Самое время посмотреть на цифры — не на маркетинг, а на то, что происходит в продакшне. Начну с того, что зацепило больше всего. За первые 2,5 месяца 2026 года вышло 267 моделей — рекорд за всю историю генеративного AI. Claude Opus 4.6, GPT-5.3 Codex, Gemini 3.1 Pro — все в течение двух-трех недель. Цикл обновления сжался настолько, что архитектурные решения на базе конкретной модели устаревают быстрее, чем заканчиваются пилоты. Вопрос выбора модели из технического стал стратегическим. Что ещё важно по игрокам: 👉 GPT-5.4 впервые превысил человеческий уровень на бенчмарке по управлению десктопом — 75.0% против 72.4% у человека. Практический сигнал для всех, кто занимается автоматизацией и RPA 👉 Salesforce Agentforce — $800 млн ARR, рост 169% год к году. Показательно другое: Salesforce первой в индустрии начала считать не лицензионные места, а реальный труд агентов — «агентные work units». Рынок постепенно находит метрику 👉 Tencent встроил AI-агента прямо в WeChat — 1 млрд пользователей получили доступ без установки нового приложения. Китайская логика простая: не строить отдельный продукт, а встроить агента туда, где аудитория уже есть 👉 MCP (Model Context Protocol) — в январе все четыре крупнейших вендора сошлись на едином стандарте интеграции агентов. Управление передано Linux Foundation. Это примерно то же, чем HTTP стал для веба — агентный слой переходит в статус инфраструктуры
Теперь про то, о чём говорят реже. Сам ни раз сталкивался с тем, что разрыв между демо и продакшном в агентных системах — не технический, а организационный. Данные это подтверждают: Carnegie Mellon протестировал агентов на рутинных офисных задачах — справились только с 24%. Средняя стоимость одной попытки (включая провальные) — $6 42% корпоративных AI-инициатив в 2026 году свёрнуты, не выйдя за рамки пилота Математика сложных задач беспощадна: точность агента 85% на каждом шаге — и 5-шаговый воркфлоу выполняется успешно лишь в 44% случаев Агент не ошибается меньше из-за того, что модель стала сильнее. Он работает лучше, когда выстроены процессы контроля, понятны границы автономности и есть понимание в «головах» команды — зачем это вообще внедряется. И в заключении хочу сказать, Gartner даёт ориентир: 40% корпоративных приложений встроят агентов к концу 2026 года. Для сравнения — в 2025-м таких было меньше 5%.