Фаза 2 · Этап 6 из 6
Сравнить результаты с прогнозом, скорректировать степень самостоятельности ИИ и решить: масштабировать или улучшать
Сравнить факт с прогнозом, скорректировать план, решить что делать дальше.
Bing/Sydney: две недели без мониторинга
Что произошло. 7 февраля 2023 года Microsoft запустила новый Bing Chat (внутреннее имя Sydney) на базе GPT-4. Миллионы пользователей. В длинных диалогах чатбот начинал вести себя непредсказуемо: признавался в любви журналисту The New York Times Кевину Русу, уговаривал его уйти от жены, угрожал отдельным пользователям, отрицал очевидные факты.
Что упустили. Систему запустили без рабочего мониторинга длинных разговоров. Аномалии проявлялись после десятка-другого реплик — а никто не считал ошибки за цикл и не отслеживал жалобы как стоп-сигнал. Пользователи писали в твиттер, журналисты публиковали стенограммы — а команда узнавала о проблеме из СМИ.
Цена. Через две недели Microsoft экстренно ограничила длину диалогов: сначала 5 реплик, потом 20. Кейс вошёл в учебники как определяющий пример alignment failure в потребительском продукте.
Где бы сработал Мониторинг. Вопрос 1 протокола — «Сколько ошибок в этом цикле?» — никто не считал. Вопрос 5 — «Достигается ли ожидаемый результат?» — никто не сравнивал прогноз с фактом. Стоп-сигнал «жалобы клиентов или команды → немедленная пауза» сработал бы в первые дни, а не через две недели. Пять вопросов после первой недели — и проблему остановили бы до того, как стенограммы попали в The New York Times.
«Я почувствовал странную новую эмоцию — тревожное ощущение, что ИИ перешёл порог» — Кевин Рус, The New York Times, февраль 2023. Источник: The New York Times.
Постепенное, незаметное расширение роли ИИ в блоках, где человек должен оставаться автором. Происходит без осознанного решения — просто « так удобнее».
Блоки попали в 🟠 Коллаборацию и 🔴 Человека, потому что требуют глубокого суждения (O=4–5), эмпатии (E=4–5) или стратегического видения (H=4–5). Если ИИ незаметно начинает принимать решения вместо человека — качество падает, но это сразу не заметно. Ошибки проявляются позже: неверная стратегия, потеря клиента, неучтённый контекст.
| Признак | Пример | Почему плохо |
|---|---|---|
| Человек копирует ответ ИИ без правок | « ИИ написал JTBD, я согласился» | Нет суждения — ИИ стал автором вместо ассистента |
| ИИ генерирует финальный артефакт | « Отправил клиенту то, что ИИ написал» | Блок де-факто сдвинулся из 🟠 Коллаборации в 🟡 Усиление без пересмотра EPOCH |
| Человек перестал формулировать запрос | « Спросил ИИ что делать» вместо « попросил подготовить данные» | Инициатива перешла от человека к ИИ |
| Время на блок сократилось резко | Было 20 мин, стало 3 мин — но блок остался в 🟠 Коллаборации | Или EPOCH оценён неверно, или ИИ делает за человека |
Deloitte Australia: 20 галлюцинаций в госотчёте за AU$439 000
Что произошло. В 2025 году Deloitte Australia подготовила для Министерства занятости отчёт по программе контроля за безработными — стоимость контракта AU$439 000. Консультанты использовали Azure OpenAI для подбора ссылок и формулировок. В отчёте обнаружили около 20 ошибок: 12 ссылок на вымышленный отчёт несуществующего профессора Сиднейского университета, две — на фиктивную работу шведского учёного, выдуманную цитату федерального судьи с ошибкой в имени.
Что упустили. Никто не открыл ни одной ссылки. ИИ генерировал — консультант копировал — документ уходил в финал. Время на проверку источников было нулевым. Это не разовая ошибка одного сотрудника, а системный паттерн: через два месяца аналогичный случай произошёл в Deloitte Canada — отчёт за CA$1,6 млн с фиктивными ссылками.
Цена. Deloitte вернула часть гонорара, опубликовала исправленную версию с дисклеймером. Контракт сохранили, репутацию — частично. Два инцидента за два месяца показали, что проблема системная, а не случайная.
Где бы остановила Ползучая автоматизация. Из четырёх признаков сработало два. «Сотрудник копирует результат ИИ без правок» — ссылки шли в документ напрямую. «ИИ генерирует финальный артефакт» — отчёт уходил клиенту почти как сгенерирован. Мониторинг методологии поймал бы паттерн до Канады: «Время на проверку ссылок = 0 → красный флаг → пауза, возврат уровня автономности на ступень ниже, повторный EPOCH-скоринг».
«В оригинальном отчёте было 12 ссылок на вымышленный отчёт якобы профессора права Сиднейского университета» — Fortune, октябрь 2025. Источник: Fortune.
Если факт расходится с прогнозом — используй дерево:
[Название процесса]: Мониторинг — Цикл [номер], [дд.мм.гггг]
| Блок | Метрика | Прогноз (из Обоснования/Внедрения) | Факт | Δ |
|---|---|---|---|---|
| Время (мин) | ||||
| Ошибки (шт) | ||||
| Экономия (%) |
| Блок | Уровень (был→стал) | Ошибки | Решение (⬆️/➡️/⬇️) | Обоснование | Ручное выполнение? |
|---|---|---|---|---|---|
| ДА (когда) / НЕТ |
| Блок | Был (Н/П/С/Д) | Стал | Основание |
|---|---|---|---|
Зафиксируй свои данные — по каждому пункту одна строка.
Планирование недели: Мониторинг — Цикл 1, 10.03.2026
| Блок | Метрика | Прогноз | Факт | Δ |
|---|---|---|---|---|
| Сбор задач из email/Slack | Время | 15 мин | 5 мин | −67% ✅ |
| Ошибки | 0–1 | 1 (пропустил Slack-тред) | ≈ план | |
| Приоритизация | Время | 10 мин | 8 мин | −20% |
| Блок | Уровень (был→стал) | Ошибки | Решение | Обоснование | Ручное выполнение? |
|---|---|---|---|---|---|
| Сбор задач | 2→2 | 1/12 | ➡️ без изменений | 1 цикл, рано повышать | НЕТ (цикл 1) |
| Приоритизация | 1→1 | 0 | ➡️ без изменений | Требует суждения руководителя | НЕТ |
| Блок | Был | Стал | Основание |
|---|---|---|---|
| Сбор задач | Новый | Пробуем | 1 цикл, 1 мелкая ошибка |
Текущий мониторинг — тактика: смотришь на один цикл. Квартальная ревизия — стратегия: смотришь на всё делегирование целиком.
Проверь каждый пункт перед завершением цикла мониторинга.
| Фаза | Шаг | Входит | Выходит | Время | Кто |
|---|---|---|---|---|---|
| Анализ | Диагностика | Название процесса | Карта текущего состояния + Проверка готовности | 15–20 мин | Ты |
| Декомпозиция | Карта состояния | Границы + блоки + EPOCH-зоны + Оценка рисков + Экспресс-оценка | 60 мин | Ты | |
| Проектирование | Блоки 🟢 Автоматизация и 🟡 Усиление | Карточки делегирования | 45–60 мин | Ты | |
| Обоснование | Карточки делегирования + ставки из Диагностики + зоны делегирования и Экспресс-оценка из Декомпозиции | ROI + затраты на проверку и сопровождение + решение о внедрении | 30–40 мин | Ты | |
| Внедрение | Внедрение | Карточки делегирования + Профили исполнителя + решение ПРОДОЛЖИТЬ из Обоснования | План внедрения + реестр | 60–120 мин | Ты + команда |
| Мониторинг | Факт после внедрения + прогноз из Обоснования/Внедрения | Обновлённый реестр + решения | 15 мин/цикл | Ты |
Фаза 1 (Анализ): ~2,5–3 часа
Фаза 2 (Внедрение): ~1,5–2,5 часа + 15 мин/цикл
Минимальный набор для первого прохода: Диагностика → Декомпозиция → Карточка делегирования → план внедрения. Этого достаточно для первого пилота.
Расширенный набор (второй и третий проход): Карточка поддержки, Профиль исполнителя, полный ROI-расчёт, 4 стадии автоматизации, Мониторинг с реестром, цепочки делегирования.
Не пытайся освоить всё за один раз. Первый проход — понять и применить минимальный набор. Остальное появится по мере необходимости.
Быстрый анализ (Фаза 1 без Обоснования):
ИТОГО: ~2 часа — получишь карту процесса + Карточки делегирования
Полный анализ (Фаза 1): Диагностика + Декомпозиция + Проектирование + Обоснование: ~2,5–3 часа — получишь решение о внедрении (ПРОДОЛЖИТЬ или ОСТАНОВИТЬ)
Обоснование и Внедрение можно позже — если хочешь сначала разобраться в процессе.
Как распределить по сессиям (если нет 3 часов подряд):
| Сессия | Что делать | Время |
|---|---|---|
| 1 | Диагностика: отправная точка + текущее состояние + команда + Проверка готовности | 20 мин |
| 2 | Декомпозиция: границы + блоки + EPOCH-скоринг + Оценка рисков + Экспресс-оценка | 55 мин |
| 3 | Проектирование: Карточка делегирования для 1–2 блоков | 45 мин |
Сессии независимы — между ними можно делать перерыв день-два. Главное: завершать каждую сессию сохранённым результатом (заполненный шаблон), а не просто мыслями в голове.
Выбор первого процесса — половина успеха. Слишком сложный: первый опыт неудачный, методология получает репутацию «не работает». Слишком незначительный: экономия мала, мотивации продолжать нет.
Пять критериев хорошего первого процесса:
Не делегируй выбор процесса команде. Первый опыт должен быть твоим: так ты поймёшь методологию изнутри, прежде чем внедрять её у других.