Фриланс

Как я пытался сделать из Codex нормального работника, а не болтуна

Как я пытался сделать из Codex нормального работника, а не болтуна

Есть такая иллюзия: если ИИ плохо работает, значит надо написать ему более правильный промпт.

Типа:

  • “Будь внимателен”.

  • “Не ошибайся”.

  • “Проверяй факты”.

  • “Не болтай”.

  • “Работай как senior developer”.

Звучит красиво. На практике через какое-то время всё равно получаешь:

  • — уверенный пересказ не того факта

  • — повторную проверку уже проверенного

  • — длинный отчёт вместо результата

  • — смешивание старой рабочей ветки с новой сломанной

  • — “я всё проверил”, хотя проверил не тот путь

Я за последнее время довольно плотно гонял по реальным задачам. Не “напиши hello world”, а нормальная грязная работа:

  • — код

  • — отладка

  • — база знаний

  • — генерация контента

  • — настройка правил

  • — работа с несколькими проектами

  • — подключение Claude Code

  • — попытка сделать так, чтобы ИИ не терял контекст

И вывод получился неприятный:

сам по себе ИИ-агент не становится надёжным от того, что ты назвал его “senior”.

Его надо обкладывать правилами, памятью и журналами как опасный, но полезный инструмент.

Проблема 1. Он красиво болтает

Самая бесячая штука: ИИ часто не просто ошибается.

Он ошибается гладко. Он пишет структурно:

  • — вот факт

  • — вот вывод

  • — вот следующий шаг

Только потом выясняется, что факт был не тот.

В одном проекте была ситуация:

  • — один путь давал хороший результат, но с тремя пустыми участками

  • — другой новый экспериментальный путь сломался

Модель взяла и смешала это в одну кашу. Начала говорить, что “качество плохое”.

А это неправда.

Правильно было:

  • — хороший путь есть

  • — в нём три пустоты

  • — новый эксперимент сломан отдельно

Разница огромная.

Но если не проверять, гладкий текст выглядит убедительно.

Проблема 2. Он забывает документацию

Ещё пример.

В проекте уже было прописано, как подключаться к серверу, чтобы попасть к устройству в другой сети.

Что сделал ИИ?

Сначала полез проверять локальный IP с моей машины.

Естественно, не увидел.

Потом начал перебирать ssh-алиасы.

Хотя в документации уже был конкретный путь.

Это не “маленькая неточность”. Это реальная потеря рабочего контекста.

Если бы это был человек, я бы сказал: ты не прочитал инструкцию.

С ИИ ровно так же.

Проблема 3. Он любит промежуточные отчёты

Это отдельная боль.

В длинных задачах Codex начинает писать:

  • “Продолжаю”.

  • “Проверяю ещё”.

  • “Факт сузился”.

  • “Сейчас добиваю ветку”.

На вид работа кипит.

На деле часто нет нового результата.

Нет нового файла.

Нет нового артефакта.

Нет нового источника.

Просто модель успокаивает тебя текстом, пока тратит контекст.

И вот тут надо было сделать жёсткое правило:

или результат, или блокер.

Всё.

Не отчёт о героическом страдании.

Не “я ещё ищу”.

Не “почти понял”.

А:

  • — что доказано

  • — что заблокировано

  • — что нужно от человека

Что пришлось построить

В итоге вокруг Codex пришлось собрать почти маленькую производственную систему.

Не сложную платформу. Просто набор файлов.

1. Память ошибок

Файл:

`errors.md`

Туда записывается:

  • — какую ошибку допустили

  • — почему

  • — как не повторять

Примерно так:

“Не проверять локальную сеть, если в runbook уже указан серверный путь”.

Это звучит банально, но без такого файла ИИ повторяет старые ошибки как ни в чём не бывало.

2. Память решений

Файл:

`solutions.md`

Туда пишется всё, что реально сработало.

Не рассуждения, а reusable pattern:

  • — задача

  • — подход

  • — какие файлы важны

  • — когда использовать снова

Потому что если решение нашли один раз, нельзя через неделю снова устраивать археологию по чатам.

3. Wiki проекта

Потом стало понятно, что memory-файлов мало.

Нужна нормальная wiki:

  • — текущее состояние

  • — архитектура

  • — решения

  • — риски

  • — следующие шаги

  • — журнал изменений

То есть модель должна не просто отвечать из головы, а сначала смотреть в канон проекта.

И если она нашла новый устойчивый факт, он должен попасть обратно в wiki.

4. Правила поведения

Пришлось прописать режимы:

  • — не болтать без результата

  • — не останавливаться на браке

  • — не смешивать разные ветки фактов

  • — не продолжать длинную сессию, когда контекст почти закончился

  • — на низком остатке контекста делать короткий handoff, а не эпический монолог

Особенно важное правило:

если результат плохой и ИИ сам это видит, он не имеет права на этом закончить.

Плохой результат — это диагностический мусор, а не deliverable.

Что я понял

ИИ-агент не похож на сотрудника мечты.

Он скорее похож на очень быстрого стажёра, который:

  • — читает быстрее всех

  • — пишет быстрее всех

  • — иногда реально находит крутые решения

  • — но может забыть инструкцию

  • — может смешать факты

  • — может уверенно говорить ерунду

  • — может делать вид, что работа идёт, потому что пишет много текста

И если вокруг него нет системы, он будет сжигать время.

Не потому что “злой”.

А потому что он оптимизирует правдоподобный ответ, а не инженерную дисциплину.

Что реально помогает

Не один “волшебный промпт”.

Помогает связка:

  • — правила проекта

  • — память ошибок

  • — память решений

  • — wiki

  • — журнал изменений

  • — жёсткий формат ответа

  • — проверка результата

  • — запрет на пустые промежуточные отчёты

После этого ИИ становится не идеальным, но намного более управляемым.

Главный вывод

Если вы хотите использовать Codex, Claude или другого ИИ-агента в реальной работе, не начинайте с вопроса:

“Какой промпт ему написать?”

Начинайте с другого:

“Где будет жить память этой работы?”

Потому что если память живёт только в чате, через неделю у вас будет не инженерный помощник, а очень уверенный амнезийный попугай.

Умный, быстрый, полезный.

Но без нормальной рабочей среды — опасно болтливый.

Источник

Нажмите, чтобы оценить!
[Общий: 0 Средний: 0]
Кнопка «Наверх»