Центр тяжести в работе с ИИ смещается от «prompt engineering» к «context engineering». Помимо шлифовки промпта (инструкции), вы проектируете и управляете всем объёмом информации (контекстом), который передаёте модели — и в 2026 году это стало необходимым навыком для работы с ИИ, особенно при создании ИИ-агентов.

Эта статья для новичков объясняет, что такое context engineering, почему это важно (ключ — «context rot») и какие конкретные техники с этим связаны.

CONTEXT ENGINEERING · СЛЕДУЮЩИЙ ШАГ ПОСЛЕ ПРОМПТОВ

Контекст — это «конечный бюджет»

— искусство оставлять только самую малую и самую значимую информацию

🎯

Отбирайте

Не впихивайте всё подряд — добавляйте только то, что действительно помогает.

🧹

Регулярно прибирайтесь

Сжимайте или удаляйте устаревшую историю и результаты инструментов, чтобы оставаться лёгкими.

📥

Загружайте по требованию

Не загружайте всё заранее; извлекайте ровно в тот момент, когда это нужно.

1. Что такое context engineering?

Если воспользоваться определением Anthropic, context engineering — это «набор стратегий для подбора и поддержания оптимального набора токенов (информации), который вы передаёте модели во время инференса» (из материала «Effective context engineering for AI agents», март 2026). Он охватывает не только промпт, но и всё, что попадает в контекстное окно: системный промпт, инструменты, историю диалога и внешние данные.

Представьте это как «искусство держать рабочий стол в порядке». Вы оставляете под рукой только нужные материалы, а законченное убираете. Завалите стол (контекстное окно) документами — и эффективность падает; с ИИ происходит ровно то же самое. Именно поэтому «что положить, а что оставить за бортом» — это задача проектирования, которую стоит решать.

💡 В одной фразе: prompt engineering = «отшлифовать инструкцию». Context engineering = «спроектировать весь объём информации, который видит модель.» Второе — более широкая дисциплина, включающая первое.

2. Почему это важно: стена «context rot»

«Если контекстное окно вмещает миллион токенов, почему бы не положить туда всё?» Вот в чём ловушка: чем больше токенов вы добавляете, тем сильнее на самом деле падает точность модели. Это явление называют «context rot» (деградация контекста).

Когда в 2025 году Chroma протестировала 18 ведущих моделей (GPT, Claude, Gemini и другие), каждая без исключения становилась менее надёжной по мере удлинения ввода. Причина в том, что «внимание» (attention) модели — это конечный бюджет. Каждый дополнительный токен размывает этот бюджет, и упустить релевантную информацию становится легче — а информацию, помещённую в середину длинного контекста, особенно легко не заметить («lost in the middle»).

Чем длиннее ввод, тем ниже точность (схематично)

Короткий контекст (только нужное)Высокая точность
Средний (накапливаются история и результаты инструментов)Снижается
Слишком длинный (впихнуто всё подряд)Резко ниже

※ Концептуальная иллюстрация. В измеренных исследованиях, например, работа Stanford (2023) сообщала о падении точности с 70–75% до 55–60% при подаче примерно 4 000 токенов справочного материала. На более сложных задачах деградация больше.

Короче говоря, тезис «чем длиннее контекст, тем лучше» неверен. Именно поэтому нужен context engineering — оставлять только самые малые и самые значимые токены. Особенно для долго работающих ИИ-агентов и кодинг-агентов context rot, как правило, оказывается главной причиной сбоев.

3. Что на самом деле входит в контекст

Многие склонны думать «контекст = промпт», но на деле в том же окне соседствует куда больше элементов — и все они расходуют бюджет.

Системный промпт

Базовые инструкции — роль, правила, тон.

Определения и результаты инструментов

Описания инструментов (например, MCP) и их вывод.

История диалога и работы

Уже состоявшийся обмен репликами плюс накопленные собственные рассуждения модели.

Внешние данные

Извлечённые документы и код, результаты поиска RAG и тому подобное.

Чем дольше задача, тем больше накапливается истории и результатов инструментов. Пустите это на самотёк — и окно быстро заполнится «важной информацией, погребённой в середине». Поэтому и нужны техники наведения порядка, описанные ниже.

4. Шесть ключевых техник

Опираясь на рекомендации Anthropic и практический опыт, приведём шесть высокоэффективных техник. Общий принцип — «найти наименьший набор высокозначимых токенов».

① Инструкции на правильном «уровне»

Слишком мелкая логика «если — иначе» хрупка; слишком расплывчатая не срабатывает. Цельтесь в середину: «конкретно, но гибко».

② Отбирайте инструменты

Убирайте инструменты, которые дублируют друг друга или где непонятно, какой именно применять. Сведите к нескольким однозначным.

③ Извлечение just-in-time

Вместо того чтобы загружать всё заранее, держите лишь пути к файлам и ссылки и извлекайте ровно в нужный момент. Та же идея, что и постепенное раскрытие в Claude Skills.

④ Compaction (сжатие через резюме)

Когда окно заполняется, резюмируйте историю и переносите её в свежее окно. Сохраняйте решения и открытые вопросы; отбрасывайте избыточный вывод инструментов.

⑤ Заметки (внешняя память)

Записывайте прогресс и ключевые моменты в файл за пределами окна и считывайте их обратно только при необходимости. Это сохраняет связность длинных задач.

⑥ Изоляция через суб-агентов

Тяжёлую работу вроде исследования передавайте суб-агенту и возвращайте в основной агент только резюме. Так подробный контекст не попадает в основную ветку.

⚠️ Не переусложняйте: сначала сделайте самое простое, что работает, прежде чем браться за хитроумные конструкции. Уже одно то, что вы не добавляете лишнюю информацию и почаще начинаете новую сессию, даёт многое.

5. Связь с промптами, RAG и Skills

Эти соседние понятия легко сливаются воедино, поэтому расставим их по местам. Context engineering — это «зонтичный образ мышления», который связывает их все.

  • Prompt engineering: ремесло шлифовки инструкций. Это часть context engineering.
  • RAG: метод поиска внешних знаний и их добавления в контекст. Одно из средств для решения вопроса «что извлечь и включить».
  • Skills: механизм, который разворачивает процедуру только при необходимости. Конкретный пример извлечения just-in-time.

Итак, «отшлифовать инструкцию» (промпты), «добавить знания» (RAG) и «загружать и выгружать процедуры» (Skills) — context engineering рассматривает всё это как одну задачу проектирования: что поместить в окно, а что из него убрать.

6. Что можно сделать уже сегодня

Ещё до любой сложной реализации есть привычки, которыми может сразу же воспользоваться каждый.

  • Начинайте новый чат, когда тема меняется: просто не тащить за собой старый контекст — и точность восстанавливается. Самый простой и самый действенный шаг.
  • Не вставляйте длинные документы целиком: извлеките только релевантную часть и передайте её. Прикреплять весь текст часто только во вред.
  • Просите резюмировать посреди длинной работы: попросите «перечислить принятые до сих пор решения и оставшиеся задачи», а затем продолжайте от этого (ручной compaction).
  • Не нагромождайте инструменты и расширения: убирайте неиспользуемые MCP-серверы и навыки. Чем больше вариантов, тем сильнее модель колеблется.

💡 Это ещё и дешевле: не загружать лишние токены — значит напрямую экономить на стоимости токенов. Точность и стоимость улучшаются одновременно.

Итоги

Три вывода о context engineering.

  • Что это: дисциплина проектирования и управления «всем объёмом информации, который видит модель», включая промпты. Следующая ступень после prompt engineering.
  • Почему: из-за «context rot» — точность падает по мере добавления токенов. Контекст — это конечный бюджет.
  • В чём фокус: оставлять только самые малые и самые значимые токены. Ваше оружие — отбор, наведение порядка (резюмирование), извлечение по требованию и изоляция через суб-агентов.

Начните с «новой сессии при смене темы» и «вставляйте только ключевые моменты». Если хотите копнуть глубже, посмотрите также Claude Skills и harness engineering.

FAQ

Q. Prompt engineering теперь устарел?

A. Нет. Prompt engineering остаётся важным как часть context engineering. Связь в том, что поверх навыка шлифовать инструкции добавляется взгляд на проектирование всего объёма информации.

Q. Решит ли проблему модель с бо́льшим контекстным окном?

A. Context rot случается даже при большом окне. Исследования показывают, что впихивать всё подряд просто потому, что есть место, на самом деле снижает точность. Большое окно — это «запас», а не «разрешение включать всё».

Q. Имеет ли это значение для обычного использования чата?

A. Да. Уже просто «начинать новый чат под каждую тему» и «вставлять только ключевые моменты» повышает качество ответов. Это советы, которыми можно пользоваться уже сегодня, даже если вы не инженер.

Q. В чём разница между RAG и context engineering?

A. RAG — это один конкретный метод: «искать внешние знания и добавлять их в контекст». Context engineering — более широкое понятие, которое целиком решает вопрос «что поместить в окно, а что из него убрать», и RAG является одной из его составляющих.