Содержание
Центр тяжести в работе с ИИ смещается от «prompt engineering» к «context engineering». Помимо шлифовки промпта (инструкции), вы проектируете и управляете всем объёмом информации (контекстом), который передаёте модели — и в 2026 году это стало необходимым навыком для работы с ИИ, особенно при создании ИИ-агентов.
Эта статья для новичков объясняет, что такое context engineering, почему это важно (ключ — «context rot») и какие конкретные техники с этим связаны.
Контекст — это «конечный бюджет»
— искусство оставлять только самую малую и самую значимую информацию
Отбирайте
Не впихивайте всё подряд — добавляйте только то, что действительно помогает.
Регулярно прибирайтесь
Сжимайте или удаляйте устаревшую историю и результаты инструментов, чтобы оставаться лёгкими.
Загружайте по требованию
Не загружайте всё заранее; извлекайте ровно в тот момент, когда это нужно.
1. Что такое context engineering?
Если воспользоваться определением Anthropic, context engineering — это «набор стратегий для подбора и поддержания оптимального набора токенов (информации), который вы передаёте модели во время инференса» (из материала «Effective context engineering for AI agents», март 2026). Он охватывает не только промпт, но и всё, что попадает в контекстное окно: системный промпт, инструменты, историю диалога и внешние данные.
Представьте это как «искусство держать рабочий стол в порядке». Вы оставляете под рукой только нужные материалы, а законченное убираете. Завалите стол (контекстное окно) документами — и эффективность падает; с ИИ происходит ровно то же самое. Именно поэтому «что положить, а что оставить за бортом» — это задача проектирования, которую стоит решать.
💡 В одной фразе: prompt engineering = «отшлифовать инструкцию». Context engineering = «спроектировать весь объём информации, который видит модель.» Второе — более широкая дисциплина, включающая первое.
2. Почему это важно: стена «context rot»
«Если контекстное окно вмещает миллион токенов, почему бы не положить туда всё?» Вот в чём ловушка: чем больше токенов вы добавляете, тем сильнее на самом деле падает точность модели. Это явление называют «context rot» (деградация контекста).
Когда в 2025 году Chroma протестировала 18 ведущих моделей (GPT, Claude, Gemini и другие), каждая без исключения становилась менее надёжной по мере удлинения ввода. Причина в том, что «внимание» (attention) модели — это конечный бюджет. Каждый дополнительный токен размывает этот бюджет, и упустить релевантную информацию становится легче — а информацию, помещённую в середину длинного контекста, особенно легко не заметить («lost in the middle»).
Чем длиннее ввод, тем ниже точность (схематично)
※ Концептуальная иллюстрация. В измеренных исследованиях, например, работа Stanford (2023) сообщала о падении точности с 70–75% до 55–60% при подаче примерно 4 000 токенов справочного материала. На более сложных задачах деградация больше.
Короче говоря, тезис «чем длиннее контекст, тем лучше» неверен. Именно поэтому нужен context engineering — оставлять только самые малые и самые значимые токены. Особенно для долго работающих ИИ-агентов и кодинг-агентов context rot, как правило, оказывается главной причиной сбоев.
3. Что на самом деле входит в контекст
Многие склонны думать «контекст = промпт», но на деле в том же окне соседствует куда больше элементов — и все они расходуют бюджет.
Системный промпт
Базовые инструкции — роль, правила, тон.
Определения и результаты инструментов
Описания инструментов (например, MCP) и их вывод.
История диалога и работы
Уже состоявшийся обмен репликами плюс накопленные собственные рассуждения модели.
Внешние данные
Извлечённые документы и код, результаты поиска RAG и тому подобное.
Чем дольше задача, тем больше накапливается истории и результатов инструментов. Пустите это на самотёк — и окно быстро заполнится «важной информацией, погребённой в середине». Поэтому и нужны техники наведения порядка, описанные ниже.
4. Шесть ключевых техник
Опираясь на рекомендации Anthropic и практический опыт, приведём шесть высокоэффективных техник. Общий принцип — «найти наименьший набор высокозначимых токенов».
① Инструкции на правильном «уровне»
Слишком мелкая логика «если — иначе» хрупка; слишком расплывчатая не срабатывает. Цельтесь в середину: «конкретно, но гибко».
② Отбирайте инструменты
Убирайте инструменты, которые дублируют друг друга или где непонятно, какой именно применять. Сведите к нескольким однозначным.
③ Извлечение just-in-time
Вместо того чтобы загружать всё заранее, держите лишь пути к файлам и ссылки и извлекайте ровно в нужный момент. Та же идея, что и постепенное раскрытие в Claude Skills.
④ Compaction (сжатие через резюме)
Когда окно заполняется, резюмируйте историю и переносите её в свежее окно. Сохраняйте решения и открытые вопросы; отбрасывайте избыточный вывод инструментов.
⑤ Заметки (внешняя память)
Записывайте прогресс и ключевые моменты в файл за пределами окна и считывайте их обратно только при необходимости. Это сохраняет связность длинных задач.
⑥ Изоляция через суб-агентов
Тяжёлую работу вроде исследования передавайте суб-агенту и возвращайте в основной агент только резюме. Так подробный контекст не попадает в основную ветку.
⚠️ Не переусложняйте: сначала сделайте самое простое, что работает, прежде чем браться за хитроумные конструкции. Уже одно то, что вы не добавляете лишнюю информацию и почаще начинаете новую сессию, даёт многое.
5. Связь с промптами, RAG и Skills
Эти соседние понятия легко сливаются воедино, поэтому расставим их по местам. Context engineering — это «зонтичный образ мышления», который связывает их все.
- Prompt engineering: ремесло шлифовки инструкций. Это часть context engineering.
- RAG: метод поиска внешних знаний и их добавления в контекст. Одно из средств для решения вопроса «что извлечь и включить».
- Skills: механизм, который разворачивает процедуру только при необходимости. Конкретный пример извлечения just-in-time.
Итак, «отшлифовать инструкцию» (промпты), «добавить знания» (RAG) и «загружать и выгружать процедуры» (Skills) — context engineering рассматривает всё это как одну задачу проектирования: что поместить в окно, а что из него убрать.
6. Что можно сделать уже сегодня
Ещё до любой сложной реализации есть привычки, которыми может сразу же воспользоваться каждый.
- Начинайте новый чат, когда тема меняется: просто не тащить за собой старый контекст — и точность восстанавливается. Самый простой и самый действенный шаг.
- Не вставляйте длинные документы целиком: извлеките только релевантную часть и передайте её. Прикреплять весь текст часто только во вред.
- Просите резюмировать посреди длинной работы: попросите «перечислить принятые до сих пор решения и оставшиеся задачи», а затем продолжайте от этого (ручной compaction).
- Не нагромождайте инструменты и расширения: убирайте неиспользуемые MCP-серверы и навыки. Чем больше вариантов, тем сильнее модель колеблется.
💡 Это ещё и дешевле: не загружать лишние токены — значит напрямую экономить на стоимости токенов. Точность и стоимость улучшаются одновременно.
Итоги
Три вывода о context engineering.
- Что это: дисциплина проектирования и управления «всем объёмом информации, который видит модель», включая промпты. Следующая ступень после prompt engineering.
- Почему: из-за «context rot» — точность падает по мере добавления токенов. Контекст — это конечный бюджет.
- В чём фокус: оставлять только самые малые и самые значимые токены. Ваше оружие — отбор, наведение порядка (резюмирование), извлечение по требованию и изоляция через суб-агентов.
Начните с «новой сессии при смене темы» и «вставляйте только ключевые моменты». Если хотите копнуть глубже, посмотрите также Claude Skills и harness engineering.
FAQ
Q. Prompt engineering теперь устарел?
A. Нет. Prompt engineering остаётся важным как часть context engineering. Связь в том, что поверх навыка шлифовать инструкции добавляется взгляд на проектирование всего объёма информации.
Q. Решит ли проблему модель с бо́льшим контекстным окном?
A. Context rot случается даже при большом окне. Исследования показывают, что впихивать всё подряд просто потому, что есть место, на самом деле снижает точность. Большое окно — это «запас», а не «разрешение включать всё».
Q. Имеет ли это значение для обычного использования чата?
A. Да. Уже просто «начинать новый чат под каждую тему» и «вставлять только ключевые моменты» повышает качество ответов. Это советы, которыми можно пользоваться уже сегодня, даже если вы не инженер.
Q. В чём разница между RAG и context engineering?
A. RAG — это один конкретный метод: «искать внешние знания и добавлять их в контекст». Context engineering — более широкое понятие, которое целиком решает вопрос «что поместить в окно, а что из него убрать», и RAG является одной из его составляющих.