«Хочу настроить ИИ под свою компанию» — когда возникает такая задача, fine-tuning (дообучение) оказывается одним из вариантов на столе. Это приём, при котором уже обученную LLM доучивают дальше, чтобы «вырастить» её под конкретную задачу. Но если броситься в это без подготовки, выйдет дорого и легко ошибиться. В этой статье для новичков разбираем, что такое fine-tuning, в чём он силён, чем отличается от RAG и промптинга, какие есть методы, что понадобится и в каком порядке начинать.

FINE-TUNING · ВЫРАСТИТЕ МОДЕЛЬ ПОД СЕБЯ

RAG — про «знания», FT — про «поведение»

— сначала промпты и RAG; fine-tuning — крайнее средство

ШАГ 1

Промптинг

Сначала доработайте инструкцию. Бесплатно и быстрее всего.

ШАГ 2

RAG (поиск)

Сюда добавляйте актуальные или внутренние знания.

ШАГ 3

Fine-tuning

Крайнее средство, когда и этого не хватает.

1. Что такое fine-tuning?

Fine-tuning (дообучение) означает взять ИИ-модель, обучение которой уже завершено (базовую модель), доучить её на данных, заточенных под вашу задачу, и превратить в специализированную модель. Например, «отвечай в нашем фирменном стиле», «выдавай в определённом формате» или «свободно владей терминологией области» — fine-tuning «вшивает» эти «привычки» и «шаблоны» в саму модель.

Представьте «обучение новичка». Даже если вы наняли блестящего специалиста (базовую модель), он не знает порядков вашей компании. Обучите его на ваших кейсах — и он сможет работать «по-вашему» без подробных инструкций каждый раз. Fine-tuning слегка переписывает сами веса (параметры) модели.

💡 В одну строку: fine-tuning = «дополнительное обучение, которое вшивает „шаблон“ в саму модель». Если промпты и RAG передают инструкции и материалы каждый раз, то FT навсегда меняет природу модели.

2. В чём он силён и в чём слаб

Ошибётесь в понимании — потерпите неудачу. Fine-tuning силён в «изменении поведения» и слаб в «запоминании актуальных знаний».

○ СИЛЁН (поведение)
  • Отвечать в заданном стиле и тоне
  • Выдавать в определённом формате
  • Свободно владеть формулировками области
  • Делать длинные инструкции в каждом запросе ненужными
✕ СЛАБ (знания)
  • Запоминать часто меняющуюся, актуальную информацию
  • Точно хранить внутренние документы как «факты»
  • Ссылаться на источник того, что выучил
  • Обновляться после обучения (каждый раз нужно переобучение)

Если нужно корректно работать с актуальной информацией или внутренними данными, лучше fine-tuning подойдёт RAG (найти и добавить в контекст). И наоборот, закрепить шаблон — «всегда этот тон, этот формат» — это родная стихия fine-tuning.

3. Fine-tuning против RAG и промптинга

Есть три способа настроить ИИ, и они различаются по стоимости и роли. Сначала получим общую картину из таблицы.

Метод Роль Стоимость Лучше всего для
Промптинг Доработать инструкцию Почти $0 Попробуйте первым; часто достаточно самого по себе
RAG Найти и добавить знания Средняя Когда нужны актуальные или внутренние «факты»
Fine-tuning Вшить поведение Высокая Закрепление стиля/тона; оптимизация затрат при больших объёмах

⚠️ Частое заблуждение: «низкая точность = нам нужен fine-tuning» — это неверно. Как говорят эксперты, «80% случаев „нам нужен FT“ решаются лучшим поиском (RAG) или промптингом». И главное — не пропускайте порядок.

Мнемоника проста: «Факты и знания → RAG; характер и шаблон → fine-tuning; сначала промпты». В реальных production-системах стандарт 2026 года — сочетать все три: RAG для фактов, FT для поведения. Это логичное продолжение идей context engineering.

4. Основные методы (Full, LoRA, QLoRA)

Есть несколько способов сделать fine-tuning. Три, которые новичку стоит узнать первыми, — вот эти.

Full fine-tuning

Обновляет все параметры модели. Самый мощный, но требует больше всего вычислений и денег. Тяжёл для частных лиц и небольших команд.

LoRA

Замораживает «тело» и обучает лишь небольшой „адаптер“. Поскольку обновляется совсем немного, это легко и дёшево (флагман PEFT).

QLoRA (рекомендуется)

Сочетает LoRA с 4-битным квантованием, так что даже большие модели можно обучать на скромном GPU. Идеально для первого шага новичка.

Ключ в том, чтобы «сначала попробовать QLoRA». Как говорят эксперты: «если LoRA/QLoRA не сработали, то full fine-tuning почти наверняка тоже не сработает». В сочетании с локальной LLM можно даже экспериментировать понемногу на своём ПК.

5. Данные, стоимость и нужные инструменты

Самая сложная часть fine-tuning на деле не само обучение, а «подготовка данных». Держите в голове эти ориентиры.

  • Объём данных: желательно 500+ качественных примеров. Менее 50 считается слишком малым сигналом для обучения. Качество важнее количества.
  • Подготовка: сбор, очистка, форматирование и проверка качества могут занять от недель до месяцев. Вот где настоящая работа.
  • Стоимость: серьёзные проекты могут обойтись от $5,000 до более чем $50,000. Fine-tuning у OpenAI публикуется примерно по $25–$100 за миллион обучающих токенов (в зависимости от модели).
  • Инструменты: fine-tuning API от OpenAI, Unsloth, Axolotl, Hugging Face, Together, Databricks и другие. Для простоты начните с управляемого (managed) варианта.

※ Цифры приведены по раскрытиям вендоров и различным руководствам (по состоянию на июнь 2026 года). Реальные затраты сильно зависят от модели, объёма данных и метода.

6. Когда стоит его применять? (Порядок важен)

Железное правило, чтобы избежать неудачи, — «соблюдать порядок». Переходите к следующему шагу, только когда предыдущего не хватает.

  • ① Доработайте промпты: prompt engineering решает многое. Бесплатно и проверяется мгновенно.
  • ② Добавьте RAG: если нужны актуальные или внутренние факты, используйте RAG. Дешевле FT и проще обновлять.
  • ③ Если шаблон всё равно не держится — тогда FT: рассматривайте его, только когда цель — «всегда этот тон/формат» или «оптимизировать затраты при больших объёмах».

💡 Гид по выбору: «не хватает знаний» → RAG. «не слушается / шаблон ломается» → fine-tuning. Разделите это правильно — и избежите напрасных вложений.

Итоги

Три вывода про fine-tuning.

  • Что это: дополнительное обучение предобученной модели, которое вшивает поведение и шаблон в саму модель. Оно переписывает веса.
  • Когда что использовать: знания → RAG, поведение → FT, сначала промпты. Многое из «нам нужен FT» решается лучшим поиском.
  • С чего начать: начните с QLoRA. Ориентир — 500+ качественных примеров, а подготовка данных — настоящая работа. Затраты высоки.

Главная мысль: fine-tuning — это «крайнее средство». Сначала попробуйте промпты и RAG, а FT рассматривайте, когда шаблон всё равно не держится. Чтобы увидеть полную картину настройки ИИ, прочитайте вместе с этим RAG и context engineering.

FAQ

Q. Fine-tuning или RAG — что выбрать?

A. Решайте по цели. Нужны актуальные или внутренние «знания и факты»? RAG. Хотите закрепить «поведение, шаблон и тон»? Fine-tuning. На практике часто сочетают оба. Сначала начните с RAG и промптинга.

Q. Может ли частное лицо сделать fine-tuning?

A. Да. С QLoRA можно обучать небольшие модели даже на скромном GPU, а в сочетании с локальной LLM можно попробовать на своём ПК. Рекомендация — сначала прочувствовать процесс на небольшом наборе данных и небольшой модели.

Q. Сколько данных нужно?

A. Ориентир — 500+ качественных примеров. Менее 50 не даёт достаточного сигнала для обучения. При этом качество важнее количества — последовательные, тщательно подготовленные данные эффективнее.

Q. Научит ли fine-tuning актуальной информации?

A. В этом он слаб. Он отражает то, что существовало на момент обучения, но более поздние обновления требуют переобучения, и он не может ссылаться на источники. Точная работа с часто меняющейся информацией или внутренними документами — задача RAG.