Содержание
«Хочу настроить ИИ под свою компанию» — когда возникает такая задача, fine-tuning (дообучение) оказывается одним из вариантов на столе. Это приём, при котором уже обученную LLM доучивают дальше, чтобы «вырастить» её под конкретную задачу. Но если броситься в это без подготовки, выйдет дорого и легко ошибиться. В этой статье для новичков разбираем, что такое fine-tuning, в чём он силён, чем отличается от RAG и промптинга, какие есть методы, что понадобится и в каком порядке начинать.
RAG — про «знания», FT — про «поведение»
— сначала промпты и RAG; fine-tuning — крайнее средство
Промптинг
Сначала доработайте инструкцию. Бесплатно и быстрее всего.
RAG (поиск)
Сюда добавляйте актуальные или внутренние знания.
Fine-tuning
Крайнее средство, когда и этого не хватает.
1. Что такое fine-tuning?
Fine-tuning (дообучение) означает взять ИИ-модель, обучение которой уже завершено (базовую модель), доучить её на данных, заточенных под вашу задачу, и превратить в специализированную модель. Например, «отвечай в нашем фирменном стиле», «выдавай в определённом формате» или «свободно владей терминологией области» — fine-tuning «вшивает» эти «привычки» и «шаблоны» в саму модель.
Представьте «обучение новичка». Даже если вы наняли блестящего специалиста (базовую модель), он не знает порядков вашей компании. Обучите его на ваших кейсах — и он сможет работать «по-вашему» без подробных инструкций каждый раз. Fine-tuning слегка переписывает сами веса (параметры) модели.
💡 В одну строку: fine-tuning = «дополнительное обучение, которое вшивает „шаблон“ в саму модель». Если промпты и RAG передают инструкции и материалы каждый раз, то FT навсегда меняет природу модели.
2. В чём он силён и в чём слаб
Ошибётесь в понимании — потерпите неудачу. Fine-tuning силён в «изменении поведения» и слаб в «запоминании актуальных знаний».
- Отвечать в заданном стиле и тоне
- Выдавать в определённом формате
- Свободно владеть формулировками области
- Делать длинные инструкции в каждом запросе ненужными
- Запоминать часто меняющуюся, актуальную информацию
- Точно хранить внутренние документы как «факты»
- Ссылаться на источник того, что выучил
- Обновляться после обучения (каждый раз нужно переобучение)
Если нужно корректно работать с актуальной информацией или внутренними данными, лучше fine-tuning подойдёт RAG (найти и добавить в контекст). И наоборот, закрепить шаблон — «всегда этот тон, этот формат» — это родная стихия fine-tuning.
3. Fine-tuning против RAG и промптинга
Есть три способа настроить ИИ, и они различаются по стоимости и роли. Сначала получим общую картину из таблицы.
| Метод | Роль | Стоимость | Лучше всего для |
|---|---|---|---|
| Промптинг | Доработать инструкцию | Почти $0 | Попробуйте первым; часто достаточно самого по себе |
| RAG | Найти и добавить знания | Средняя | Когда нужны актуальные или внутренние «факты» |
| Fine-tuning | Вшить поведение | Высокая | Закрепление стиля/тона; оптимизация затрат при больших объёмах |
⚠️ Частое заблуждение: «низкая точность = нам нужен fine-tuning» — это неверно. Как говорят эксперты, «80% случаев „нам нужен FT“ решаются лучшим поиском (RAG) или промптингом». И главное — не пропускайте порядок.
Мнемоника проста: «Факты и знания → RAG; характер и шаблон → fine-tuning; сначала промпты». В реальных production-системах стандарт 2026 года — сочетать все три: RAG для фактов, FT для поведения. Это логичное продолжение идей context engineering.
4. Основные методы (Full, LoRA, QLoRA)
Есть несколько способов сделать fine-tuning. Три, которые новичку стоит узнать первыми, — вот эти.
Full fine-tuning
Обновляет все параметры модели. Самый мощный, но требует больше всего вычислений и денег. Тяжёл для частных лиц и небольших команд.
LoRA
Замораживает «тело» и обучает лишь небольшой „адаптер“. Поскольку обновляется совсем немного, это легко и дёшево (флагман PEFT).
QLoRA (рекомендуется)
Сочетает LoRA с 4-битным квантованием, так что даже большие модели можно обучать на скромном GPU. Идеально для первого шага новичка.
Ключ в том, чтобы «сначала попробовать QLoRA». Как говорят эксперты: «если LoRA/QLoRA не сработали, то full fine-tuning почти наверняка тоже не сработает». В сочетании с локальной LLM можно даже экспериментировать понемногу на своём ПК.
5. Данные, стоимость и нужные инструменты
Самая сложная часть fine-tuning на деле не само обучение, а «подготовка данных». Держите в голове эти ориентиры.
- Объём данных: желательно 500+ качественных примеров. Менее 50 считается слишком малым сигналом для обучения. Качество важнее количества.
- Подготовка: сбор, очистка, форматирование и проверка качества могут занять от недель до месяцев. Вот где настоящая работа.
- Стоимость: серьёзные проекты могут обойтись от $5,000 до более чем $50,000. Fine-tuning у OpenAI публикуется примерно по $25–$100 за миллион обучающих токенов (в зависимости от модели).
- Инструменты: fine-tuning API от OpenAI, Unsloth, Axolotl, Hugging Face, Together, Databricks и другие. Для простоты начните с управляемого (managed) варианта.
※ Цифры приведены по раскрытиям вендоров и различным руководствам (по состоянию на июнь 2026 года). Реальные затраты сильно зависят от модели, объёма данных и метода.
6. Когда стоит его применять? (Порядок важен)
Железное правило, чтобы избежать неудачи, — «соблюдать порядок». Переходите к следующему шагу, только когда предыдущего не хватает.
- ① Доработайте промпты: prompt engineering решает многое. Бесплатно и проверяется мгновенно.
- ② Добавьте RAG: если нужны актуальные или внутренние факты, используйте RAG. Дешевле FT и проще обновлять.
- ③ Если шаблон всё равно не держится — тогда FT: рассматривайте его, только когда цель — «всегда этот тон/формат» или «оптимизировать затраты при больших объёмах».
💡 Гид по выбору: «не хватает знаний» → RAG. «не слушается / шаблон ломается» → fine-tuning. Разделите это правильно — и избежите напрасных вложений.
Итоги
Три вывода про fine-tuning.
- Что это: дополнительное обучение предобученной модели, которое вшивает поведение и шаблон в саму модель. Оно переписывает веса.
- Когда что использовать: знания → RAG, поведение → FT, сначала промпты. Многое из «нам нужен FT» решается лучшим поиском.
- С чего начать: начните с QLoRA. Ориентир — 500+ качественных примеров, а подготовка данных — настоящая работа. Затраты высоки.
Главная мысль: fine-tuning — это «крайнее средство». Сначала попробуйте промпты и RAG, а FT рассматривайте, когда шаблон всё равно не держится. Чтобы увидеть полную картину настройки ИИ, прочитайте вместе с этим RAG и context engineering.
FAQ
Q. Fine-tuning или RAG — что выбрать?
A. Решайте по цели. Нужны актуальные или внутренние «знания и факты»? RAG. Хотите закрепить «поведение, шаблон и тон»? Fine-tuning. На практике часто сочетают оба. Сначала начните с RAG и промптинга.
Q. Может ли частное лицо сделать fine-tuning?
A. Да. С QLoRA можно обучать небольшие модели даже на скромном GPU, а в сочетании с локальной LLM можно попробовать на своём ПК. Рекомендация — сначала прочувствовать процесс на небольшом наборе данных и небольшой модели.
Q. Сколько данных нужно?
A. Ориентир — 500+ качественных примеров. Менее 50 не даёт достаточного сигнала для обучения. При этом качество важнее количества — последовательные, тщательно подготовленные данные эффективнее.
Q. Научит ли fine-tuning актуальной информации?
A. В этом он слаб. Он отражает то, что существовало на момент обучения, но более поздние обновления требуют переобучения, и он не может ссылаться на источники. Точная работа с часто меняющейся информацией или внутренними документами — задача RAG.