Другие AI-инструменты: обзоры и сравнения

Что такое LoRA? Настройка ИИ с помощью крошечного дообучения

Переобучать гигантский ИИ с нуля слишком дорого, но хочется настроить его под себя; LoRA (Low-Rank Adaptation) исполняет это желание, замораживая исходную модель и обучая лишь крошечную навесную деталь (адаптер), сокращая обучаемые параметры примерно на 90%. LoRA делает файнтюнинг заметно дешевле и быстрее и чрезвычайно популярна в генерации изображений вроде Stable Diffusion как маленький файл, добавляющий персонажа или стиль. Статья объясняет её через аналогию заплатки. LoRA — флагман параметрически эффективного файнтюнинга (PEFT): огромные исходные веса остаются замороженными, в каждый слой вставляется небольшая навесная матрица, и обучается только она (W = W0 + BA, где W0 заморожена, а BA — небольшая добавленная часть). В основе — открытие, что адаптация ИИ не требует больших изменений (достаточно низкого ранга). Преимущества: примерно на 90% меньше обучаемых параметров (по сообщениям, в 10,000x раз меньше на масштабе GPT-3), меньше памяти GPU (примерно в 3x раза), быстрее и дешевле обучение, без задержки при инференсе после слияния адаптера и ниже риск переобучения. Главная сила — сменные адаптеры: держите одну общую базу и мгновенно меняйте маленькие файлы LoRA (в несколько МБ) под каждый случай (поддержка, тон компании, конкретный персонаж). Многие впервые встречают LoRA в генерации изображений, где широко распространяются LoRA для Stable Diffusion, обучённые персонажу, стилю или объекту (добавить стиль, обучить персонажу, лёгкие и удобные для обмена). QLoRA сочетается с квантизацией, обучая LoRA поверх базы на 4-bit ради ~4x меньшей памяти, чем стандартная LoRA, позволяя дообучать огромные модели на потребительском GPU (иногда CPU) с минимальной потерей точности. По сравнению с полным файнтюнингом (обучение всех весов) LoRA отличается обучаемыми весами, стоимостью, результатом и областью применения; для большинства задач LoRA достаточно. Базу оставь как есть, приправляй понемногу. Цифры взяты из публичных материалов, ориентировочно.

2026/06/19

Другие ИИ AI-разработка Для начинающих

Что такое квантизация? Уменьшаем модели ИИ, чтобы запускать их на своей машине

Огромная модель 70B, работающая на одном домашнем игровом ПК вместо стойки дата-центровых GPU, возможна благодаря квантизации, которая снижает числовую точность весов модели, чтобы резко уменьшить размер и память. Если дистилляция переносит знания в отдельную меньшую модель, то квантизация делает ту же модель легче. Статья объясняет это через аналогию со сжатием фотографии. Квантизация заменяет веса, хранящиеся как дробные FP16/FP32, целыми INT8 (8-бит) или INT4 (4-бит), сокращая байты на вес (FP32=4, INT8=1, INT4=0,5); как сжатие RAW-фото в JPEG, жертвуем малой точностью ради большого выигрыша, и удивляет, как мало вы теряете. По памяти 4-bit использует около четверти от FP16: модель 70B падает с ~140GB до ~35GB, а 8B при 4-bit — ~4.5-5GB, умещаясь в средний GPU с 8GB VRAM для локального запуска (демократизация LLM). По точности INT8 почти без потерь, а INT4 деградирует менее чем на 4% на обычных Q&A и задачах на здравый смысл, но потеря заметнее для математики, генерации кода и сложных рассуждений (проявляется как небольшой рост перплексии), поэтому выбирайте разрядность под задачу. Основные методы: GPTQ (первопроходец точного 4-bit), AWQ (защищает ~1% самых важных весов, часто на 1-2% точнее и быстрее), GGUF (формат llama.cpp/Ollama, Q2_K-Q8_0, гибрид CPU+GPU, для локального) и QLoRA (4-bit база плюс LoRA для файнтюнинга на потребительском GPU). Это отличается от дистилляции (перенос в отдельную малую модель) и файнтюнинга (добавление знаний задачи), и эти три обычно комбинируют (квантизовать дистиллированную модель; файнтюнить квантизованную базу). Чтобы начать, запустите модель GGUF с Ollama одной командой, выберите Q4/Q8 по VRAM и избегайте INT4 для кода или точной математики. Большинство крупных моделей поставляются уже квантизованными, так что вы просто скачиваете и используете их. Сохраняем ум, убираем только вес. Цифры взяты из публичных материалов, ориентировочны.

2026/06/19

Другие ИИ AI-разработка Для начинающих

Что такое дистилляция моделей? Перенос знаний от большого ИИ к маленькому

Огромный, высокопроизводительный ИИ умён, но тяжёл и дорог; дистилляция моделей (knowledge distillation) решает это, перенося знания крупной модели-учителя в небольшую модель-ученика и сохраняя 95%+ производительности учителя при десятикратно меньшем размере и скорости. Статья объясняет это через аналогию «учитель — ученик». Ключ — soft labels: обычное обучение учит только «ответ — кошка» (hard label), а дистилляция передаёт всё распределение вероятностей учителя, например «90% кошка, 8% собака, 2% лиса», чья степень сомнения несёт богатую информацию; параметр temperature смягчает вероятности, открывая тонкие отношения (реальный пример: GPT-4o mini дистиллирована из GPT-4o). Преимущества: быстро и дёшево, ~в 10 раз компактнее при сохранении 95%+ производительности, работа на edge, сила в специализации. Два подхода: white-box (полный доступ к весам и внутренним представлениям, более глубокий перенос; для своих или OSS-моделей) и black-box (видны только выходы/ответы API; чужой API как учитель может нарушать условия). Отличается от квантизации (сжатие точности весов той же модели) и fine-tuning (дообучение существующей модели под задачу) — дистилляция переносит знания в отдельную малую модель, и все три комбинируемы. Правовая сторона стала большой темой 2026 года: технология легитимна, но OpenAI, Anthropic, Mistral и xAI имеют анти-конкурентные положения о дистилляции, запрещающие использовать выходы для создания конкурирующих моделей, поэтому дистилляция конкурента из ограниченного API может нарушать условия. Спор OpenAI против DeepSeek (OpenAI заявила, что связанные с DeepSeek аккаунты обходили ограничения, чтобы получить выходы для дистилляции, тогда как условия DeepSeek, по сообщениям, разрешают дистиллировать её выходы) показывает, что оценка зависит от того, чьи условия API применяются, а Claude Fable 5/Mythos 5, по сообщениям, ограничивают ответы по работе, помеченной как дистилляция. Советы: используйте свои или лицензированные OSS-модели как учителя, проверяйте анти-дистилляционные положения перед использованием коммерческого API и оценивайте, не является ли использование «разработкой конкурирующей модели». Ум — от большой модели, эксплуатация — от малой, но выбор учителя меняет результат технически и юридически. Цифры приведены по открытым материалам, ориентировочно.

2026/06/19

Другие ИИ AI-разработка Для начинающих

Что такое fine-tuning? Fine-tuning против RAG, LoRA/QLoRA и когда его применять — руководство для новичков

Когда нужно настроить ИИ под свою компанию, fine-tuning (дообучение) — один из вариантов, но без подготовки выйдет дорого и легко ошибиться. Это руководство для новичков объясняет fine-tuning: взять уже обученную базовую модель, доучить её на данных под вашу задачу и превратить в специализированную модель, которая вшивает «поведение» (фирменный стиль, формат вывода, терминологию области) в саму модель, переписывая её веса. Fine-tuning силён в изменении поведения, но слаб в запоминании актуальных знаний, поэтому правило такое: «факты и знания → RAG, характер и шаблон → fine-tuning, сначала промпты». Как отмечают эксперты, около 80% случаев «нам нужен fine-tuning» решаются лучшим поиском (RAG) или промптингом, так что порядок важен. В статье разбираются: что такое fine-tuning (аналогия с обучением новичка), в чём он силён и слаб, сравнительная таблица fine-tuning против RAG и промптинга, основные методы (full fine-tuning, LoRA и QLoRA — 4-битное квантование, достаточно лёгкое для новичков), что понадобится (ориентир 500+ качественных примеров, при этом подготовка данных — настоящая работа; затраты от $5,000 до более чем $50,000, fine-tuning у OpenAI примерно по $25–$100 за миллион обучающих токенов; инструменты вроде OpenAI, Unsloth, Axolotl и Hugging Face) и в каком порядке начинать. Fine-tuning — это крайнее средство.

2026/06/13

Другие ИИ Среда разработки и инфраструктура Для начинающих

Как запустить локальную LLM: ИИ на собственном ПК — характеристики, инструменты и лучшие модели для новичков

Вы наверняка считаете, что LLM обязательно работает в облаке, но к 2026 году запуск ИИ целиком внутри собственного ПК — «локальная LLM» — стал реальным вариантом. Локальная LLM означает запуск модели вроде ChatGPT или Claude прямо на вашей машине, а не в облаке. Три главных преимущества: приватность (ввод никогда не покидает устройство), нулевая стоимость (нет платы за API) и работа офлайн (без интернета). Минусы: она не так умна, как топовый облачный ИИ, требует достаточно мощного ПК, нуждается в некоторой настройке и не имеет актуальных знаний. Это руководство для новичков объясняет, что такое локальная LLM (аналогия «стриминг против скачивания»), её плюсы и минусы, нужные характеристики и квантование (формат GGUF, где Q4_K_M — выбор по умолчанию, сохраняющий качество при урезании памяти примерно до четверти; около 0,5 ГБ памяти на 1B параметров при 4-битном квантовании), как начать (графический LM Studio для новичков, командный Ollama для разработчиков — 52 миллиона загрузок в месяц в первом квартале 2026), рекомендуемые модели 2026 года (Llama 3.2 7B, Google Gemma 4, Alibaba Qwen3.5, а также DeepSeek и Mistral — все открытые) и когда выбирать локально или облако (локально — для конфиденциальной, массовой и офлайн-работы; облако — для сложных задач). Самый быстрый первый шаг: запустить одну небольшую модель 3B–7B в LM Studio.

2026/06/13

Claude Другие ИИ Для начинающих

Подробный разбор релиза Claude Fable 5 — возможности, бенчмарки, цены, отличие от Mythos и новый дизайн безопасности

9 июня 2026 года Anthropic выпустила Claude Fable 5 — впервые в форме, доступной обычным пользователям и разработчикам, раскрыв возможности уровня «Mythos», флагманской модели, которую внутри компании давно считали самой мощной. Anthropic называет её самой мощной моделью из тех, что предлагает широкому кругу, со слоганом «создана для долгой и сложной работы». Этот разбор, написанный так, чтобы понял и новичок, охватывает то, что такое Fable 5 (публичная, безопасная форма возможностей класса Mythos, оптимизированная под завершение марафона, а не под один вопрос и ответ; идентификатор модели claude-fable-5), чем она отличается от своего близнеца Mythos 5 (идентичны внутри, различаются только ограничители; публика использует Fable), бенчмарки (SWE-Bench Pro 80.3% против Opus 4.8 69.2 и GPT-5.5 58.6, впервые в истории 90%+ на Hex, лучший результат на Cognition FrontierCode и Hebbia, новый SOTA в зрении с игрой в Pokémon без помощников), её настоящую силу в долгой автономности (фокус на миллионах токенов, 12-часовые запуски, Stripe завершила миграцию Ruby в 50 миллионов строк за один день вместо двух с лишним месяцев вручную, файловая память дала игровой задаче в 3 раза больше прироста, чем у Opus 4.8, GitHub сообщил о высокоавтономном долгосрочном кодинге), цены и доступность ($10 ввод / $50 вывод за 1M токенов, контекст 1M и вывод 128K, бесплатно в рамках каждого плана 9–22 июня, затем кредиты, API claude-fable-5 и GitHub Copilot), прямое сравнение с Opus 4.8 (стандартная $5/$25 против $10/$50, +11.1 пункта в SWE-Bench Pro, тот же контекст 1M, Opus 4.8 Fast Mode по $10/$50; тяжёлую работу — Fable 5, повседневную — стандартной Opus 4.8), главный новый дизайн безопасности (классификаторы кибер, биохимии и дистилляции, откатывающиеся к Opus 4.8 только при опасности, срабатывающие менее чем в 5% сессий, так что 95%+ работают на полной производительности, с хранением трафика класса Mythos 30 дней), контекст выпуска через несколько дней после предупреждения, что ИИ слишком опасен (третий путь, закрывающий только опасные зоны), и когда её использовать. Цифры приводятся по заявлению Anthropic и сообщениям и могут измениться.

2026/06/10

Другие ИИ Дизайн Для начинающих

Введение в генерацию видео с помощью ИИ [2026] — расстановка сил после Sora, Veo/Kling и советы по промптам

Вводишь текст — и за секунды рождается видео со звуком: то, что ещё недавно было научной фантастикой, в 2026 году стало реальностью, и ситуация меняется с пугающей скоростью. Sora от OpenAI, которая была у всех на устах, закрыла приложение и веб-версию в апреле 2026 года (API отключат позже, в сентябре); её место заняли Google Veo, Kling и Runway. Это актуальное (июнь 2026) и не привязанное к инструменту руководство охватывает, что такое генерация видео на ИИ (создание движущихся кадров из слов или изображения, где синхронизация звука, 1080p–4K и «изображение-в-видео» теперь стандарт), расстановку сил в 2026 году (закрытие Sora — сообщается о давлении на ресурсы и расходы и снижении числа пользователей — и нынешние лидеры Google Veo 3.1, Kling 3.0 и Runway Gen-4.5, при норме посекундной оплаты), как это работает (диффузионные модели, расширенные на измерение времени; текст-в-видео и изображение-в-видео), общий рабочий процесс из 5 шагов (выбрать инструмент, промпт/изображение, задать длину/формат/звук, сгенерировать и выбрать, соединить при монтаже), главные советы по промптам для видео (объект + движение + работа камеры + стиль + длина + звук, где глаголы и камера — ключевое, одна склейка одно действие, используйте «изображение-в-видео», генерируйте с запасом), что она уже умеет, а что пока нет (длинные произведения за один заход и полная консистентность остаются трудными, а посекундная стоимость накапливается), и основы прав, водяных знаков и этики (SynthID и C2PA делают происхождение ИИ стандартным и неудаляемым, чисто ИИ-вывод защищён слабо с различиями по странам, коммерческое использование зависит от условий, а дипфейки реальных людей под запретом). Делайте склейки и соединяйте их при монтаже, а не стремитесь к длинному произведению за один заход. Поскольку область меняется быстро, всегда сверяйтесь с актуальной официальной информацией.

2026/06/05

Другие ИИ Дизайн Для начинающих

Как начать с генерации изображений ИИ — как это работает, 4 шага, анатомия промпта и права

«Я не умею рисовать, значит, это не для меня» — это предубеждение насчёт генерации изображений ИИ перевёрнуто с ног на голову. Достаточно дать указание словами — и через секунды у вас готов визуал профессионального уровня. Это межинструментальное руководство охватывает: что такое генерация изображений ИИ (создание изображений с нуля посредством слов — навык умения формулировать, а не рисовать; версия промпт-инжиниринга для изображений), как это работает (диффузионные модели вырезают картинку из случайного шума, используя ваш промпт как подсказку, каждый раз рисуя с нуля, отчего результаты «дрожат»), общий рабочий процесс из 4 шагов, работающий в любом инструменте (выбрать инструмент, написать промпт, сгенерировать и выбрать, доработать и завершить — итерации это базовая предпосылка), ключевую анатомию промпта из 6 частей (объект, сцена/обстановка, стиль, свет/цвет, композиция/ракурс, технические параметры) плюс негативные промпты и соотношение сторон — хотя GPT Image и Imagen предпочитают простые предложения, тогда как инструменты семейства Stable Diffusion любят списки слов и негативы, 7 приёмов мастерства (перебирать число вариантов, добавлять понемногу, референсы, inpainting, фиксировать сид, увеличивать, сохранять удачные промпты), с чем ИИ справляется плохо (кисти, текст, согласованность, точность деталей) и обходные приёмы, а также основы прав, коммерческого использования и этики для работы (чисто ИИ-результат защищён слабо по позиции Ведомства США по авторским правам и решению по делу Thaler 2025 года, с различиями по странам; коммерческое использование зависит от условий каждого инструмента; дипфейки и несанкционированное копирование стиля недопустимы; распространяются метаданные о происхождении вроде C2PA у DALL-E). Какой инструмент выбрать и приёмы по конкретным инструментам — со ссылками на сравнение, Midjourney и Stable Diffusion. Знайте анатомию, перебирайте число вариантов, добавляйте слова понемногу — и кто угодно сможет приблизиться к задуманному кадру.

2026/06/05

Другие ИИ Эффективность работы Для начинающих

Промпт-инжиниринг: практический сборник — 6 частей и приёмы, чтобы получать от ИИ нужные ответы

Вы задаёте одному и тому же ИИ один и тот же вопрос, и при этом один называет его бесполезным, а другой поражается тому, насколько он способный — и истинная причина этого разрыва часто не в мощности ИИ, а в том, как написан промпт. Это практический сборник того самого навыка, промпт-инжиниринга, выстроенный так, чтобы новичок мог пользоваться им сразу. Он охватывает, что такое промпт-инжиниринг (навык проектировать и улучшать вашу инструкцию для ИИ — не код, а мастерство того, как формулировать), три принципа, которые меняют результат (будьте конкретны, давайте контекст, задавайте формат вывода, плюс «делай X» вместо «не делай Y»), основные 6 частей хорошего промпта (роль, контекст, инструкция, примеры, формат, ограничения — элементы, общие для крупных фреймворков вроде COSTAR и RCOF; все шесть нужны не всегда), 7 практических приёмов (дать роль, показать образец/few-shot, рассуждать по шагам, зафиксировать формат вывода, структурировать разделителями, не просить слишком много за раз и итерировать — сильнейший из них итерация), пример до/после, приёмы следующего уровня (цепочка рассуждений, самосогласованность, цепочки промптов, ReAct — хотя рассуждающие модели вроде o-серии и расширенного мышления у Claude делают CoT внутри, поэтому формулировка цели работает лучше), 7 частых ошибок, а также особенности моделей и безопасность ввода. С внутренними ссылками на советы по промптам для разработки приложений и меры предосторожности при вводе. Превращайте расплывчатое в конкретное, сваливание в диалог — улучшаться может любой уже сегодня.

2026/06/05

Другие ИИ Для начинающих

Что такое технологическая сингулярность? Понятное руководство для новичков — механизм, прогнозы и отличие от AGI

В июне 2025 года Сэм Альтман из OpenAI написал в блоге: «Мы прошли горизонт событий; взлёт начался» («The Gentle Singularity»). Однако другие исследователи напрочь отвергают идею как то, что никогда не наступит. Это руководство для новичков объясняет, что сингулярность (технологическая сингулярность) — это «точка перелома, в которой ИИ превосходит человеческий интеллект и начинает совершенствовать сам себя, так что прогресс становится взрывообразно быстрым и его уже нельзя ни предсказать, ни контролировать» (гипотеза, не реализованная на 2026 год). Разбираем суть — взрыв интеллекта = рекурсивное самосовершенствование, где умный ИИ строит ещё более умный, а улучшающий меняется с человека на ИИ; чем это отличается от AGI и ASI (AGI/ASI — «состояния» интеллекта, сингулярность — «событие» обретения непредсказуемости; AGI → самосовершенствование → внезапный скачок к ASI = сингулярность); историю термина (1965 — «взрыв интеллекта» I. J. Good → 1993 — Виндж делает название популярным → Курцвейл выводит в мейнстрим с «2045»); широкий разброс прогнозов (Курцвейл 2045, Альтман «уже началась», Виндж, а также скептики вроде Gary Marcus и «тормоз сложности» покойного Paul Allen); внезапный жёсткий взлёт против постепенного мягкого; надежды (прорывы в медицине и науке) и риски (потеря контроля, проблема согласования); глубокий скепсис (тормоз сложности, физические пределы, совсем иная вещь); и распространённые мифы вроде «роботы правят», «немедленно, как только появится AGI» и «фиксировано на 2045». Не бойтесь её чрезмерно и не мечтайте слишком сильно — выжимайте максимум из сегодняшнего ИИ, спокойно наблюдая за тем, что может прийти дальше.

2026/06/05

Другие ИИ Эффективность работы Для начинающих

Влияние ИИ на юристов, бухгалтеров и налоговых консультантов: что меняется, а что остаётся

В 2023 году юрист получил санкции после того, как записка, написанная с помощью ChatGPT, процитировала дела, оказавшиеся выдумкой ИИ, — и этот случай распространил по миру настороженность к теме права и ИИ. И всё же за несколько лет внедрение резко выросло: говорят, более 90% юристов используют тот или иной ИИ в повседневной работе. Как следующая часть нашей серии о влиянии ИИ по отраслям после #068 (торговля), #094 (маркетинг) и #097 (консалтинг), здесь разбираются профессии. Текущая ситуация в цифрах (62% юристов сообщают об экономии времени 6–20% в неделю; Harvey и CoCounsel от Thomson Reuters обработали 10М+ юридических документов в 1-м квартале 2026; использование генеративного ИИ в налоговых/бухгалтерских/аудиторских фирмах подскочило с 8% в 2024 до 21% в 2025; исследование Stanford показывает, что рабочие места для начинающих в таких сферах, как бухгалтерия, упали на 13% к 2022, у бухгалтеров +5%, у счетоводов -5%), какую работу меняет ИИ по профессиям (юристы = поиск дел, проверка договоров, извлечение обязательств; бухгалтеры = бухучёт, проверка первички, выборка, выявление рисков; налоговые консультанты = ввод данных, черновики деклараций, поиск норм — ИИ делает подготовительную работу, человек выносит окончательное решение), главную ловушку галлюцинации (выдумывание несуществующих дел/норм — ведущее к санкциям и потере доверия; Harvey заявляет о 99,7% точности проверенных ссылок и помечает остальные, CoCounsel опирает ссылки на базу данных дел, цитируя только реальные дела), неизменную суть ценности (окончательное суждение, профессиональный скептицизм, этика, серые налоговые суждения и — решающее — подпись и юридическая ответственность, которые нельзя делегировать ИИ), кризис молодых специалистов (автоматизация ученической рутины) и новые роли (специалисты по ИИ-комплаенсу, налоговые промпт-инженеры), а также советы по ролям для практиков, будущих специалистов и клиентов (сверяйте ссылки и цифры с первоисточниками; уточняйте обращение с конфиденциальностью). Регулирование и ответственность различаются по странам; в Японии ИИ-функции в бухгалтерском ПО тоже широко распространены. Вопрос, который ставит ИИ: то, что вы продаёте, — это работа или суждение и ответственность?

2026/06/05

Другие ИИ Эффективность работы Для начинающих

Как сделать субтитры и расшифровку из видео/аудио с помощью ИИ

Раньше на субтитрование часового видео вручную уходил целый день — слушать, ставить на паузу, печатать, выставлять тайм-код. В 2026 году этот ад завершается тем, что вы "закидываете видео и ждёте несколько минут". С упором на субтитрование/расшифровку видео- и аудиоконтента (протоколы совещаний — в #086, OCR изображений — в #091) этот гид разбирает четыре этапа, которые автоматизирует ИИ (извлечение звука → расшифровка с диаризацией → нарезка тайм-кодов в SRT/VTT → перевод и оформление), отличие субтитров (SRT/VTT) от расшифровки и когда что использовать, сравнение инструментов (бесплатный и приватный Whisper, монтаж-всё Descript, высокоточный многоязычный Sonix и Happy Scribe, удобный для частных лиц Notta, мобильный CapCut, самые простые авто-субтитры YouTube — многие под капотом используют распознавание семейства Whisper), наиболее воспроизводимый процесс из 4 шагов (подготовка → расшифровка → вычитка → экспорт/наложение SRT/VTT), рекомендации по сценариям (YouTube, подкасты, лекции, интервью, конфиденциальное, многоязычное), шесть приёмов точности, где качество звука — это 80% результата (качество, настройка языка, список имён собственных, поиск-замена, диаризация, длина строк), главный путь многоязычного процесса (довести оригинал → ИИ-перевод → проверка носителем) и подводные камни — излишнее доверие к точности, слабость на шуме и жаргоне, авторские права, загрузка конфиденциального и смещение тайм-кодов. На чистом звуке точность 90–96% (по публикациям, зависит от условий), а труд падает на 80–90%. Работу — ИИ; отделку — проверку имён собственных и просмотр до публикации — вам.

2026/06/05