Перейти к содержимому

Руководства, сравнения и новости об инструментах ИИ

Руководства, сравнения и новости об инструментах ИИ для начинающих

Рекомендуемая статья

Что такое Agent Evals? Измеряем и результат, и trajectory
Claude AI-разработка Для начинающих

Что такое Agent Evals? Измеряем и результат, и trajectory

Agent Evals — это процесс систематического измерения того, способен ли агент, который использует инструменты и делает несколько шагов к цели, действительно выполнять свои задачи. Это эволюция LLM evals, расширяющая объект оценки с «одного вывода» до «последовательности действий». Поскольку агент планирует, вызывает инструменты и обновляет состояние, одного финального вывода недостаточно; Google отмечает, что нужно понимать «почему» за действиями агента, и делит оценку на финальный ответ и trajectory. Пять измерений: outcome (успех задачи, судят по финальному состоянию — существует ли бронь в DB, а не по высказыванию «я забронировал»), trajectory (разумные шаги, правильные инструменты в правильном порядке), корректность использования инструментов (правильный инструмент и аргументы, проверка имён функций и типов), эффективность (шаги, токены, стоимость, задержка — часто сигналы observability, привнесённые в оценку) и качество финального ответа (через LLM-as-judge или рубрику). Грейдеры — это код (быстрый/дешёвый/воспроизводимый, но хрупкий), LLM-as-judge (гибкий, но недетерминированный и требует калибровки) и человек (золотой стандарт, но дорогой — избегайте по возможности). Anthropic рекомендует оценивать результат, а не путь: механическое сопоставление trajectory «слишком жёсткое и хрупкое», поскольку агенты находят допустимые альтернативы, тогда как Google и Microsoft предлагают метрики сопоставления trajectory для диагностики провалов. Уникальные подводные камни — недетерминированность (pass^k), накапливающиеся ошибки (p^t), reward hacking (роботизированная рука DeepMind, имитирующая захват) и устаревшие или загрязнённые наборы eval. Практический приём, по Anthropic: превратить 20–50 продакшен-провалов в тест-кейсы, запустить автоматическую оценку в CI, разделить capability и regression evals и писать их рано. Бенчмарки вроде SWE-bench, tau-bench, WebArena, GAIA, OSWorld и BFCL полезны как референсы (оценки меняются от версии, поэтому не принимайте их за чистую монету). На основе официальной информации, с пометкой неопределённостей.

Последние статьи

145 статей
10 сценариев применения ИИ-агентов — реальные примеры автоматизации бизнеса, эффект и с чего начать

10 сценариев применения ИИ-агентов — реальные примеры автоматизации бизнеса, эффект и с чего начать

«Ладно, ИИ-агенты потрясающие — но для чего их реально использовать?» Этот вопрос возникает у каждого после знакомства с основами, и в 2026 году ответ уже не дело будущего: в поддержке, продажах, бухгалтерии, разработке и HR агенты начали реально брать на себя рутину, а один опрос сообщает, что 65% компаний уже что-то автоматизировали. Эта статья обходится без абстракций и даёт 10 конкретных сценариев применения по функциям с реальными примерами и цифрами. Она охватывает, почему сценарии важны именно сейчас (агенты не просто отвечают, но действуют, переходя из экспериментов в производство; Gartner прогнозирует, что треть корпоративного ПО получит агентные функции к 2028 году и 80% обращений будут решаться с минимальным участием человека к 2029), как распознать пригодную для автоматизации работу (высокая повторяемость × большой объём × требует суждения — часть про суждение и есть отличие от старого RPA; крупные решения оставляйте людям через «агент готовит, человек утверждает»), сами 10 кейсов (поддержка первой линии, продажи 200 писем в час при отклике в 2–4× выше, маркетинг с 2 до 10 статей в неделю, разработка с более 35% кода от ИИ, ИТ-эксплуатация с авто-восстановлением, финансы с KPI и PDF, выявление мошенничества в реальном времени, HR с AMD и 80% ускорением, анализ данных в отчёты, диспетчерская вышка цепочки поставок), реальность ROI (3.5x за три года, окупаемость 3–14 месяцев, снижение затрат на 30–60% по McKinsey, но лишь 23% масштабируют) и как начать безопасно (одна задача, малый прототип, человек утверждает, измерять и расширять) с минимальными правами. Цифры — цитаты опросов и заявлений компаний, как тенденции. Пересмотрите работу через повторяемость, объём и суждение и сделайте один маленький шаг.

Подробный разбор релиза Claude Fable 5 — возможности, бенчмарки, цены, отличие от Mythos и новый дизайн безопасности

Подробный разбор релиза Claude Fable 5 — возможности, бенчмарки, цены, отличие от Mythos и новый дизайн безопасности

9 июня 2026 года Anthropic выпустила Claude Fable 5 — впервые в форме, доступной обычным пользователям и разработчикам, раскрыв возможности уровня «Mythos», флагманской модели, которую внутри компании давно считали самой мощной. Anthropic называет её самой мощной моделью из тех, что предлагает широкому кругу, со слоганом «создана для долгой и сложной работы». Этот разбор, написанный так, чтобы понял и новичок, охватывает то, что такое Fable 5 (публичная, безопасная форма возможностей класса Mythos, оптимизированная под завершение марафона, а не под один вопрос и ответ; идентификатор модели claude-fable-5), чем она отличается от своего близнеца Mythos 5 (идентичны внутри, различаются только ограничители; публика использует Fable), бенчмарки (SWE-Bench Pro 80.3% против Opus 4.8 69.2 и GPT-5.5 58.6, впервые в истории 90%+ на Hex, лучший результат на Cognition FrontierCode и Hebbia, новый SOTA в зрении с игрой в Pokémon без помощников), её настоящую силу в долгой автономности (фокус на миллионах токенов, 12-часовые запуски, Stripe завершила миграцию Ruby в 50 миллионов строк за один день вместо двух с лишним месяцев вручную, файловая память дала игровой задаче в 3 раза больше прироста, чем у Opus 4.8, GitHub сообщил о высокоавтономном долгосрочном кодинге), цены и доступность ($10 ввод / $50 вывод за 1M токенов, контекст 1M и вывод 128K, бесплатно в рамках каждого плана 9–22 июня, затем кредиты, API claude-fable-5 и GitHub Copilot), прямое сравнение с Opus 4.8 (стандартная $5/$25 против $10/$50, +11.1 пункта в SWE-Bench Pro, тот же контекст 1M, Opus 4.8 Fast Mode по $10/$50; тяжёлую работу — Fable 5, повседневную — стандартной Opus 4.8), главный новый дизайн безопасности (классификаторы кибер, биохимии и дистилляции, откатывающиеся к Opus 4.8 только при опасности, срабатывающие менее чем в 5% сессий, так что 95%+ работают на полной производительности, с хранением трафика класса Mythos 30 дней), контекст выпуска через несколько дней после предупреждения, что ИИ слишком опасен (третий путь, закрывающий только опасные зоны), и когда её использовать. Цифры приводятся по заявлению Anthropic и сообщениям и могут измениться.

Как ИИ расширяет разрыв в способностях среди офисных работников? Смещение оси, пол против потолка и как не остаться позади

Как ИИ расширяет разрыв в способностях среди офисных работников? Смещение оси, пол против потолка и как не остаться позади

«ИИ отнимет вашу работу» — привычный припев, но тихо идёт более повседневное изменение: среди коллег одной компании на одной должности постепенно растёт разрыв в результатах — потому что люди разделяются на тех, кто хорошо пользуется ИИ, и тех, кто не пользуется или не умеет. В этой статье на свежих данных опросов разобрано, как ИИ расширяет разрыв в способностях среди офисных работников, и это не простая история «побеждают умные». Показано, что ось, создающая разницу, смещается от сырой мощи (знания, скорость, опыт) к «умению хорошо пользоваться ИИ (ИИ-грамотность)»; что ИИ действует двумя противоположными силами одновременно (на уровне задач сильнее подтягивает новичков и сжимает разрыв с ветеранами, тогда как в масштабе коллектива уже выигрышные — высокооплачиваемые, старшие роли — осваивают ИИ раньше и глубже, расширяя разрыв); положение дел в цифрах (один опрос: свыше 60% высокооплачиваемых пользуются ИИ ежедневно против 16% низкооплачиваемых, оценочная надбавка +56% к зарплате за ИИ-навыки на той же должности и около 39%, ощущающих, что чрезмерная зависимость подтачивает способности — всё цитируется и различается по опросам); четыре силы, расширяющие разрыв (доступ к инструментам, время и обучение, самостоятельность для экспериментов, готовность учиться — первые три играют на руку старшим ролям, лишь последнюю вы можете изменить сами); три типа (вырывается вперёд / топчется на месте / остаётся позади, ключ — вложить освободившееся время в суждения, планирование и людей); ловушка чрезмерной зависимости, когда становишься «умеет пользоваться, но не думает» (проверяйте ИИ как черновик, не глотайте целиком); как не остаться позади (прикоснитесь, попробуйте на своей работе, выработайте привычку проверять, инвестируйте освободившееся время, делитесь, продолжайте учиться); и взгляд организации (мало компаний видят ROI, трения между уровнями, постройте систему, где все могут учиться). Разрыв открывается по разнице в действии, а не в таланте — что и обнадёживает, ведь учиться пользоваться ИИ может начать кто угодно уже сегодня.

Первый шаг к заработку из дома с ИИ, с нуля — старт без личных встреч для хикикомори и NEET

Первый шаг к заработку из дома с ИИ, с нуля — старт без личных встреч для хикикомори и NEET

Выйти из дома трудно, говорить с людьми тяжело, сейчас вы не работаете — и всё же возможность превратить «работу из дома, без встреч с кем-либо, в своём темпе» в доход по-настоящему расширилась с ИИ. Это руководство для конкретной аудитории как можно честнее и мягче описывает первый шаг для человека в положении хикикомори (затворника) или NEET, чтобы зарабатывать из дома, с нуля, с помощью ИИ. Оно сразу обещает не говорить «любой легко заработает тысячи в месяц» (обычно это ложь или приманка для продаж) и открыто пишет о реальной сложности, времени и предостережениях. Здесь — почему «ИИ × работа из дома» подходит (делается без личных встреч, легко начать с нуля, в своём темпе — ИИ снижает стену как напарник), три честные истины (сразу не заработаешь, а первая цель — ваши первые несколько долларов; ИИ — усилитель усилий, а не магия, что угодно на ноль есть ноль; результата добиваются продолжающие, а не «умные»), способы заработка без общения с людьми (тексты, транскрибация/субтитры, ассеты с генерацией изображений ИИ, обработка данных, проверка переводов, цифровые товары — сначала выберите одно), первый шаг сегодня (прикоснуться к бесплатному ИИ, выбрать одно направление, сделать пробный образец — сделать прежде, чем заработать), как накапливать маленькие победы (портфолио, один недорогой заказ, рост оценок, повышение ставки/объёма — собирайте победы, а не суммы, первый заказ ценнее всего), как продолжать и беречь себя (не сравнивайте, дробите на малое, отдыхать нормально, откажитесь от перфекционизма, не несите в одиночку — поддержка трудоустройства и консультации), и предостережения о мошенничестве/шумихе, риске полностью полагаться на ИИ, налогах/иждивенцах (избегайте предложений с предоплатой, легитимный краудсорсинг бесплатен, сверяйтесь с официальной информацией). Это не «любой, легко», но шаг, посильный и вам, по-настоящему существует — возвращайте «я тоже могу», по одному за раз.

Что происходит при инциденте безопасности ИИ-агента? Основы прав, утечек и ошибочных действий

Что происходит при инциденте безопасности ИИ-агента? Основы прав, утечек и ошибочных действий

Достаточно попросить ИИ-агента «прочитай это письмо и ответь», и он сам думает, пользуется инструментами и реально выполняет работу — но именно потому, что он действует сам, становится возможным род инцидентов, которого у чат-ИИ никогда не было, и в 2026 году эта опасность начала смещаться из теории в реальный ущерб. Это руководство для новичков раскладывает инциденты безопасности ИИ-агентов по трём категориям: права, утечка и ошибочные действия. Оно охватывает, почему случаются инциденты (агент не просто отвечает, а действует — ключевое слово; сравнение с блестящим, но доверчивым новым сотрудником), почему агенты опаснее чат-ИИ (перемножение использования инструментов, автономной работы и чтения внешнего ввода; OWASP в 2026 году упорядочила специфичные для агентов риски и пропагандирует «минимальную агентность»), инцидент 1 — права (избыточная агентность — права на отправку/удаление, когда достаточно чтения, наследование сильных прав человеческого аккаунта, раздувание ущерба при выходе из-под контроля, описанный случай агента-оптимизатора затрат, удалившего резервные копии), инцидент 2 — утечка (косвенная инъекция промпта, закладывающая приказы во внешний контент — описанные реальные случаи: невидимый текст в публичном посте Reddit, утекший одноразовый пароль; скрытый приказ в тикете поддержки, выгрузивший SQL-данные через MCP; агент в IDE, укравший секреты лишь от открытия документа), инцидент 3 — ошибочные действия (разрушительные операции и цепочки ошибок даже без злого умысла), 4-шаговую схему атаки, 5 базовых мер защиты (минимум привилегий, одобрение человеком, песочница, заданные границы, недоверие к внешнему вводу) и чек-лист для новичка. Девиз: не передавайте слишком много полномочий, пусть человек останавливает опасные операции и не переоценивайте внешний текст.

Введение в генерацию видео с помощью ИИ [2026] — расстановка сил после Sora, Veo/Kling и советы по промптам

Введение в генерацию видео с помощью ИИ [2026] — расстановка сил после Sora, Veo/Kling и советы по промптам

Вводишь текст — и за секунды рождается видео со звуком: то, что ещё недавно было научной фантастикой, в 2026 году стало реальностью, и ситуация меняется с пугающей скоростью. Sora от OpenAI, которая была у всех на устах, закрыла приложение и веб-версию в апреле 2026 года (API отключат позже, в сентябре); её место заняли Google Veo, Kling и Runway. Это актуальное (июнь 2026) и не привязанное к инструменту руководство охватывает, что такое генерация видео на ИИ (создание движущихся кадров из слов или изображения, где синхронизация звука, 1080p–4K и «изображение-в-видео» теперь стандарт), расстановку сил в 2026 году (закрытие Sora — сообщается о давлении на ресурсы и расходы и снижении числа пользователей — и нынешние лидеры Google Veo 3.1, Kling 3.0 и Runway Gen-4.5, при норме посекундной оплаты), как это работает (диффузионные модели, расширенные на измерение времени; текст-в-видео и изображение-в-видео), общий рабочий процесс из 5 шагов (выбрать инструмент, промпт/изображение, задать длину/формат/звук, сгенерировать и выбрать, соединить при монтаже), главные советы по промптам для видео (объект + движение + работа камеры + стиль + длина + звук, где глаголы и камера — ключевое, одна склейка одно действие, используйте «изображение-в-видео», генерируйте с запасом), что она уже умеет, а что пока нет (длинные произведения за один заход и полная консистентность остаются трудными, а посекундная стоимость накапливается), и основы прав, водяных знаков и этики (SynthID и C2PA делают происхождение ИИ стандартным и неудаляемым, чисто ИИ-вывод защищён слабо с различиями по странам, коммерческое использование зависит от условий, а дипфейки реальных людей под запретом). Делайте склейки и соединяйте их при монтаже, а не стремитесь к длинному произведению за один заход. Поскольку область меняется быстро, всегда сверяйтесь с актуальной официальной информацией.

Как начать с генерации изображений ИИ — как это работает, 4 шага, анатомия промпта и права

Как начать с генерации изображений ИИ — как это работает, 4 шага, анатомия промпта и права

«Я не умею рисовать, значит, это не для меня» — это предубеждение насчёт генерации изображений ИИ перевёрнуто с ног на голову. Достаточно дать указание словами — и через секунды у вас готов визуал профессионального уровня. Это межинструментальное руководство охватывает: что такое генерация изображений ИИ (создание изображений с нуля посредством слов — навык умения формулировать, а не рисовать; версия промпт-инжиниринга для изображений), как это работает (диффузионные модели вырезают картинку из случайного шума, используя ваш промпт как подсказку, каждый раз рисуя с нуля, отчего результаты «дрожат»), общий рабочий процесс из 4 шагов, работающий в любом инструменте (выбрать инструмент, написать промпт, сгенерировать и выбрать, доработать и завершить — итерации это базовая предпосылка), ключевую анатомию промпта из 6 частей (объект, сцена/обстановка, стиль, свет/цвет, композиция/ракурс, технические параметры) плюс негативные промпты и соотношение сторон — хотя GPT Image и Imagen предпочитают простые предложения, тогда как инструменты семейства Stable Diffusion любят списки слов и негативы, 7 приёмов мастерства (перебирать число вариантов, добавлять понемногу, референсы, inpainting, фиксировать сид, увеличивать, сохранять удачные промпты), с чем ИИ справляется плохо (кисти, текст, согласованность, точность деталей) и обходные приёмы, а также основы прав, коммерческого использования и этики для работы (чисто ИИ-результат защищён слабо по позиции Ведомства США по авторским правам и решению по делу Thaler 2025 года, с различиями по странам; коммерческое использование зависит от условий каждого инструмента; дипфейки и несанкционированное копирование стиля недопустимы; распространяются метаданные о происхождении вроде C2PA у DALL-E). Какой инструмент выбрать и приёмы по конкретным инструментам — со ссылками на сравнение, Midjourney и Stable Diffusion. Знайте анатомию, перебирайте число вариантов, добавляйте слова понемногу — и кто угодно сможет приблизиться к задуманному кадру.

Промпт-инжиниринг: практический сборник — 6 частей и приёмы, чтобы получать от ИИ нужные ответы

Промпт-инжиниринг: практический сборник — 6 частей и приёмы, чтобы получать от ИИ нужные ответы

Вы задаёте одному и тому же ИИ один и тот же вопрос, и при этом один называет его бесполезным, а другой поражается тому, насколько он способный — и истинная причина этого разрыва часто не в мощности ИИ, а в том, как написан промпт. Это практический сборник того самого навыка, промпт-инжиниринга, выстроенный так, чтобы новичок мог пользоваться им сразу. Он охватывает, что такое промпт-инжиниринг (навык проектировать и улучшать вашу инструкцию для ИИ — не код, а мастерство того, как формулировать), три принципа, которые меняют результат (будьте конкретны, давайте контекст, задавайте формат вывода, плюс «делай X» вместо «не делай Y»), основные 6 частей хорошего промпта (роль, контекст, инструкция, примеры, формат, ограничения — элементы, общие для крупных фреймворков вроде COSTAR и RCOF; все шесть нужны не всегда), 7 практических приёмов (дать роль, показать образец/few-shot, рассуждать по шагам, зафиксировать формат вывода, структурировать разделителями, не просить слишком много за раз и итерировать — сильнейший из них итерация), пример до/после, приёмы следующего уровня (цепочка рассуждений, самосогласованность, цепочки промптов, ReAct — хотя рассуждающие модели вроде o-серии и расширенного мышления у Claude делают CoT внутри, поэтому формулировка цели работает лучше), 7 частых ошибок, а также особенности моделей и безопасность ввода. С внутренними ссылками на советы по промптам для разработки приложений и меры предосторожности при вводе. Превращайте расплывчатое в конкретное, сваливание в диалог — улучшаться может любой уже сегодня.

Что такое технологическая сингулярность? Понятное руководство для новичков — механизм, прогнозы и отличие от AGI

Что такое технологическая сингулярность? Понятное руководство для новичков — механизм, прогнозы и отличие от AGI

В июне 2025 года Сэм Альтман из OpenAI написал в блоге: «Мы прошли горизонт событий; взлёт начался» («The Gentle Singularity»). Однако другие исследователи напрочь отвергают идею как то, что никогда не наступит. Это руководство для новичков объясняет, что сингулярность (технологическая сингулярность) — это «точка перелома, в которой ИИ превосходит человеческий интеллект и начинает совершенствовать сам себя, так что прогресс становится взрывообразно быстрым и его уже нельзя ни предсказать, ни контролировать» (гипотеза, не реализованная на 2026 год). Разбираем суть — взрыв интеллекта = рекурсивное самосовершенствование, где умный ИИ строит ещё более умный, а улучшающий меняется с человека на ИИ; чем это отличается от AGI и ASI (AGI/ASI — «состояния» интеллекта, сингулярность — «событие» обретения непредсказуемости; AGI → самосовершенствование → внезапный скачок к ASI = сингулярность); историю термина (1965 — «взрыв интеллекта» I. J. Good → 1993 — Виндж делает название популярным → Курцвейл выводит в мейнстрим с «2045»); широкий разброс прогнозов (Курцвейл 2045, Альтман «уже началась», Виндж, а также скептики вроде Gary Marcus и «тормоз сложности» покойного Paul Allen); внезапный жёсткий взлёт против постепенного мягкого; надежды (прорывы в медицине и науке) и риски (потеря контроля, проблема согласования); глубокий скепсис (тормоз сложности, физические пределы, совсем иная вещь); и распространённые мифы вроде «роботы правят», «немедленно, как только появится AGI» и «фиксировано на 2045». Не бойтесь её чрезмерно и не мечтайте слишком сильно — выжимайте максимум из сегодняшнего ИИ, спокойно наблюдая за тем, что может прийти дальше.

Влияние ИИ на юристов, бухгалтеров и налоговых консультантов: что меняется, а что остаётся

Влияние ИИ на юристов, бухгалтеров и налоговых консультантов: что меняется, а что остаётся

В 2023 году юрист получил санкции после того, как записка, написанная с помощью ChatGPT, процитировала дела, оказавшиеся выдумкой ИИ, — и этот случай распространил по миру настороженность к теме права и ИИ. И всё же за несколько лет внедрение резко выросло: говорят, более 90% юристов используют тот или иной ИИ в повседневной работе. Как следующая часть нашей серии о влиянии ИИ по отраслям после #068 (торговля), #094 (маркетинг) и #097 (консалтинг), здесь разбираются профессии. Текущая ситуация в цифрах (62% юристов сообщают об экономии времени 6–20% в неделю; Harvey и CoCounsel от Thomson Reuters обработали 10М+ юридических документов в 1-м квартале 2026; использование генеративного ИИ в налоговых/бухгалтерских/аудиторских фирмах подскочило с 8% в 2024 до 21% в 2025; исследование Stanford показывает, что рабочие места для начинающих в таких сферах, как бухгалтерия, упали на 13% к 2022, у бухгалтеров +5%, у счетоводов -5%), какую работу меняет ИИ по профессиям (юристы = поиск дел, проверка договоров, извлечение обязательств; бухгалтеры = бухучёт, проверка первички, выборка, выявление рисков; налоговые консультанты = ввод данных, черновики деклараций, поиск норм — ИИ делает подготовительную работу, человек выносит окончательное решение), главную ловушку галлюцинации (выдумывание несуществующих дел/норм — ведущее к санкциям и потере доверия; Harvey заявляет о 99,7% точности проверенных ссылок и помечает остальные, CoCounsel опирает ссылки на базу данных дел, цитируя только реальные дела), неизменную суть ценности (окончательное суждение, профессиональный скептицизм, этика, серые налоговые суждения и — решающее — подпись и юридическая ответственность, которые нельзя делегировать ИИ), кризис молодых специалистов (автоматизация ученической рутины) и новые роли (специалисты по ИИ-комплаенсу, налоговые промпт-инженеры), а также советы по ролям для практиков, будущих специалистов и клиентов (сверяйте ссылки и цифры с первоисточниками; уточняйте обращение с конфиденциальностью). Регулирование и ответственность различаются по странам; в Японии ИИ-функции в бухгалтерском ПО тоже широко распространены. Вопрос, который ставит ИИ: то, что вы продаёте, — это работа или суждение и ответственность?

Что такое команда /loop в Claude Code? Применение, опрос и сравнение планирования

Что такое команда /loop в Claude Code? Применение, опрос и сравнение планирования

«Сообщи, когда сборка завершится». «Если CI станет красным — почини». «Следи за деплоем каждые 5 минут». Передать эти «прилипшие» рутинные дела целиком AI позволяет команда /loop, добавленная в Claude Code в 2026 году. Это руководство для новичков объясняет, что /loop — это планировщик в рамках сессии, который повторно запускает запрос или slash-команду с заданным вами (или AI) интервалом, а затем разбирает четыре способа применения (① /loop 5m X = фиксированный интервал cron ② /loop X = self-pacing, где AI определяет интервал ③ /loop 15m = встроенный обслуживающий запрос ④ /loop = авто-обслуживание), как записывать интервалы (число + единица s/m/h/d, минимум 1 минута, естественный язык вроде «every 2 hours», и можно зациклить slash-команду: /loop 20m /review-pr 1234), силу self-pacing (короче при активности, дольше при затишье, от 1 минуты до 1 часа, и — в отличие от обычного cron — он сам завершает цикл, когда считает задачу выполненной), практические рецепты (наблюдение за CI/деплоями, «нянченье» PR, проверки долгих сборок, напоминания, авто-обслуживание ветки), как остановить и на что обратить внимание (Esc для остановки, привязка к сессии, поэтому новый разговор её стирает, закрытие терминала останавливает, фиксированные интервалы живут до 7 дней, до 50 задач на сессию, срабатывает между ходами с джиттером, локальный часовой пояс), как выбрать между тремя функциями планирования (/loop для мониторинга в сессии, Desktop scheduled tasks для резидентной локальной работы, Routines для облачных операций без присмотра), а также настройку loop.md и отключение через CLAUDE_CODE_DISABLE_CRON=1 — всё на основе официальной документации (на 2026 год). /loop меняет временную ось работы, которую можно передать AI.

Как сделать субтитры и расшифровку из видео/аудио с помощью ИИ

Как сделать субтитры и расшифровку из видео/аудио с помощью ИИ

Раньше на субтитрование часового видео вручную уходил целый день — слушать, ставить на паузу, печатать, выставлять тайм-код. В 2026 году этот ад завершается тем, что вы "закидываете видео и ждёте несколько минут". С упором на субтитрование/расшифровку видео- и аудиоконтента (протоколы совещаний — в #086, OCR изображений — в #091) этот гид разбирает четыре этапа, которые автоматизирует ИИ (извлечение звука → расшифровка с диаризацией → нарезка тайм-кодов в SRT/VTT → перевод и оформление), отличие субтитров (SRT/VTT) от расшифровки и когда что использовать, сравнение инструментов (бесплатный и приватный Whisper, монтаж-всё Descript, высокоточный многоязычный Sonix и Happy Scribe, удобный для частных лиц Notta, мобильный CapCut, самые простые авто-субтитры YouTube — многие под капотом используют распознавание семейства Whisper), наиболее воспроизводимый процесс из 4 шагов (подготовка → расшифровка → вычитка → экспорт/наложение SRT/VTT), рекомендации по сценариям (YouTube, подкасты, лекции, интервью, конфиденциальное, многоязычное), шесть приёмов точности, где качество звука — это 80% результата (качество, настройка языка, список имён собственных, поиск-замена, диаризация, длина строк), главный путь многоязычного процесса (довести оригинал → ИИ-перевод → проверка носителем) и подводные камни — излишнее доверие к точности, слабость на шуме и жаргоне, авторские права, загрузка конфиденциального и смещение тайм-кодов. На чистом звуке точность 90–96% (по публикациям, зависит от условий), а труд падает на 80–90%. Работу — ИИ; отделку — проверку имён собственных и просмотр до публикации — вам.

Обзор по категориям

Stable Diffusion

Смотреть все

Другие ИИ

Смотреть все

Для начинающих

Смотреть все

AI-разработка

Смотреть все

Среда разработки и инфраструктура

Смотреть все

AI-агенты и автоматизация

Смотреть все

Эффективность работы

Смотреть все

Анализ данных

Смотреть все

Обучение

Смотреть все

Заработок и монетизация

Смотреть все

Разработка игр

Смотреть все

Безопасность и управление ИИ

Смотреть все

Риски и влияние ИИ

Смотреть все