Перейти к содержимому
Темы

Для начинающих

Новичок в ИИ? Начните здесь. Понятные руководства по основам ИИ и выбору инструментов.

115 статей

Сортируйте статьи, чтобы найти нужное

Что такое AGI (общий искусственный интеллект)? Понятное руководство для новичков

Что такое AGI (общий искусственный интеллект)? Понятное руководство для новичков

На форуме в Davos в январе 2026 года ведущие умы отрасли столкнулись по поводу «AGI уже не за горами» против «до сути ещё далеко» — а запалом послужил AGI (Artificial General Intelligence). Эта понятная для новичков статья начинается с того, что такое AGI — «универсальный ИИ, который, подобно человеку, способен сам учиться и решать даже совершенно новые задачи в любой области» (хотя это ещё не реализованная цель на 2026 год), — затем разбирает решающее отличие от сегодняшнего узкого ИИ в стиле ChatGPT (может ли он «переносить» знания в другую область; обобщение и автономное освоение навыков), трёхступенчатую схему узкий ИИ → AGI → ASI (сверхинтеллект), широкий разброс прогнозов экспертов по срокам (Amodei из Anthropic оптимистичен — в пределах нескольких лет/около 2027 года, Hassabis из DeepMind осторожен — ~50% к 2030 году, медиана опроса исследователей — 2047 год, скептики вроде Marcus говорят, что это далеко или не случится — разброс проистекает из различающихся определений), насколько сегодняшний ИИ близок (ниже человеческого базового уровня на ARC-AGI, но подбирается к порогу за счёт мультимодальности и агентов), надежды (ускорение исследований болезней и науки) и риски (рабочие места, злоупотребления, проблема согласования — позиционируемая Anthropic и UK AISI как критическая точка принятия решений), а также частые мифы вроде «ChatGPT — это уже AGI» и «AGI = обладает сознанием». Ни чрезмерно боясь, ни чрезмерно мечтая, освойте узкий ИИ, что у вас в руках, спокойно наблюдая за тем, что придёт дальше.

Как стать передовым ИИ-инженером (AI-native разработчиком): навыки и дорожная карта

Как стать передовым ИИ-инженером (AI-native разработчиком): навыки и дорожная карта

Окажетесь ли вы на стороне, у которой ИИ отбирает работу, или на стороне, что владеет ИИ и делает работу за десятерых? В 2026 году это развилка для инженеров. Статья представляет путь "AI-native разработчика" (создание приложений с LLM, агентами, RAG — в отличие от исследования моделей) как выстраиваемый набор навыков, а не докторскую степень, в трёх слоях: ① неизменный фундамент (Python как основной язык ИИ-разработки, Git, командная строка, HTTP/REST/JSON — основы нужны и в эпоху кода, написанного ИИ); ② 5 ключевых AI-native навыков (проектирование промптов/контекста, RAG как основа корпоративных агентов, создание агентов, MCP как де-факто стандарт подключения инструментов и проектирование evals — плюс оптимизация затрат, ограждения, наблюдаемость); ③ преимущество, которое большинство упускает, — проектирование evals и инженерия контекста (умение писать evals — сильнейший признак того, что человек "реально строил с LLM", а AGENTS.md/CLAUDE.md плюс небольшой набор evals — это скачок от "с помощником" к "native"). Добавлены дорожная карта на 8–12 месяцев (фундамент → LLM API/промптинг → постройте RAG без фреймворков → агенты + MCP → evals + развёртывание + публикация), стратегия портфолио, где развёрнутая работа важнее диплома, подводные камни (болото туториалов, коллекционирование инструментов, пренебрежение основами) и цифры рынка/спроса (на основе данных США, большой разброс по регионам). Граница — используете ли вы ИИ как систему.

Как ИИ влияет на маркетинг и рекламу: что меняется, а что нет

Как ИИ влияет на маркетинг и рекламу: что меняется, а что нет

Когда генеративно-ИИ рождественский ролик Coca-Cola в конце 2024 года раскритиковали как «бездушный», это символизировало перетягивание каната, которое ИИ привносит в маркетинг: «эффективность и результативность» против «доверия и эмоций». Эта статья обозревает тему, сначала измеряя положение дел в цифрах (около 87% маркетологов используют генеративный ИИ, рост с 51% в 2024 году; более 71% рекламных бюджетов управляются алгоритмами; Google создал около 70 миллионов креативов с помощью Gemini только за Q4 2025; расходы на ИИ-инструменты в маркетинге выросли примерно втрое за 18 месяцев). Она охватывает пять областей, которые меняет ИИ (① создание контента ② рекламный креатив ③ таргетинг и доставка / программатик ④ персонализация / DCO ⑤ аналитика и измерения) и сообщённые эффекты (DCO с ~32% более высокой CTR и ~56% более низкой CPC, тексты от ИИ с 3,2-кратным ROI, first-party/контекстный таргетинг вплоть до 2-кратного ROAS — все опубликованы, зависят от условий); ядро, которое не меняется (стратегия, бренд, доверие, прорывное творчество остаются за людьми — ИИ это усилитель, нулевая база означает нулевой ответ); тектонический сдвиг SEO/AEO/LLMO (с внутренними ссылками); риски (разрыв восприятия 82% руководителей против 45% потребителей в отношении ИИ-рекламы, правдоподобные выдумки, brand safety, права/регулирование, бесконтрольная работа на автомате); как смещается работа маркетолога (задачи забираются, ответственность за суждения тяжелее; от производителя к главному редактору и стратегу); и пятишаговый план практики на сегодня. Самое большое влияние ИИ — освобождение человеческого времени от делания ради решения.

Как делать слайды презентаций с ИИ: инструменты, рабочий процесс и промпты

Как делать слайды презентаций с ИИ: инструменты, рабочий процесс и промпты

Презентация — завтра с утра, а слайды пустые — но напечатайте одну строку с темой, и через минуты перед вами 20 черновых слайдов. Это ИИ-слайды в 2026 году. Гид разбивает создание слайдов на три этапа (структура, текст, дизайн) и излагает два подхода: генерация «всё в одном» (дайте тему — получите всё) против разделения труда (доведите структуру и текст в ChatGPT/Claude/Gemini, затем оформите специализированным инструментом). Сравниваются основные инструменты (быстрый Gamma, нативный-.pptx-без-поломок Copilot в PowerPoint, сильный в совместной работе Gemini для Google Slides, самый красивый Beautiful.ai, богатый шаблонами Canva, надстройка ChatGPT для PowerPoint, запущенная в мае 2026 — абсолютного чемпиона нет; выбирайте по выходу), самый воспроизводимый процесс из 5 шагов (структура → текст → влить в инструмент дизайна → проверить цифры и источники → экспорт в .pptx/Slides), три готовых промпта (план, развернуть слайд с заметками докладчика, переформатировать для инструмента дизайна), шесть приёмов для слайдов, которые попадают в цель (одно сообщение на слайд, сократить текст вдвое и др.) и подводные камни — поломка вёрстки .pptx, раздутый первый черновик, правдоподобно выдуманные данные, отправка конфиденциального и закрытие инструментов (закрытие слайдов Tome в апреле 2025 как урок). ИИ — партнёр, который выдаёт черновик в одно мгновение; сокращение и проверка — работа человека.

Извлечение текста из изображений с помощью ИИ (OCR): полное руководство

Извлечение текста из изображений с помощью ИИ (OCR): полное руководство

Рукописная заметка, бумажный чек, английский внутри скриншота, вывеска на фото — перепечатка, которую вы всегда делали вручную, в 2026 году почти полностью не нужна благодаря ИИ. Это руководство начинается с того, чем AI OCR отличается от традиционного OCR (чтение по одному символу против понимания всей страницы по смыслу), затем сортирует три варианта (обычный чат-ИИ / специализированные инструменты вроде Google Lens / API и OSS, такие как Mistral OCR и PaddleOCR-VL) по сценариям. Сравниваются ChatGPT (GPT-5.5), Gemini 3.1 Pro и Claude (Opus 4.8) по сильным сторонам (рукопись → семейство GPT, структурирование таблиц → семейство Claude, множество страниц → длинный контекст Gemini, «чистый» OCR → специализированные модели; абсолютного чемпиона нет), даются три готовых промпта (расшифровать, не ломая; таблица в Markdown; чек в JSON, все с правилом «не выдумывать»), лучший выбор под каждый случай (рукопись, чеки, PDF, сложные таблицы, вертикальный/старый текст, формулы и код), шесть советов по точности с качеством изображения как 80 % результата, и единственная величайшая слабость AI OCR — правдоподобно выдумать то, что не смог прочитать (всегда сверяйте суммы, даты и имена с оригиналом) — плюс предостережения о приватности при отправке конфиденциального, об авторских правах и использовании для обучения. ИИ можно доверить только «чтение»; подтверждение — за человеком, который видел оригинал.

Руководство по vector DB / RAG — от наивного RAG к продакшену

Руководство по vector DB / RAG — от наивного RAG к продакшену

Вы знаете, «что такое RAG», но при сборке ответ выходит мимо — потому что это всё ещё наивный RAG: небрежная нарезка и обычный векторный поиск. Как практическое продолжение статьи 030, здесь поэтапно разбирается практический конвейер RAG 2026 года (умный chunking, embedding, vector DB, гибридный поиск, reranking): стратегии chunking (recursive 512 как дефолт, semantic/structural/parent-child, Contextual Retrieval, по сообщениям сокращающий неудачи извлечения вплоть до 67%), выбор модели embedding (text-embedding-3-large и др.), сравнение шести vector DB (Chroma для прототипирования, pgvector с Postgres, низколатентный Qdrant, полностью управляемый Pinecone, чемпион по гибриду Weaviate, крупномасштабный Milvus), гибридный поиск со слиянием BM25 + плотных векторов через RRF, retrieve-then-rerank с bi-encoder, затем cross-encoder (Cohere/Voyage/BGE/Jina), разделение LlamaIndex (извлечение) против LangChain/LangGraph (управление), почему окно в 1M токенов не заменяет RAG (lost in the middle, отвлечение) и нюансы вывода в продакшн, такие как построение набора для eval в первую очередь.

Как построить ИИ-агента — руководство для новичков (без кода и с кодом)

Как построить ИИ-агента — руководство для новичков (без кода и с кодом)

Вы знаете, «что такое ИИ-агент» — так как же построить его? В 2026 году без кода можно запустить рабочий агент за один вечер простым перетаскиванием, а современные SDK позволяют собрать практичный менее чем в 100 строк. Как практическое дополнение к «что такое ИИ-агент», здесь разбираются анатомия (мозг LLM + инструкции + инструменты + память + автономный цикл), два пути (без кода и с кодом), универсальный каркас сборки из 5 шагов (очерти задачу, выбери основу, напиши инструкции, подключи инструменты, тестируй на малом), сравнение инструментов без кода (Dify как полноценная платформа, n8n для бизнес-интеграции, Flowise для прототипирования и самые простые Custom GPT/Gemini Gems/Claude Projects), сравнение кодовых фреймворков (надёжные Claude Agent SDK/OpenAI Agents SDK, LangGraph для сложного контроля, CrewAI для координации ролей), конкретный разобранный пример (суммировать письмо в поддержку, затем уведомить в Slack), стоимость (~$10-$50/месяц за платформу плюс использование модели) и ориентиры по срокам, а также ловушки (не расширяй область чрезмерно, права доступа и контроль над «разносом», остерегайся «только PoC»). Большинству людей правильный ход — сначала собрать один агент без кода.

ChatGPT, Claude или Gemini — что выбрать по сценарию

ChatGPT, Claude или Gemini — что выбрать по сценарию

«ChatGPT, Claude или Gemini — на что оформить подписку?» В 2026 году все три стоят около $20 в месяц и все первоклассны, поэтому единственного «вот этот побеждает» нет. Правильный вопрос — «какой лучше для вашего сценария использования». На основе консенсуса по источникам разобраны основы (поставщик, основное семейство моделей, цены бесплатного/стандартного/премиального тарифов), различия характеров (Claude = мастер письма/анализа/кода, ChatGPT = универсал с экосистемой и изображениями/голосом, Gemini = мультимодальность, длинный контекст, интеграция с Google), подробная таблица по сценариям (письмо, код, общее, генерация изображений, голос, понимание изображений/PDF/видео, очень длинный текст, интеграция с Google, исследования, русский язык), как выбрать план по объёму использования и умная связка из двух инструментов, когда нельзя выбрать один (одно ядро + один, чтобы закрыть пробелы). Лидер меняется каждые несколько месяцев, поэтому вместо погони за фиксированным «лучшим» используйте каждый по сильной стороне и измеряйте на своих задачах на бесплатном тарифе.

Частые ошибки Claude Code и их исправление — полный справочник

Частые ошибки Claude Code и их исправление — полный справочник

Claude Code внезапно останавливается с «войдите снова», «лимит запросов», «слишком длинный промпт», «MCP не подключается» — а гуглить каждую утомительно. Это практический справочник, который каталогизирует часто встречающиеся ошибки, с причиной и командой для запуска по каждой. Он начинается с трёх диагностических команд, которые стоит запустить первыми (claude doctor для полной диагностики, /status для активной авторизации, /context для разбивки контекста), затем фокусируется на четырёх частых семействах (использование/лимиты запросов, переполнение контекста, истёкшая авторизация, сбои подключения MCP) с таблицами симптом→причина→команда по авторизации и входу, использованию/лимитам (Claude Code сжигает в 10-100 раз больше токенов, чем чат), контексту и токенам (слишком длинный промпт, пробуксовка сжатия), серверу и модели (500/529/тайм-аут/model not found), установке/PATH/обновлению, сети и прокси (ECONNREFUSED, TLS), MCP, разрешениям (deny побеждает bypass) и прочему (400 thinking blocks, изображения/PDF, IDE). Завершается шпаргалкой «ошибка→исправление» и FAQ. На основе официальной документации Claude Code (по состоянию на 2026): застряли — запустите три диагностические команды, и если не исправилось, выполните claude update.

Как автоматизировать протоколы встреч и расшифровку с помощью ИИ

Как автоматизировать протоколы встреч и расшифровку с помощью ИИ

Вы по-прежнему тратите час-другой каждую неделю, набирая протокол вручную с записи? В 2026 году бо'льшую часть этого можно автоматизировать. Это руководство разбивает протокол на четыре этапа (запись → расшифровка → резюмирование → извлечение решений и задач), сравнивает два подхода (специализированный ИИ, который присутствует на звонке, против DIY-схемы запись → ИИ для расшифровки → LLM), сопоставляет основные инструменты (Otter, Notta, Fireflies, tl;dv, Fathom, Granola — с пометкой, что точность заявлена вендорами), охватывает встроенный ИИ в Zoom/Teams/Meet, проходит путь DIY с Whisper и ChatGPT/Claude/Gemini и примером промпта «не заполняй пробелы догадками», даёт пять советов для повышения точности (качество звука, словарь имён собственных, диаризация спикеров, соответствие языку, шаблонный промпт) и излагает оговорки о приватности, согласии и чрезмерном доверии. Последняя линия обороны — человек: всегда просматривайте решения и задачи глазами.

Claude Code "Не удалось проверить статус pull request" — причины и решения

Claude Code "Не удалось проверить статус pull request" — причины и решения

Вы дописываете фичу в Claude Code и идёте нажать "Create PR", когда появляется красный баннер: "Could not check the pull request status. This information may be out of date". Это не дефект кода — Claude Code просто обратился к GitHub за актуальным состоянием PR, и этот единственный запрос не удался; обычно это безобидная задержка синхронизации. В статье: точное значение ошибки, как Claude Code видит ваш PR (запрос через gh CLI, с оговоркой, что внутренняя реализация не задокументирована), 5 основных причин (истёкшая аутентификация, нет push/PR, сеть/прокси, нехватка scopes, временный сбой), порядок диагностики из 4 шагов начиная с gh auth status, шпаргалка по командам (gh auth login/refresh/pr status и др.), как отличить, когда "may be out of date" можно игнорировать, а когда действовать, обходной путь gh pr create, чек-лист профилактики и FAQ. Правило: подозревайте соединение с GitHub раньше, чем код.

Ошибка 400 'thinking blocks cannot be modified' в Claude Code - причины и решения

Ошибка 400 'thinking blocks cannot be modified' в Claude Code - причины и решения

Ошибка, которая внезапно появляется при работе в Claude Code, а затем повторяется при любом вводе: "API Error: 400 thinking or redacted_thinking blocks in the latest assistant message cannot be modified". Это известный баг с несколькими тикетами в официальном репозитории Anthropic, и в большинстве случаев виноват не пользователь. В статье разбираем смысл ошибки, механизм блоков thinking в extended thinking и криптографической signature, пять главных причин несовпадения подписи (баг возобновления сессии, смешивание стримов, логика починки идет вразнос, сторонний прокси, изменение истории в своем приложении), три способа восстановления для пользователей Claude Code (Esc×2/rewind, новая сессия /clear, инструмент починки JSONL), важнейшее постоянное решение (обновление до последней версии), три принципа предотвращения для разработчиков на API/SDK (возврат как есть, полное удаление, защитный механизм), различение трех похожих ошибок и чек-лист предотвращения повторов.