コンテンツにスキップ
AIツール

その他AI

Claude・ChatGPT以外の注目AIツールの使い方、特徴、料金を徹底比較。最新ツール情報をお届け。

40 件の記事

並び替えで記事を探せます

LoRAとは?AIを少ない追加学習でカスタマイズする仕組みを初心者向けに

LoRAとは?AIを少ない追加学習でカスタマイズする仕組みを初心者向けに

巨大なAIモデルを丸ごと学習し直すのは高すぎる、でも自分用に少しだけ調整したい、その願いを叶えるのがLoRA(Low-Rank Adaptation/低ランク適応)。元のモデルはそのまま凍結し、ごく小さな追加部品(アダプタ)だけを学習することで学習するパラメータを約90%減らす。LoRAはファインチューニングを劇的に安く速くする技術であり、Stable Diffusionなどの画像生成でキャラや画風を足す小さなファイルとしても大人気。本記事は仕組みをパッチ(あて布)のたとえで解説する。LoRAはパラメータ効率の良いファインチューニング(PEFT)の代表格で、核心は巨大な元の重みを一切変えず凍結し各層に小さな追加行列を差し込みそこだけ学習する(W = W₀ + BA、W₀は凍結、BAが小さな追加分)。AIの調整は実はそんなに大きく変える必要がない=低ランクで足りるという発見が土台。メリットは学習パラメータ約90%減(GPT-3規模で従来比1万分の1との報告)・省メモリ高速安い(GPU記憶約3分の1)・推論はアダプタを統合すればレイテンシ増なし・過学習しにくい。最大の強みはアダプタの付け替えで、土台共通のまま用途ごとに数MBのLoRAを差し替え瞬時に切り替えられる。多くの人が最初に触れるのは画像生成で、Stable Diffusionでは特定キャラ・画風・被写体を覚えた小さなLoRAが無数に共有される(画風を足す、キャラを覚えさせる、軽く共有しやすい)。QLoRAは量子化と組み合わせ土台を4ビットに圧縮したままLoRAを学習し、標準LoRAよりさらにメモリ約4分の1、家庭用GPU(場合によりCPU)でも巨大モデルを微調整でき精度低下もごくわずか。フルファインチューニング(全パラメータ学習)との違いは学習する重み・コスト・成果物・向く場面で、多くの実務ではまずLoRAで十分。土台はそのまま味付けは小さく、が要点。数値は各種公表資料の引用で傾向の参考。

量子化(quantization)とは?AIモデルを軽くして手元で動かす仕組み

量子化(quantization)とは?AIモデルを軽くして手元で動かす仕組み

70B(700億パラメータ)の巨大モデルが手元のゲーミングPC1台で動く、それを可能にするのが量子化(quantization)。モデルの重みの数値精度を下げてサイズと必要メモリを劇的に小さくする技術で、モデル蒸留が別の小さいモデルに知識を移すのに対し量子化は同じモデルを軽くする。本記事は仕組みを写真の圧縮のたとえで解説する。量子化は重み(パラメータ)をFP16/FP32の小数からINT8(8ビット)やINT4(4ビット)の整数に置き換え、1重みあたりの容量を減らす(FP32=4バイト、INT8=1バイト、INT4=0.5バイト)。RAW写真をJPEGに圧縮するように少しの精度を犠牲に大きな軽さを得て、驚くのは失うものがこれほど少ないこと。どれだけ軽くなるかは、4ビット化でFP16比約1/4、70Bモデルは140GB→約35GB、8Bモデルは4ビットで約4.5〜5GBとミドルクラスGPU(VRAM 8GB)に収まりローカル実行できる=LLMの民主化。精度はINT8でほぼ無損失、INT4でも一般的なQ&Aや常識タスクなら劣化4%未満との報告だが、数学・コード生成・難しい推論では低下が目立ちやすく用途に合うビット数を選ぶのが肝心(パープレキシティの微増として現れる)。主な手法はGPTQ(精度を保つ4ビット圧縮の先駆け)、AWQ(重要な約1%の重みを保護しGPTQより1〜2%高精度+高速)、GGUF(llama.cpp/Ollama形式でQ2_K〜Q8_0、CPU+GPU併用可、ローカル向け)、QLoRA(4ビット土台にLoRAで家庭用GPUでも微調整)。蒸留(別の小モデルに移す)・ファインチューニング(特定用途に追加学習)とは狙いが違い、組み合わせて使うのが普通(蒸留した小モデルをさらに量子化、量子化土台にFT等)。始め方はローカルならGGUF(Ollama)を1コマンド、VRAMに合わせてQ4/Q8を選び、コード生成や厳密計算ならINT4を避けINT8以上に。たいてい量子化済みモデルが配布されダウンロードして使うだけ。賢さはそのまま重さだけ落とす最も実用的な一手。数値は各種公表資料の引用で傾向の参考。

モデル蒸留(distillation)とは?大きなAIから小さなAIへ知識を移す仕組み

モデル蒸留(distillation)とは?大きなAIから小さなAIへ知識を移す仕組み

巨大で高性能なAIは賢いが重くて高い、その悩みを解くのがモデル蒸留(Knowledge Distillation)。大きな先生(teacher)モデルの知識を小さな生徒(student)モデルに移し、10分の1のサイズ・速度で先生の性能の95%以上を保ついいとこ取りを狙う技術。本記事は仕組みを先生と生徒のたとえで解説する。カギはソフトラベルで、普通の学習が正解は猫とだけ教える(ハードラベル)のに対し蒸留は先生が出す90%猫8%犬2%キツネといった確率分布ごと生徒に渡し、その迷いの度合いに正解だけでは伝わらない豊かな情報が含まれる。さらに温度(Temperature)で確率をやわらかくし似たもの同士の微妙な関係まで見せる(実例:GPT-4o miniがGPT-4oから蒸留)。メリットは速くて安い・約10倍コンパクトで性能95%以上維持・エッジで動く・用途特化に強い。方式は先生の重みや内部表現にフルアクセスできるホワイトボックスと、出力(API応答)しか見えないブラックボックスの2つで、後者で他社APIを先生にすると規約違反になりうる。混同しやすい技術との違いは、蒸留=別の小モデルに知識を移す、量子化=同じモデルの重みの精度を下げて圧縮、ファインチューニング=既存モデルを特定タスク向けに追加学習、で排他でなく組み合わせ可能。法的・規約の現実が2026年の大論点で、蒸留技術自体は正当だがOpenAI・Anthropic・Mistral・xAI等の利用規約には自社出力を競合モデル開発に使うことを禁じる反蒸留条項があり、制限APIの出力を先生に競合を蒸留するのは技術的に可能でも規約違反になりうる。OpenAI対DeepSeekの係争(OpenAIはアクセス制限を回避し出力を蒸留した疑いと主張、一方DeepSeek規約は自社出力の蒸留利用を認めるとされる)やClaude Fable 5/Mythos 5で蒸留判定の作業が制限される設計など緊張は継続。実務は使う先生モデルの規約を必ず確認し、自社・許諾OSSを先生にする、競合開発に当たらないか用途を慎重に判断するのが心得。賢さは大モデル運用は小モデルの両立を可能にするが先生に誰を選ぶかで技術的にも法的にも結果が変わる。数値・事例は各種公表資料・報道の引用で傾向の参考。

ファインチューニングとは?RAGとの違い・LoRA/QLoRA・いつ使うかを初心者向けに解説

ファインチューニングとは?RAGとの違い・LoRA/QLoRA・いつ使うかを初心者向けに解説

「AIを自社専用にカスタマイズしたい」ときに候補となるファインチューニング(fine-tuning)を初心者向けに解説。ファインチューニングとは、学習済みのベースモデルに自分の用途のデータを追加学習させ、専用モデルに作り替えること。文体・出力フォーマット・専門分野の言い回しといった"振る舞い(behavior)"をモデル自体に覚え込ませる(モデルの重みを書き換える)一方、頻繁に変わる最新情報や社内文書を事実として正確に保持するのは苦手。だから「知識・事実はRAG、振る舞い・型はファインチューニング、まずはプロンプト」が基本。専門家いわく「"FTが要る"の8割は検索(RAG)やプロンプトの改善で解決する」ため、順番を守ることが重要。本記事は、正体(新人研修のたとえ)、得意・苦手、RAG/プロンプトとの使い分け比較表、主な手法(フルファインチューニング/LoRA/QLoRA=4bit量子化で省メモリ・初心者におすすめ)、必要なもの(高品質データ500件以上が目安・データ作りが本番・コストは5,000〜50,000ドル超の例やOpenAIの訓練約25〜100ドル/100万トークン・ツールはOpenAI/Unsloth/Axolotl/Hugging Face等)、そして始める順番(プロンプト→RAG→それでも型が安定しない時だけFT)までを網羅。ファインチューニングは「最後の手段」。

ローカルLLMの始め方——自分のPCでAIを動かす方法・必要スペック・おすすめモデルを初心者向けに解説

ローカルLLMの始め方——自分のPCでAIを動かす方法・必要スペック・おすすめモデルを初心者向けに解説

ChatGPTやClaudeのようなAIはクラウドで動かすのが当たり前——そう思いがちだが、2026年には自分のPCの中だけでAIを動かす「ローカルLLM」が現実的な選択肢になった。ローカルLLMとは、AIモデルをクラウドではなく手元のPCで直接動かすこと。入力が外部サーバーに送られず(プライバシー)、API料金もかからず(コストゼロ)、ネットがなくても動く(オフライン)のが三大メリット。一方で最上位のクラウドAIほど賢くなく、相応のPCスペックと初期セットアップの手間が要るという弱点もある。本記事は、ローカルLLMの正体(ストリーミングvsダウンロードのたとえ)、メリットと弱点、必要なPCスペックと量子化(GGUF形式・Q4_K_Mが定番で品質を保ちメモリを約1/4に・4bitで1Bあたり約0.5GBの目安)、始め方(初心者はGUIのLM Studio、開発者はCLIのOllama=2026年Q1に月5,200万DL)、2026年のおすすめモデル(Llama 3.2 7B・Google Gemma 4・Alibaba Qwen3.5・DeepSeek/Mistral等のオープンモデル)、そしてクラウドとの使い分け(機密・大量・オフラインはローカル、難問はクラウドの併用が最適)までを初心者向けに解説する。まずはLM Studioで3B〜7Bの小型モデルを1つ動かすのが最短の第一歩。

Claude Fable 5リリース徹底解説——新機能・ベンチマーク・料金・Mythosとの違い・新しい安全設計

Claude Fable 5リリース徹底解説——新機能・ベンチマーク・料金・Mythosとの違い・新しい安全設計

2026年6月9日、Anthropicが新モデルClaude Fable 5を公開した。社内最強とされる frontier モデルMythos級の能力を、初めて一般ユーザー・開発者が使える形で解き放った、同社が「一般提供する中で史上最強」と位置づけるモデルだ。キャッチコピーは「長時間・複雑な仕事のために作られた」。本記事はこの重要リリースを初心者向けに徹底解説する。Fable 5とは何か(Mythos級を安全に一般公開、長距離走の完走力に最適化、モデルID claude-fable-5)、双子のMythos 5との違い(中身は同一で安全装置だけが違う、一般はFable)、ベンチマーク(SWE-Bench Pro 80.3%=Opus 4.8の69.2やGPT-5.5の58.6を引き離す、Hexの長時間分析で史上初の90%超、Cognition FrontierCodeやHebbia金融で首位、ビジョンでも新SOTAでポケモンを補助なしプレイ)、本領の長時間・自律(数百万トークン集中・12時間連続、Stripeが5000万行Ruby移行を1日で完了=手作業2か月超、ファイルメモリでゲーム性能がOpus 4.8の3倍向上、GitHubも長丁場コーディングを高自律で)、料金と提供(入力$10/出力$50・100万トークン、1Mコンテキスト・12.8万出力、6月9〜22日は各プランで追加料金なし以降クレジット消費、API claude-fable-5・GitHub Copilot)、最大の見どころである新しい安全設計(サイバー攻撃・生物化学・蒸留の3分類器でリスク検知時のみOpus 4.8へフォールバック、作動はセッションの5%未満で95%超は自走、Mythosクラスは30日保持)、「AIは危険すぎる」警告の数日後の公開という文脈(全開放か全閉鎖かでなく危険な領域だけ閉じる第三の道)、そしてどう使い分けるか(大規模移行・長時間調査・自律エージェント主力に向く、軽い用途は軽量モデルが割安、/modelで切替)まで網羅。数値はAnthropic発表・各種報道の引用で今後変わりうる。

AI動画生成の始め方【2026年最新】——Sora終了後の勢力図・Veo/Kling・プロンプトのコツ

AI動画生成の始め方【2026年最新】——Sora終了後の勢力図・Veo/Kling・プロンプトのコツ

テキストを打つだけで声つきの動画が数十秒で生まれる——少し前ならSFだった体験が2026年には現実に。しかも状況は恐ろしく速く変化し、話題を独占していたOpenAI Soraはアプリ/Webが2026年4月に終了(APIも9月終了予定)、代わりにGoogle Veo・Kling・Runwayが主役へ。本記事は特定ツールに偏らないAI動画生成の始め方の最新版(2026年6月時点)として、何ができるか(言葉や画像から数秒〜数十秒の動画を生成、音声同期・1080p〜4K・image-to-videoが当たり前に)、2026年の勢力図(Sora終了の経緯=計算資源やコスト圧迫・利用者減と報道、現在の主役Google Veo 3.1/Kling 3.0/Runway Gen-4.5の強みとアクセス、秒課金が主流)、仕組み(拡散モデルを時間方向に拡張、text-to-videoとimage-to-video)、どのツールでも共通の始め方5ステップ(ツール選び→プロンプト/画像→尺・比率・音→生成して選ぶ→編集でつなぐ)、核心となる動画プロンプトのコツ(被写体+動き+カメラワーク+画風+尺/比率+音声、動詞とカメラが鍵、1カット1アクション・image-to-video活用・数を回す)、できること/まだ苦手なこと(長尺一発や完全な一貫性は不得手、秒課金でコスト嵩む)、そして権利・ウォーターマーク・倫理(SynthIDやC2PAでAI生成の明示が標準化・除去不可、純AI生成は著作権弱く国差あり、商用は規約次第、実在人物のディープフェイクは厳禁)までを初心者向けに整理する。長尺を一発で狙わずカットを作って編集でつなぐのが王道。変化が速い分野ゆえ最新は必ず公式で確認を。

AI画像生成の始め方・使いこなし入門——仕組み・4ステップ・画像プロンプトの型・権利まで

AI画像生成の始め方・使いこなし入門——仕組み・4ステップ・画像プロンプトの型・権利まで

「絵心がないから無理」——AI画像生成へのその先入観は逆だ。言葉で指示するだけで、数十秒後にはプロ級のビジュアルが手に入る。本記事は特定ツールに偏らない横断ガイドとして、AI画像生成とは何か(言葉でゼロから画像を作る、描く技術でなく伝える技術=プロンプトの画像版)、仕組み(拡散モデル=ランダムなノイズからプロンプトを手がかりに絵を彫り出す。毎回ゼロから描くので結果がゆらぐ)、どのツールでも共通の始め方4ステップ(ツールを選ぶ→プロンプトを書く→生成して選ぶ→改善・仕上げ、反復が前提)、核心となる画像プロンプトの6部品(被写体・情景/背景・画風・光や色・構図/視点・技術指定)+ネガティブプロンプトとアスペクト比、ただしGPT ImageやImagenは自然文を、Stable Diffusion系は単語羅列やネガティブを好むという違い、使いこなしのコツ7選(数を回す・少しずつ足す・参照画像・インペイント・シード固定・高解像度化・良い呪文を保存)、AIが苦手なこと(手指・文字・一貫性・細かい正確さ)と回避策、そして仕事で使うなら必須の権利・商用・倫理(米国著作権局やThaler判決2025のとおり純AI生成物は著作権で保護されにくく国差あり/商用可否はツール規約次第/ディープフェイクや作風の無断模倣は厳禁、DALL-E全画像のC2PA来歴付与など明示の流れ)までを初心者向けに整理。どのツールを選ぶか・個別の使い方は047/075/076へ内部リンクで送客する。型を知り数を回し少しずつ言葉を足す——この3つで誰でも狙った一枚に近づける。

プロンプトエンジニアリング実践大全——AIから望む答えを引き出す6要素と実践テクニック

プロンプトエンジニアリング実践大全——AIから望む答えを引き出す6要素と実践テクニック

同じAIに同じことを聞いても、ある人は「使えない」と言い、ある人は「優秀すぎる」と驚く——その差の正体は、多くの場合AIの性能ではなくプロンプト(指示文)の書き方だ。本記事はその技術=プロンプトエンジニアリングを、初心者がそのまま使えるよう体系化した実践大全。プロンプトエンジニアリングとは何か(AIへの指示文を設計・改善する技術で、コードではなく伝え方の工夫)から、結果が変わる3大原則(具体的に・文脈を渡す・出力を指定、加えて「〜しないで」より「〜して」)、核心となる良いプロンプトの6要素(役割・文脈・指示・例・形式・制約。COSTARやRCOFなど主要フレームワーク共通の要素で、毎回全部は不要、足りない部品を補う)、すぐ効く実践テクニック7選(役割付与・お手本/Few-shot・段階思考・出力形式固定・区切りで構造化・一度に欲張らない・会話で反復、最強は反復)、Before→Afterの実例比較、一歩進んだ技法(思考連鎖CoT・自己整合性・プロンプトチェーン・ReAct、ただしo系やClaude拡張思考の推論モデルはCoTを内部で行うためゴール明示が効く)、よくある失敗7つ、モデル別のコツ(ChatGPT/Claude/Gemini)と入力時の安全面までを、専門用語を噛み砕いて1ページに整理する。具体ケースはアプリ開発のプロンプト、安全面は入力情報の注意点へ内部リンク。曖昧を具体に、丸投げを対話に——この姿勢で誰でも今日から上達できる。

シンギュラリティ(技術的特異点)とは?初心者にもわかりやすく——仕組み・予測・AGIとの違い

シンギュラリティ(技術的特異点)とは?初心者にもわかりやすく——仕組み・予測・AGIとの違い

2025年6月、OpenAIのサム・アルトマン氏は「私たちはすでに事象の地平線を越えた、離陸は始まっている」とブログに記した(「The Gentle Singularity」)。一方で「来ない」と切り捨てる研究者もいる。本記事は初心者向けに、シンギュラリティ(技術的特異点)とは「AIが人間の知能を超え、自分で自分を改良し始めた結果、技術の進歩が爆発的に速くなり、その先が予測も制御もできなくなる転換点」であること(2026年時点では未実現の仮説)を起点に、心臓部である知能爆発=再帰的自己改善のループ(賢いAIがもっと賢いAIを作り、改良する主体が人間からAIに変わるのがカギ)、AGI・ASIとの違い(AGI/ASIは"賢さの状態"、シンギュラリティは"予測不能になる出来事"。AGI→自己改善→ASIへの急変=特異点)、言葉の歴史(1965年I.J.グッドの「知能爆発」→1993年ヴィンジが命名を普及→カーツワイルが2045年で大衆化)、実現時期の予測のばらつき(カーツワイル2045年、アルトマン「もう始まった」、ヴィンジ、懐疑派マーカスや故ポール・アレンの「複雑性のブレーキ」)、急激なハード・テイクオフ対緩やかなソフト・テイクオフ、起きたときの期待(難病・科学の飛躍)とリスク(制御不能・アラインメント問題)、根強い懐疑論(複雑性のブレーキ・物理的限界・そもそも別物)、そして「ロボットの支配」「AGIが来たら即」「2045年に確定」などよくある誤解までをやさしく整理する。過剰に怖がらず夢も見すぎず、今あるAIを使いこなしながら次を冷静に見据えるのが賢い構えだ。

AI士業(弁護士・会計士・税理士)への影響——変わる業務・残る専門性・生き残る条件

AI士業(弁護士・会計士・税理士)への影響——変わる業務・残る専門性・生き残る条件

2023年、ChatGPTに頼って書いた裁判書面の引用判例がすべてAIのでっち上げで、弁護士が制裁を受けた——その事件は「法律×AI」への警戒を世界に広めた。だが数年で士業のAI活用は爆発的に進み、弁護士の9割超が日常業務で何らかのAIを使うとされる。本記事は068(商社)・094(マーケ)・097(コンサル)に続く業界別AI影響シリーズとして士業を俯瞰する。数字で見る現在地(弁護士の62%が週6〜20%の時間削減、HarveyとThomson ReutersのCoCounselが2026年第1四半期だけで1000万件超の法的文書を処理、税務・会計・監査事務所の生成AI導入が2024年8%→2025年21%へ急増、スタンフォード研究で会計など若手の職が2022年比13%減・会計士は5%増/簿記は5%減)、AIが変える職種別の仕事(弁護士=判例リサーチ・契約レビュー・義務抽出/会計士=記帳・証憑突合・サンプリング・リスク識別/税理士=データ入力・申告下書き・法令検索、いずれも下準備はAI・最終判断は人)、最大の落とし穴であるハルシネーション(存在しない判例・条文の創作=制裁や信頼喪失に直結、Harveyは検証済み引用99.7%・確信なきものはフラグ、CoCounselは判例DBに紐づき実在判例のみ引用で抑制)、変わらない本質的価値(最終判断・職業的懐疑・倫理・グレーな税務判断・そして署名と法的責任はAIに委ねられない)、若手の危機(下積み定型業務の自動化)と新しい役割(AIコンプライアンス担当・税務プロンプトエンジニア)、現役士業/目指す人/依頼者それぞれへの立場別アドバイス(引用と数値は必ず一次情報で検証、機密の取り扱い方針の確認)までを公表値ベースで解説する。制度・責任は国で異なり日本では会計ソフトのAI機能等も普及。問われるのは「あなたが売るのは作業か、判断と責任か」だ。

AIで動画・音声から字幕・書き起こしを作る方法——ツール比較・SRT/VTT・多言語字幕の実践ワークフロー

AIで動画・音声から字幕・書き起こしを作る方法——ツール比較・SRT/VTT・多言語字幕の実践ワークフロー

1時間の動画に手で字幕を付けると昔は丸一日が消えた。聞いて止めて打ってタイムコードを合わせて——その地獄が、2026年のいまは「動画を放り込んで数分待つだけ」で終わる。本記事は動画/音声コンテンツの字幕・書き起こし作成に特化し(会議の議事録化は086、画像のOCRは091に譲る)、自動化できる4工程(音声抽出→文字起こし+話者分離→タイムコード付与=SRT/VTT→翻訳・体裁)、字幕(SRT/VTT)と書き起こし(transcript)の違いと使い分け、主要ツール比較(無料・機密向きのWhisper、編集一体のDescript、高精度・多言語のSonixやHappy Scribe、個人向けNotta、スマホのCapCut、最手軽なYouTube自動字幕——多くは内部でWhisper系を利用)、最も再現性の高い4ステップ(素材用意→書き起こし→校正→SRT/VTT書き出し・付与)、YouTube/Podcast/講義/インタビュー/機密/多言語の用途別おすすめ、音質が精度の8割という前提を含む精度向上6つのコツ(音質・言語指定・固有名詞リスト・一括置換・話者分離・1行の長さ)、原語で完璧に起こす→AI翻訳→ネイティブ確認という多言語字幕の王道、そして精度の過信・雑音や専門用語への弱さ・著作権・機密送信・タイムコードのズレといった落とし穴までを実践的に解説する。クリーンな音声なら精度は90〜96%(公表値・条件依存)で労力は8〜9割減。作業はAIに、固有名詞の確認と通し確認という仕上げは人に。