Zum Inhalt springen
KI-Tools

Andere KI

Entdecken und vergleichen Sie aufkommende KI-Tools. Bewertungen, Funktionen und praktische Anleitungen.

40 Artikel

Sortieren Sie Artikel, um das Gewünschte zu finden

Was ist LoRA? KI mit ein bisschen Extra-Training anpassen

Was ist LoRA? KI mit ein bisschen Extra-Training anpassen

Ein riesiges KI-Modell von Grund auf neu zu trainieren ist viel zu teuer, aber man möchte es nur für sich anpassen; LoRA (Low-Rank Adaptation) erfüllt diesen Wunsch, indem es das ursprüngliche Modell einfriert und nur ein winziges Zusatzteil (einen Adapter) trainiert, was die trainierbaren Parameter um rund 90% senkt. LoRA macht Fine-Tuning dramatisch günstiger und schneller und ist in der Bildgenerierung wie Stable Diffusion als kleine Datei, die eine Figur oder einen Stil hinzufügt, enorm beliebt. Dieser Artikel erklärt es mit einer Flicken-Analogie. LoRA ist das Aushängeschild des parametereffizienten Fine-Tunings (PEFT): die riesigen ursprünglichen Gewichte bleiben eingefroren, in jede Schicht wird eine kleine Zusatzmatrix eingefügt und nur diese trainiert (W = W0 + BA, wobei W0 eingefroren ist und BA der kleine hinzugefügte Teil). Es baut auf der Erkenntnis auf, dass die Anpassung einer KI keine großen Änderungen erfordert (ein niedriger Rang genügt). Vorteile: rund 90% weniger trainierbare Params (Berichten zufolge 10.000x weniger in GPT-3-Größenordnung), weniger GPU-Speicher (etwa 3x weniger), schnelleres und günstigeres Training, keine Inferenz-Latenz nach dem Verschmelzen des Adapters und geringeres Overfitting-Risiko. Die größte Stärke sind austauschbare Adapter: eine gemeinsame Basis behalten und je nach Anwendungsfall kleine (wenige-MB) LoRA-Dateien sofort tauschen (Support, Unternehmens-Tonfall, eine bestimmte Figur). Viele begegnen LoRA zuerst in der Bildgenerierung, wo Stable-Diffusion-LoRAs, die eine Figur, einen Stil oder ein Motiv gelernt haben, breit geteilt werden (Stil hinzufügen, Figur beibringen, leicht und teilbar). QLoRA kombiniert Quantisierung und trainiert LoRA auf einer 4-bit-Basis für ~4x weniger Speicher als Standard-LoRA, was das Fine-Tuning riesiger Modelle auf einer Consumer-GPU (manchmal CPU) mit minimalem Genauigkeitsverlust ermöglicht. Gegenüber dem vollständigen Fine-Tuning (alle Gewichte trainieren) unterscheidet sich LoRA bei den trainierten Gewichten, den Kosten, dem Ergebnis und dem besten Einsatz; für die meisten Arbeiten genügt LoRA. Die Basis behalten, klein würzen. Die Zahlen sind aus öffentlichen Materialien zitiert, als Richtwert.

Was ist Quantisierung? KI-Modelle schrumpfen, um sie auf dem eigenen Rechner laufen zu lassen

Was ist Quantisierung? KI-Modelle schrumpfen, um sie auf dem eigenen Rechner laufen zu lassen

Dass ein riesiges 70B-Modell auf einem einzelnen heimischen Gaming-PC statt auf einem Rack voller Rechenzentrums-GPUs läuft, ermöglicht die Quantisierung, die die numerische Präzision der Gewichte eines Modells senkt, um Größe und Speicher drastisch zu verringern. Während die Modell-Destillation Wissen in ein separates kleineres Modell verlagert, macht die Quantisierung dasselbe Modell leichter. Dieser Artikel erklärt sie mit einer Foto-Kompressions-Analogie. Die Quantisierung ersetzt als FP16/FP32-Dezimalzahlen gespeicherte Gewichte durch INT8 (8-bit) oder INT4 (4-bit) Ganzzahlen und reduziert die Bytes pro Gewicht (FP32=4, INT8=1, INT4=0,5); wie beim Komprimieren eines RAW-Fotos zu JPEG opferst du ein wenig Präzision für eine große Reduktion, und überraschend ist, wie wenig man aufgibt. Beim Speicher nutzt 4-bit etwa ein Viertel von FP16: ein 70B-Modell sinkt von ~140GB auf ~35GB, und ein 8B-Modell bei 4-bit liegt bei ~4.5-5GB und passt in eine Mittelklasse-GPU mit 8GB VRAM für lokale Nutzung (die Demokratisierung der LLMs). Bei der Genauigkeit ist INT8 nahezu verlustfrei und INT4 verschlechtert sich unter 4% bei allgemeinen Q&A-/Alltagsaufgaben, doch der Verlust ist bei Mathematik, Code-Generierung und schwierigem Schlussfolgern deutlicher (er zeigt sich als kleiner Anstieg der Perplexität), also wähle die Bit-Breite passend zur Aufgabe. Wichtigste Methoden: GPTQ (Vorreiter für genaues 4-bit), AWQ (schützt die ~1% wichtigsten Gewichte, oft 1-2% genauer und schneller), GGUF (llama.cpp/Ollama-Format, Q2_K-Q8_0, CPU+GPU-Hybrid, für lokal) und QLoRA (4-bit-Basis plus LoRA für Consumer-GPU-Fine-Tuning). Sie unterscheidet sich von Destillation (in ein separates kleines Modell verlagern) und Fine-Tuning (Aufgabenwissen hinzufügen), und die drei werden meist kombiniert (ein destilliertes Modell quantisieren; eine quantisierte Basis fine-tunen). Zum Start ein GGUF-Modell mit Ollama in einem Befehl ausführen, Q4/Q8 nach VRAM wählen und INT4 für Code oder exakte Mathematik vermeiden. Die meisten großen Modelle werden bereits quantisiert ausgeliefert, du lädst sie also einfach herunter und nutzt sie. Behalte die Klugheit, lass nur das Gewicht fallen. Die Zahlen sind aus öffentlichen Materialien zitiert, als Richtwert.

Was ist Modell-Destillation? Wissen von einer großen KI auf eine kleine übertragen

Was ist Modell-Destillation? Wissen von einer großen KI auf eine kleine übertragen

Eine riesige, leistungsstarke KI ist klug, aber schwer und teuer; die Modell-Destillation (Knowledge Distillation) löst dies, indem sie das Wissen eines großen Lehrer-Modells auf ein kleines Schüler-Modell überträgt und so über 95 % der Leistung des Lehrers bei einem Zehntel der Größe und Geschwindigkeit erhält. Dieser Artikel erklärt es anhand einer Lehrer-Schüler-Analogie. Der Schlüssel sind soft labels: Gewöhnliches Training lehrt nur „die Antwort ist Katze“ (hard label), während die Destillation die vollständige Wahrscheinlichkeitsverteilung des Lehrers wie „90 % Katze, 8 % Hund, 2 % Fuchs“ übergibt, deren Grad des Zögerns reiche Informationen enthält; ein temperature-Parameter glättet die Wahrscheinlichkeiten, um feine Beziehungen sichtbar zu machen (reales Beispiel: GPT-4o mini aus GPT-4o destilliert). Vorteile: schnell und günstig, ~10x kompakter bei über 95 % erhaltener Leistung, läuft am Edge, stark bei Spezialisierung. Zwei Ansätze: White-Box (voller Zugriff auf Gewichte und interne Repräsentationen, tiefere Übertragung; für eigene oder OSS-Modelle) und Black-Box (nur Ausgaben/API-Antworten sichtbar; die API eines anderen Unternehmens als Lehrer zu nutzen, kann gegen Bedingungen verstoßen). Sie unterscheidet sich von Quantisierung (Kompression der Gewichtspräzision desselben Modells) und Fine-Tuning (Weitertraining eines bestehenden Modells für eine Aufgabe) – die Destillation überträgt Wissen in ein separates kleines Modell, und die drei sind kombinierbar. Die rechtliche/ToS-Realität war 2026 ein großes Thema: Die Technik ist legitim, aber OpenAI, Anthropic, Mistral und xAI enthalten Klauseln zur wettbewerbswidrigen Destillation, die es verbieten, Ausgaben zum Bau konkurrierender Modelle zu nutzen, sodass das Destillieren eines Konkurrenten aus einer eingeschränkten API gegen die Bedingungen verstoßen kann. Der Streit OpenAI gegen DeepSeek (OpenAI behauptete, mit DeepSeek verbundene Konten umgingen Beschränkungen, um Ausgaben für die Destillation zu erlangen, während DeepSeeks Bedingungen die Destillation seiner Ausgaben Berichten zufolge erlauben) zeigt, dass die Bewertung davon abhängt, wessen API-Bedingungen gelten, und Claude Fable 5/Mythos 5 schränken Antworten zu als Destillation markierten Arbeiten Berichten zufolge ein. Tipps: Verwenden Sie eigene oder lizenzierte OSS-Modelle als Lehrer, prüfen Sie Anti-Destillations-Klauseln vor der Nutzung einer kommerziellen API und beurteilen Sie, ob die Nutzung die „Entwicklung eines konkurrierenden Modells“ darstellt. Klugheit vom großen Modell, Betrieb vom kleinen – aber wen man als Lehrer wählt, ändert das Ergebnis technisch und rechtlich. Zahlen sind aus öffentlichen Materialien zitiert, richtungsweisend.

Was ist Fine-Tuning? Fine-Tuning vs. RAG, LoRA/QLoRA und wann man es einsetzt — ein Einsteigerleitfaden

Was ist Fine-Tuning? Fine-Tuning vs. RAG, LoRA/QLoRA und wann man es einsetzt — ein Einsteigerleitfaden

Wenn du die KI für dein eigenes Unternehmen anpassen willst, ist Fine-Tuning eine der Optionen — doch steigst du unbedacht ein, ist es teuer und leicht falsch zu machen. Dieser Einsteigerleitfaden erklärt Fine-Tuning: ein bereits trainiertes Basismodell zu nehmen, es mit auf den eigenen Zweck zugeschnittenen Daten weiter zu trainieren und in ein spezialisiertes Modell umzuformen, das „Verhalten" (Hausstil, Ausgabeformat, Fachsprache) in das Modell selbst einbrennt, indem es dessen Gewichte umschreibt. Fine-Tuning ist gut darin, Verhalten zu ändern, aber schlecht darin, aktuelles Wissen zu merken — daher die Regel: „Fakten und Wissen → RAG, Persönlichkeit und Schablone → Fine-Tuning, Prompts zuerst." Wie Fachleute anmerken, lassen sich rund 80 % der Fälle von „wir brauchen Fine-Tuning" durch besseres Retrieval (RAG) oder Prompting lösen, also zählt die Reihenfolge. Der Artikel behandelt, was Fine-Tuning ist (mit einer Analogie zur Einarbeitung neuer Mitarbeiter), wofür es taugt und wofür nicht, eine Vergleichstabelle Fine-Tuning vs. RAG vs. Prompting, die wichtigsten Methoden (Full Fine-Tuning, LoRA und QLoRA — 4-Bit-Quantisierung, leicht genug für Einsteiger), was du brauchst (500+ hochwertige Beispiele als Richtwert, wobei der Aufbau der Daten die eigentliche Arbeit ist; Kosten von $5.000 bis über $50.000, OpenAI-Fine-Tuning bei rund $25–$100 pro Million Trainings-Tokens; Werkzeuge wie OpenAI, Unsloth, Axolotl und Hugging Face) und in welcher Reihenfolge man beginnt. Fine-Tuning ist das letzte Mittel.

Lokales LLM betreiben: KI auf dem eigenen PC — Specs, Tools und die besten Modelle für Einsteiger

Lokales LLM betreiben: KI auf dem eigenen PC — Specs, Tools und die besten Modelle für Einsteiger

Du gehst wahrscheinlich davon aus, dass ein LLM in der Cloud laufen muss, doch 2026 ist es eine realistische Option, KI komplett im eigenen PC zu betreiben — ein „lokales LLM". Ein lokales LLM bedeutet, ein Modell wie ChatGPT oder Claude direkt auf der eigenen Maschine statt in der Cloud laufen zu lassen. Die drei großen Reize sind Datenschutz (die Eingabe verlässt das Gerät nie), null Kosten (keine API-Gebühren) und Offline-Nutzung (funktioniert ohne Internet). Die Nachteile: Es ist nicht so klug wie die Spitzen-KI aus der Cloud, braucht einen einigermaßen leistungsfähigen PC, erfordert etwas Einrichtung und hat kein aktuelles Wissen. Dieser Einsteiger-Guide erklärt, was ein lokales LLM ist (mit einer Streaming-vs-Download-Analogie), die Vor- und Nachteile, die benötigten Specs und Quantisierung (das GGUF-Format, wobei Q4_K_M die bewährte Wahl ist, die Qualität behält und den Speicher auf rund ein Viertel senkt; etwa 0,5 GB Speicher pro 1B Parameter bei 4-Bit), den Einstieg (LM Studios GUI für Einsteiger, Ollamas CLI für Entwickler — 52 Millionen Downloads pro Monat im Q1 2026), empfohlene Modelle 2026 (Llama 3.2 7B, Google Gemma 4, Alibaba Qwen3.5 sowie DeepSeek und Mistral — alle offen) und wann man lokal vs. Cloud nutzt (lokal für vertrauliche, umfangreiche und Offline-Arbeit; Cloud für schwierige Probleme). Der schnellste erste Schritt: ein kleines Modell von 3B–7B in LM Studio laufen lassen.

Claude Fable 5 Release im Detail — Funktionen, Benchmarks, Preise, der Mythos-Unterschied und ein neues Sicherheitsdesign

Claude Fable 5 Release im Detail — Funktionen, Benchmarks, Preise, der Mythos-Unterschied und ein neues Sicherheitsdesign

Am 9. Juni 2026 veröffentlichte Anthropic Claude Fable 5 — und machte erstmals in einer Form, die normale Nutzer und Entwickler verwenden können, eine Leistungsfähigkeit auf dem Niveau von "Mythos" verfügbar, dem Frontier-Modell, das intern lange als das leistungsstärkste galt. Anthropic positioniert es als das leistungsstärkste Modell, das es allgemein anbietet, mit dem Slogan "gebaut für lange, komplexe Arbeit." Dieser Detailartikel, so geschrieben, dass Einsteiger folgen können, behandelt, was Fable 5 ist (eine öffentliche, sichere Form der Mythos-Klasse-Leistung, optimiert darauf, einen Marathon zu beenden statt eine einzelne Frage-Antwort; Modell-ID claude-fable-5), wie es sich von seinem Zwilling Mythos 5 unterscheidet (innen identisch, nur die Schutzmechanismen differieren; die Öffentlichkeit nutzt Fable), die Benchmarks (SWE-Bench Pro 80.3% vs. Opus 4.8 69.2 und GPT-5.5 58.6, erstmals 90%+ bei Hex Langlauf-Analyse, top bei Cognition FrontierCode und Hebbia Finanz, neuer SOTA bei Vision, das Pokémon ohne Hilfe spielt), seine wahre Stärke in langer Autonomie (Fokus über Millionen von Tokens, 12-stündige Läufe, Stripe schließt eine 50-Millionen-Zeilen-Ruby-Migration an einem Tag statt in über zwei Monaten von Hand ab, Datei-Memory steigert eine Spielaufgabe 3x stärker als Opus 4.8, GitHub berichtet hochautonomes langfristiges Coding), Preis und Verfügbarkeit ($10 Eingabe / $50 Ausgabe pro 1M Tokens, 1M Kontext und 128K Ausgabe, kostenlos im jeweiligen Plan vom 9.–22. Juni, danach Credits, API claude-fable-5 und GitHub Copilot), einen direkten Vergleich mit Opus 4.8 (Standard $5/$25 vs. $10/$50, +11.1 Punkte bei SWE-Bench Pro, gleicher 1M Kontext, Opus 4.8 Fast Mode zu $10/$50; schwere Arbeit an Fable 5 und den Alltag an Opus 4.8 Standard aufteilen), das Highlight-Sicherheitsdesign (Cyber-, Bio-Chemie- und Distillation-Klassifikatoren, die nur bei Gefahr auf Opus 4.8 zurückfallen, in unter 5% der Sitzungen auslösen, sodass 95%+ mit voller Leistung laufen, mit 30-tägiger Aufbewahrung des Mythos-Klasse-Traffics), den Kontext der Veröffentlichung Tage nach der Warnung, KI sei zu gefährlich (ein dritter Weg, der nur die gefährlichen Bereiche schließt), und wann man es einsetzt. Die Zahlen sind aus Anthropics Ankündigung und Berichten zitiert und können sich ändern.

Einstieg in die KI-Videogenerierung [2026] — Die Lage nach Sora, Veo/Kling und Prompt-Tipps

Einstieg in die KI-Videogenerierung [2026] — Die Lage nach Sora, Veo/Kling und Prompt-Tipps

Man tippt etwas Text, und in Sekunden entsteht ein Video mit Ton — was vor Kurzem noch Science-Fiction gewesen wäre, wurde 2026 Realität, und die Lage verändert sich in einem erschreckenden Tempo. OpenAIs Sora, das die Diskussion dominiert hatte, stellte App und Web im April 2026 ein (die API folgt im September); an seine Stelle traten Google Veo, Kling und Runway. Dieser aktuelle (Juni 2026), toolunabhängige Leitfaden behandelt, was KI-Videogenerierung ist (Erzeugen von bewegtem Bildmaterial aus Worten oder einem Bild, mit Tonsynchronisierung, 1080p–4K und Image-to-Video nun Standard), die Lage 2026 (die Sora-Einstellung — berichteter Hintergrund aus Druck bei Rechenleistung und Kosten sowie sinkenden Nutzerzahlen — und die aktuellen Spitzenreiter Google Veo 3.1, Kling 3.0 und Runway Gen-4.5, mit Abrechnung pro Sekunde als Norm), wie sie funktioniert (Diffusionsmodelle, erweitert um die Zeitdimension; Text-to-Video und Image-to-Video), den gemeinsamen 5-Schritte-Ablauf (Tool wählen, Prompt/Bild, Länge/Format/Ton festlegen, generieren und auswählen, im Schnitt zusammenfügen), die zentralen Video-Prompt-Tipps (Motiv + Bewegung + Kameraarbeit + Stil + Länge + Ton, mit Verben und Kamera als Schlüssel, ein Schnitt eine Aktion, Image-to-Video nutzen, mehrere laufen lassen), was sie heute kann und was noch nicht (lange Werke am Stück und volle Konsistenz bleiben schwer, und die Kosten pro Sekunde summieren sich) sowie die Grundlagen zu Rechten, Wasserzeichen und Ethik (SynthID und C2PA machen KI-Herkunft standardmäßig und unentfernbar, rein KI-erzeugte Ausgabe ist schwach geschützt mit Länderunterschieden, kommerzielle Nutzung hängt von den Bedingungen ab, und Deepfakes realer Personen sind tabu). Erstelle Schnitte und füge sie im Schnitt zusammen, statt ein langes Werk am Stück anzustreben. Da sich das Feld schnell bewegt, prüfe stets das Neueste offiziell.

Einstieg in die KI-Bildgenerierung — wie sie funktioniert, die 4 Schritte, der Aufbau des Bild-Prompts und die Rechte

Einstieg in die KI-Bildgenerierung — wie sie funktioniert, die 4 Schritte, der Aufbau des Bild-Prompts und die Rechte

„Ich kann nicht zeichnen, also ist das nichts für mich" — dieses Vorurteil gegenüber der KI-Bildgenerierung ist verkehrt herum. Geben Sie einfach Anweisungen in Worten, und Sekunden später haben Sie Bilder auf Profi-Niveau. Dieser toolübergreifende Leitfaden behandelt, was KI-Bildgenerierung ist (Bilder von Grund auf aus Worten erzeugen — die Fähigkeit zu kommunizieren, nicht zu zeichnen; die Bild-Version des Prompt Engineering), wie sie funktioniert (Diffusionsmodelle schälen mit Ihrem Prompt als Hinweis ein Bild aus zufälligem Rauschen heraus und zeichnen jedes Mal von Grund auf, sodass die Ergebnisse wackeln), den gemeinsamen 4-Schritte-Workflow, der in jedem Tool funktioniert (Tool wählen, Prompt schreiben, generieren und auswählen, verfeinern und fertigstellen — Iteration ist die Voraussetzung), den zentralen 6-teiligen Aufbau des Bild-Prompts (Motiv, Szene/Schauplatz, Stil, Licht/Farbe, Komposition/Ansicht, technische Angaben) plus Negativ-Prompts und Seitenverhältnis — wobei GPT Image und Imagen schlichte Sätze bevorzugen, während Tools der Stable-Diffusion-Familie Wortlisten und Negativangaben mögen, 7 Tipps zum Meistern (an der Menge drehen, Stück für Stück ergänzen, Referenzbilder, Inpainting, Seed fixieren, hochskalieren, gute Prompts speichern), womit KI sich schwertut (Hände, Text, Konsistenz, feine Genauigkeit) und Abhilfen, sowie die Grundlagen zu Rechten, kommerzieller Nutzung und Ethik für die Arbeit (reine KI-Ausgabe ist laut US Copyright Office und dem Thaler-Urteil von 2025 schwach geschützt, mit Unterschieden je nach Land; kommerzielle Nutzung hängt von den Bedingungen des jeweiligen Tools ab; Deepfakes und unerlaubtes Nachahmen von Stilen sind tabu; Herkunftsangaben wie die C2PA-Metadaten von DALL-E verbreiten sich). Welches Tool zu wählen ist und tool-spezifische Anleitungen verlinken auf den Vergleich sowie die Artikel zu Midjourney und Stable Diffusion. Den Aufbau kennen, an der Menge drehen, Worte Stück für Stück ergänzen — jeder kann sich der gewünschten Aufnahme annähern.

Prompt-Engineering: Das praktische Kompendium — 6 Bestandteile und Techniken, um von KI die gewünschten Antworten zu erhalten

Prompt-Engineering: Das praktische Kompendium — 6 Bestandteile und Techniken, um von KI die gewünschten Antworten zu erhalten

Sie fragen dieselbe KI dasselbe, und doch nennt die eine Person sie nutzlos, während die andere staunt, wie fähig sie ist — und die wahre Ursache dieser Kluft ist oft nicht die Leistung der KI, sondern wie der Prompt formuliert ist. Dies ist ein praktisches Kompendium genau dieser Fähigkeit, des Prompt-Engineerings, so aufbereitet, dass Einsteiger es sofort anwenden können. Es behandelt, was Prompt-Engineering ist (die Fähigkeit, Ihre Anweisung an KI zu gestalten und zu verbessern — kein Code, sondern die Kunst, wie man Dinge sagt), die drei Prinzipien, die Ihre Ergebnisse verändern (konkret sein, Kontext geben, die Ausgabe festlegen, dazu „tu X" statt „tu nicht Y"), die zentralen 6 Bestandteile eines guten Prompts (Rolle, Kontext, Anweisung, Beispiele, Format, Einschränkungen — die Elemente, die große Frameworks wie COSTAR und RCOF gemeinsam aufführen; Sie brauchen nicht jedes Mal alle sechs), 7 praxistaugliche Techniken (eine Rolle geben, ein Muster/few-shot zeigen, Schritt für Schritt schließen, das Ausgabeformat festlegen, mit Trennzeichen strukturieren, nicht zu viel auf einmal verlangen und iterieren — am stärksten ist das Iterieren), ein Vorher/Nachher-Beispiel, Techniken für Fortgeschrittene (Chain of Thought, Self-Consistency, Prompt Chaining, ReAct — wobei Reasoning-Modelle wie die o-Reihe und Claudes Extended Thinking CoT intern ausführen, sodass das Nennen des Ziels besser funktioniert), 7 häufige Fehler sowie modellspezifische Tipps und Eingabesicherheit. Mit internen Links zu Prompt-Tipps für die App-Entwicklung und zu Eingabe-Vorsichtsmaßnahmen. Aus vage wird konkret, aus Hinwerfen wird Dialog — jeder kann sich ab heute verbessern.

Was ist die technologische Singularität? Ein einsteigerfreundlicher Leitfaden — Mechanismus, Prognosen und der Unterschied zu AGI

Was ist die technologische Singularität? Ein einsteigerfreundlicher Leitfaden — Mechanismus, Prognosen und der Unterschied zu AGI

Im Juni 2025 schrieb Sam Altman von OpenAI in seinem Blog: „Wir haben den Ereignishorizont überschritten; der Takeoff hat begonnen" („The Gentle Singularity"). Andere Forscher hingegen weisen die Idee schlichtweg als etwas zurück, das nie eintreten wird. Dieser Einsteigerleitfaden erklärt, dass die Singularität (technologische Singularität) „der Kipppunkt ist, an dem die KI die menschliche Intelligenz übertrifft und beginnt, sich selbst zu verbessern, sodass der Fortschritt explosionsartig schnell wird und nicht mehr vorhergesagt oder kontrolliert werden kann" (eine Hypothese, Stand 2026 nicht verwirklicht). Er behandelt den Kern — die Intelligenzexplosion = rekursive Selbstverbesserung, bei der kluge KI noch klügere KI baut und der Verbessernde vom Menschen zur KI wechselt; wie sie sich von AGI und ASI unterscheidet (AGI/ASI sind „Zustände" der Intelligenz, die Singularität ist das „Ereignis" des Unvorhersehbarwerdens; AGI → Selbstverbesserung → der plötzliche Sprung zur ASI = die Singularität); die Geschichte des Begriffs (I. J. Goods „Intelligenzexplosion" von 1965 → Vinge macht den Namen 1993 populär → Kurzweil macht sie mit „2045" salonfähig); die weite Streuung der Prognosen (Kurzweil 2045, Altman „bereits begonnen", Vinge sowie Skeptiker wie Gary Marcus und die „Komplexitätsbremse" des verstorbenen Paul Allen); plötzlicher Hard Takeoff vs. allmählicher Soft Takeoff; die Hoffnungen (Durchbrüche bei Krankheiten und in der Wissenschaft) und Risiken (Kontrollverlust, das Alignment-Problem); die tiefe Skepsis (Komplexitätsbremse, physikalische Grenzen, etwas völlig anderes); und häufige Mythen wie „herrschende Roboter", „sofort, sobald AGI eintrifft" und „fest für 2045". Sie weder übermäßig zu fürchten noch zu sehr von ihr zu träumen — die KI von heute bestmöglich nutzen und dabei ruhig beobachten, was als Nächstes kommen mag.

KI und ihre Auswirkungen auf Anwälte, Wirtschaftsprüfer und Steuerberater: Was sich ändert, was bleibt

KI und ihre Auswirkungen auf Anwälte, Wirtschaftsprüfer und Steuerberater: Was sich ändert, was bleibt

2023 wurde ein Anwalt mit Sanktionen belegt, nachdem ein mit ChatGPT verfasster Schriftsatz ausschließlich von der KI erfundene Fälle zitierte — und dieser Vorfall verbreitete weltweit Misstrauen gegenüber Recht und KI. Doch binnen weniger Jahre explodierte die Nutzung, und über 90 % der Anwälte sollen KI in der täglichen Arbeit einsetzen. Als nächster Beitrag unserer Serie zu KI-Auswirkungen nach Branche nach #068 (Handel), #094 (Marketing) und #097 (Beratung) betrachtet dieser die freien Berufe. Der aktuelle Stand in Zahlen (62 % der Anwälte berichten 6–20 % wöchentliche Zeitersparnis; Harvey und CoCounsel von Thomson Reuters verarbeiteten im 1. Quartal 2026 über 10 Mio. Rechtsdokumente; generative KI bei Steuer-/Buchhaltungs-/Prüfungskanzleien stieg von 8 % 2024 auf 21 % 2025; eine Stanford-Studie zeigt einen Rückgang der Einsteigerstellen in Feldern wie dem Rechnungswesen um 13 % gegenüber 2022, Wirtschaftsprüfer +5 % und Buchhalter -5 %), welche Arbeit KI je Beruf verändert (Anwälte = Fallrecherche, Vertragsprüfung, Pflichtenextraktion; Wirtschaftsprüfer = Buchführung, Belegprüfung, Stichproben, Risikoidentifikation; Steuerberater = Dateneingabe, Entwürfe von Steuererklärungen, Gesetzesrecherche — KI erledigt die Vorarbeit, Menschen fällen die Entscheidung), die größte Falle der Halluzination (Erfinden nicht existierender Fälle/Gesetze — mit Sanktionen und Vertrauensverlust; Harvey wirbt mit 99,7 % geprüfter Zitatgenauigkeit und markiert den Rest, CoCounsel verankert Zitate in einer Falldatenbank und zitiert nur reale Fälle), der unveränderliche wesentliche Wert (endgültiges Urteil, professionelle Skepsis, Ethik, graue steuerliche Beurteilungen und — entscheidend — Unterschrift und rechtliche Haftung, die sich nicht an die KI delegieren lässt), die Einsteigerkrise (Automatisierung der Lehrjahre-Routine) und neue Rollen (KI-Compliance-Beauftragte, Steuer-Prompt-Engineers) sowie Ratschläge nach Rolle für Praktiker, Angehende und Mandanten (Zitate und Zahlen anhand der Primärquellen überprüfen; den Umgang mit Vertraulichkeit klären). Regulierung und Haftung unterscheiden sich von Land zu Land; in Japan sind KI-Funktionen in Buchhaltungssoftware ebenfalls verbreitet. Die Frage, die KI stellt: Ist das, was Sie verkaufen, die Arbeit oder das Urteil und die Verantwortung?

Untertitel und Transkripte aus Video/Audio mit KI erstellen

Untertitel und Transkripte aus Video/Audio mit KI erstellen

Ein einstündiges Video von Hand zu untertiteln, hat früher einen ganzen Tag verschlungen – zuhören, pausieren, tippen, den Timecode ausrichten. 2026 erledigt sich diese Hölle durch "das Video hineinwerfen und ein paar Minuten warten". Mit Fokus auf das Untertiteln/Transkribieren von Video- und Audioinhalten (Meeting-Protokolle gehen zu #086, Bild-OCR zu #091) behandelt dieser Leitfaden die vier Stufen, die KI automatisiert (Audio-Extraktion → Transkription mit Diarisierung → Timecoding in SRT/VTT → Übersetzung und Gestaltung), den Unterschied zwischen Untertiteln (SRT/VTT) und Transkripten und wann man was nutzt, einen Tool-Vergleich (kostenlos-und-privat Whisper, alles-bearbeiten Descript, hochgenau-mehrsprachig Sonix und Happy Scribe, einsteigerfreundlich Notta, mobil CapCut, am einfachsten YouTube-Auto-Untertitel – viele mit Spracherkennung der Whisper-Familie unter der Haube), den am besten wiederholbaren 4-Schritte-Workflow (vorbereiten → transkribieren → korrekturlesen → SRT/VTT exportieren/einbinden), Empfehlungen nach Einsatzzweck (YouTube, Podcasts, Vorlesungen, Interviews, vertraulich, mehrsprachig), sechs Genauigkeits-Tipps mit der Audioqualität als 80 % des Ergebnisses (Qualität, Spracheinstellung, Eigennamenliste, Suchen-und-Ersetzen, Diarisierung, Zeilenlänge), den Königsweg-Workflow für Mehrsprachigkeit (Ausgangssprache perfektionieren → per KI übersetzen → native Prüfung) und die Stolperfallen – Übervertrauen in die Genauigkeit, Schwäche bei Rauschen und Fachjargon, Urheberrecht, vertrauliche Uploads und Timecode-Drift. Bei sauberem Ton liegt die Genauigkeit bei 90–96 % (veröffentlicht, bedingungsabhängig) und die Arbeit sinkt um 80–90 %. Die Arbeit der KI; den Feinschliff – Eigennamen prüfen und durchsehen – dir.