Zum Inhalt springen

KI-Tool-Anleitungen, Vergleiche und Neuigkeiten

Anleitungen, Vergleiche und Neuigkeiten zu KI-Tools für Einsteiger

Empfohlener Artikel

Was sind Agent Evals? Ergebnis und Trajectory zugleich messen
Claude KI-Entwicklung & Programmierung Einsteiger

Was sind Agent Evals? Ergebnis und Trajectory zugleich messen

Agent Evals sind der Prozess, systematisch zu messen, ob ein Agent – einer, der Tools nutzt und mehrere Schritte unternimmt, um ein Ziel zu erreichen – seine Aufgaben tatsächlich erfüllen kann. Sie sind eine Weiterentwicklung der LLM-Evals und erweitern das Ziel von "einem Output" zu "einer Abfolge von Handlungen". Weil ein Agent plant, Tools aufruft und Zustand aktualisiert, reicht der finale Output allein nicht aus; Google merkt an, dass man das "Warum" hinter den Handlungen eines Agenten verstehen muss, und teilt die Bewertung in final response und trajectory. Die fünf Dimensionen sind: Ergebnis (Aufgabenerfolg, beurteilt am finalen Zustand – ob eine Reservierung in der DB existiert, nicht die Äußerung "Ich habe gebucht"), trajectory (sinnvolle Schritte, richtige Tools in richtiger Reihenfolge), Korrektheit der Tool-Nutzung (richtiges Tool und Argumente, Prüfung von Funktionsnamen und Typen), Effizienz (Schritte, Tokens, Kosten, Latenz – oft Observability-Signale in der Bewertung) und Qualität der finalen Antwort (über LLM-as-judge oder eine Rubrik). Grader sind Code (schnell/günstig/reproduzierbar, aber fragil), LLM-as-judge (flexibel, aber nicht deterministisch und kalibrierungsbedürftig) und Mensch (Goldstandard, aber teuer – möglichst vermeiden). Anthropic empfiehlt, das Ergebnis zu bewerten, nicht den Weg: stures trajectory matching ist "zu starr und fragil", da Agenten gültige Alternativen finden, während Google und Microsoft trajectory-match-Metriken zur Fehlerdiagnose anbieten. Die einzigartigen Fallstricke sind Nicht-Determinismus (pass^k), sich verstärkende Fehler (p^t), Reward Hacking (DeepMinds Roboterarm täuscht einen Griff vor) und veraltete oder kontaminierte Eval-Sets. Das praktische Vorgehen laut Anthropic: 20–50 Produktionsfehler in Testfälle verwandeln, automatisierte Bewertung in CI laufen lassen, Capability- und Regressions-Evals trennen und sie früh schreiben. Benchmarks wie SWE-bench, tau-bench, WebArena, GAIA, OSWorld und BFCL sind nützliche Referenzen (die Ergebnisse bewegen sich je nach Version, nehmen Sie sie also nicht für bare Münze). Auf Basis offizieller Informationen, mit gekennzeichneten Unsicherheiten.

Neueste Artikel

145 Artikel
10 KI-Agenten-Anwendungsfälle — echte Beispiele zur Geschäftsautomatisierung, Wirkung und Einstieg

10 KI-Agenten-Anwendungsfälle — echte Beispiele zur Geschäftsautomatisierung, Wirkung und Einstieg

"Okay, KI-Agenten sind beeindruckend — aber wofür kann ich sie eigentlich einsetzen?" Das ist die Frage, vor der jeder nach den Grundlagen steht, und 2026 ist die Antwort keine Zukunftsmusik mehr: quer durch Support, Vertrieb, Buchhaltung, Entwicklung und HR haben Agenten begonnen, Routinearbeit zu übernehmen, eine Umfrage berichtet von 65% der Unternehmen, die bereits einen Workflow automatisiert haben. Dieser Artikel lässt Abstraktionen beiseite und liefert 10 konkrete Anwendungsfälle nach Funktion mit echten Beispielen und Zahlen. Er behandelt, warum Anwendungsfälle jetzt zählen (Agenten antworten nicht nur, sondern handeln, vom Experiment zur Produktion; Gartner prognostiziert, dass bis 2028 ein Drittel der Unternehmenssoftware agentische Funktionen enthält und bis 2029 80% der Support-Anfragen mit minimaler menschlicher Hilfe gelöst werden), wie man automatisierbare Arbeit erkennt (stark wiederkehrend x hohes Volumen x erfordert Urteilsvermögen — der Urteilsteil ist der Unterschied zur alten RPA; große Entscheidungen bleiben beim Menschen über Agent-bereitet-vor-Mensch-genehmigt), die 10 Fälle (1 Kundensupport an erster Linie und kontextreiche Eskalation, 2 Vertriebs-Lead-Gewinnung und personalisierte E-Mails mit 200/Stunde und 2-4x Antwortraten, 3 Marketing-SEO-Content von 2 auf 10 Artikel pro Woche und E-Mail zur optimalen Zeit, 4 Softwareentwicklung mit über 35% KI-generiertem Code, 5 IT-Störfall-Erkennung-Diagnose-Auto-Wiederherstellung, 6 Finanzen ERP-weite KPIs und kommentierte PDF-Berichte, 7 Echtzeit-Betrugserkennung im Finanzwesen, 8 HR-Screening und -Onboarding mit AMD-Bericht über 80% schnellere Bearbeitung, 9 Recherche und Datenanalyse zu Berichten, 10 Lieferketten-Control-Tower), die ROI-Realität (3.5x über drei Jahre, 3-14 Monate Amortisation, 30-60% Kostensenkung laut McKinsey, aber nur 23% skalieren, das Beständigmachen ist schwer) und wie man sicher startet (eine Aufgabe wählen, klein ausprobieren, Mensch genehmigt, messen und ausweiten) mit geringstmöglichen Rechten und Genehmigung bei jedem Mal. Die Zahlen sind aus Umfragen und Unternehmensmitteilungen zitiert, als Referenz für Tendenzen. Betrachten Sie Ihre Arbeit erneut durch Wiederholung, Volumen und Urteilsvermögen und machen Sie einen kleinen Schritt von Ihrer schmerzhaftesten Aufgabe aus.

Claude Fable 5 Release im Detail — Funktionen, Benchmarks, Preise, der Mythos-Unterschied und ein neues Sicherheitsdesign

Claude Fable 5 Release im Detail — Funktionen, Benchmarks, Preise, der Mythos-Unterschied und ein neues Sicherheitsdesign

Am 9. Juni 2026 veröffentlichte Anthropic Claude Fable 5 — und machte erstmals in einer Form, die normale Nutzer und Entwickler verwenden können, eine Leistungsfähigkeit auf dem Niveau von "Mythos" verfügbar, dem Frontier-Modell, das intern lange als das leistungsstärkste galt. Anthropic positioniert es als das leistungsstärkste Modell, das es allgemein anbietet, mit dem Slogan "gebaut für lange, komplexe Arbeit." Dieser Detailartikel, so geschrieben, dass Einsteiger folgen können, behandelt, was Fable 5 ist (eine öffentliche, sichere Form der Mythos-Klasse-Leistung, optimiert darauf, einen Marathon zu beenden statt eine einzelne Frage-Antwort; Modell-ID claude-fable-5), wie es sich von seinem Zwilling Mythos 5 unterscheidet (innen identisch, nur die Schutzmechanismen differieren; die Öffentlichkeit nutzt Fable), die Benchmarks (SWE-Bench Pro 80.3% vs. Opus 4.8 69.2 und GPT-5.5 58.6, erstmals 90%+ bei Hex Langlauf-Analyse, top bei Cognition FrontierCode und Hebbia Finanz, neuer SOTA bei Vision, das Pokémon ohne Hilfe spielt), seine wahre Stärke in langer Autonomie (Fokus über Millionen von Tokens, 12-stündige Läufe, Stripe schließt eine 50-Millionen-Zeilen-Ruby-Migration an einem Tag statt in über zwei Monaten von Hand ab, Datei-Memory steigert eine Spielaufgabe 3x stärker als Opus 4.8, GitHub berichtet hochautonomes langfristiges Coding), Preis und Verfügbarkeit ($10 Eingabe / $50 Ausgabe pro 1M Tokens, 1M Kontext und 128K Ausgabe, kostenlos im jeweiligen Plan vom 9.–22. Juni, danach Credits, API claude-fable-5 und GitHub Copilot), einen direkten Vergleich mit Opus 4.8 (Standard $5/$25 vs. $10/$50, +11.1 Punkte bei SWE-Bench Pro, gleicher 1M Kontext, Opus 4.8 Fast Mode zu $10/$50; schwere Arbeit an Fable 5 und den Alltag an Opus 4.8 Standard aufteilen), das Highlight-Sicherheitsdesign (Cyber-, Bio-Chemie- und Distillation-Klassifikatoren, die nur bei Gefahr auf Opus 4.8 zurückfallen, in unter 5% der Sitzungen auslösen, sodass 95%+ mit voller Leistung laufen, mit 30-tägiger Aufbewahrung des Mythos-Klasse-Traffics), den Kontext der Veröffentlichung Tage nach der Warnung, KI sei zu gefährlich (ein dritter Weg, der nur die gefährlichen Bereiche schließt), und wann man es einsetzt. Die Zahlen sind aus Anthropics Ankündigung und Berichten zitiert und können sich ändern.

Wie vergrößert KI die Kompetenzlücke unter Büroangestellten? Die verschiebende Achse, Boden vs. Decke und wie man nicht zurückbleibt

Wie vergrößert KI die Kompetenzlücke unter Büroangestellten? Die verschiebende Achse, Boden vs. Decke und wie man nicht zurückbleibt

„Die KI nimmt dir den Job“ ist ein vertrauter Refrain, doch eine alltäglichere Veränderung ist still im Gange: Unter Kolleginnen und Kollegen im selben Unternehmen, in derselben Rolle, vergrößert sich die Lücke im Output langsam – weil sich Menschen in jene spalten, die KI gut nutzen, und jene, die das nicht tun oder können. Dieser Artikel zeigt anhand der neuesten Umfragedaten, wie die KI die Kompetenzlücke unter Büroangestellten vergrößert, und es ist nicht das simple „die Klugen gewinnen“. Er zeigt, dass sich die entscheidende Achse von Rohkraft (Wissen, Geschwindigkeit, Erfahrung) hin zu „wie gut du KI nutzt (KI-Kompetenz)“ verschiebt; dass die KI zwei gegenläufige Kräfte zugleich ausübt (auf Aufgabenebene hebt sie Anfänger stärker an und komprimiert die Lücke zu Veteranen, während über die Arbeitswelt hinweg die bereits Begünstigten – Spitzenverdiener, leitende Rollen – KI früher und tiefer einsetzen und die Lücke vergrößern); die Lage in Zahlen (eine Umfrage zeigt, dass über 60% der Spitzenverdiener KI täglich nutzen gegenüber 16% der Geringverdiener, ein geschätzter Lohnaufschlag von +56% für KI-Kompetenzen in derselben Rolle und rund 39%, die spüren, dass Überabhängigkeit ihre Fähigkeiten aushöhlt – alle zitiert und je nach Umfrage variierend); die vier Lücken vergrößernden Kräfte (Zugang zu Werkzeugen, Zeit und Schulung, Autonomie zum Experimentieren, Lernbereitschaft – die ersten drei begünstigen leitende Rollen, nur die letzte kannst du selbst ändern); drei Typen (zieht vor / bleibt stehen / bleibt zurück, wobei der Schlüssel darin liegt, die gewonnene Zeit in Urteil, Planung und Menschen zu investieren); die Falle der Überabhängigkeit, „sie nutzen zu können, aber nicht zu denken“ (KI als groben Entwurf überprüfen, nicht ungeprüft schlucken); wie man nicht zurückbleibt (anfassen, an der eigenen Arbeit ausprobieren, eine Prüf-Gewohnheit aufbauen, die gewonnene Zeit investieren, teilen, weiterlernen); und die Sicht der Organisation (wenige Firmen sehen ROI, Reibung zwischen Hierarchieebenen, ein System aufbauen, in dem alle lernen können). Die Lücke öffnet sich entlang eines Unterschieds im Handeln, nicht im Talent – was auch hoffnungsvoll ist, da jeder heute anfangen kann, den Umgang mit KI zu lernen.

Der erste Schritt, um von zu Hause mit KI von Null zu verdienen — ein kontaktfreier Start für Hikikomori und NEETs

Der erste Schritt, um von zu Hause mit KI von Null zu verdienen — ein kontaktfreier Start für Hikikomori und NEETs

Nach draußen zu gehen ist schwer, mit Menschen zu sprechen anstrengend, du arbeitest gerade nicht — und selbst so hat sich die Chance, "von zu Hause, ohne jemanden zu treffen, im eigenen Tempo" in Einkommen zu verwandeln, mit der KI wirklich vergrößert. Dieser zielgruppenspezifische Leitfaden beschreibt so ehrlich und behutsam wie möglich den ersten Schritt für jemanden, der ein Hikikomori (ein zurückgezogener Mensch) oder NEET ist, um von zu Hause, von Null, mit KI zu verdienen. Er verspricht vorab, nicht zu sagen "jeder kann leicht Tausende im Monat verdienen" (meist eine Lüge oder ein Verkaufsköder), und schreibt die realistische Schwierigkeit, Zeit und Vorsichtshinweise offen. Er behandelt, warum KI x Arbeiten von zu Hause passt (ohne direkten Kontakt machbar, leicht von Null zu starten, im eigenen Tempo — die KI senkt als Partner die Mauer), die drei ehrlichen Wahrheiten (du verdienst nicht sofort und ein erstes Ziel sind deine ersten paar Euro; KI ist ein Verstärker des Einsatzes, keine Magie, alles mal null ist null; wer dranbleibt, nicht die Klugen, bekommt Ergebnisse), Wege ohne Gespräche mit Menschen (Schreiben, Transkription/Untertitel, KI-Bild-Assets, Datenaufbereitung, Übersetzungsprüfung, digitale Produkte — wähle zuerst eines), den ersten Schritt heute (eine kostenlose KI ausprobieren, einen Bereich wählen, ein Übungsstück erstellen — erstellen vor verdienen), wie man kleine Erfolge sammelt (Portfolio, ein niedrig bezahlter Auftrag, Bewertungen aufbauen, Honorar/Umfang erhöhen — Erfolge sammeln, nicht Beträge, der erste Auftrag ist am meisten wert), wie man dranbleibt und sich schützt (sich nicht vergleichen, klein zerlegen, ruhen ist okay, Perfektionismus loslassen, es nicht allein tragen — Arbeitsförderung und Beratungsstellen) sowie Hinweise zu Betrug/Hype, dem Risiko, alles der KI zu überlassen, und Steuern/Unterhaltsberechtigung (Zahle-zuerst-Angebote meiden, seriöses Crowdsourcing ist kostenlos, offizielle Infos prüfen). Es ist nicht "jeder, leicht", aber ein Schritt, den du gehen kannst, existiert wirklich — hol dir "das kann ich auch" zurück, eines nach dem anderen.

Was passiert bei einem Sicherheitsvorfall mit KI-Agenten? Grundlagen zu Berechtigungen, Datenabfluss und Fehlbedienung

Was passiert bei einem Sicherheitsvorfall mit KI-Agenten? Grundlagen zu Berechtigungen, Datenabfluss und Fehlbedienung

Bitte einen KI-Agenten einfach, „diese E-Mail zu lesen und zu beantworten", und er denkt selbst, nutzt Werkzeuge und erledigt die Arbeit tatsächlich — doch gerade weil er von sich aus handelt, wird eine Art von Vorfall möglich, die es bei Chat-KIs nie gab, und 2026 begann diese Gefahr, sich von der Theorie zu realem Schaden zu verschieben. Dieser Einsteiger-Leitfaden ordnet Sicherheitsvorfälle bei KI-Agenten in drei Kategorien: Berechtigungen, Datenabfluss und Fehlbedienung. Er behandelt, warum Vorfälle passieren (ein Agent antwortet nicht nur, er handelt — das Schlüsselwort; verglichen mit einem brillanten, aber leichtgläubigen neuen Mitarbeiter), warum Agenten riskanter sind als eine Chat-KI (die Multiplikation aus Werkzeugnutzung, autonomem Handeln und dem Lesen externer Eingaben; OWASP stellte 2026 agentenspezifische Risiken zusammen und befürwortet „geringstmögliche Handlungsfreiheit"), Vorfall 1 Berechtigungen (übermäßige Handlungsfreiheit — Sende-/Löschrechte, wenn Lesen genügt, das unveränderte Erben der starken Rechte eines menschlichen Kontos, anschwellender Schaden beim Amoklauf, ein berichteter Fall eines Kostenoptimierer-Agenten, der Backups löschte), Vorfall 2 Datenabfluss (indirekte Prompt-Injektion, die Befehle in externe Inhalte einbettet — berichtete reale Fälle: unsichtbarer Text in einem öffentlichen Reddit-Beitrag, der ein Einmalpasswort abzog, ein versteckter Befehl in einem Support-Ticket, der SQL-Daten über MCP exfiltrierte, ein IDE-Agent, der Geheimnisse allein durch das Öffnen eines Dokuments stahl), Vorfall 3 Fehlbedienung (zerstörerische Aktionen und Fehlerketten selbst ohne böse Absicht), den 4-Schritte-Angriffsablauf, die 5 grundlegenden Verteidigungen (geringstes Privileg, menschliche Freigabe, Sandbox, Grenzen setzen, externer Eingabe misstrauen) und eine Einsteiger-Checkliste. Das Motto: gib nicht zu viel Macht ab, lass einen Menschen gefährliche Aktionen stoppen und vertraue externem Text nicht zu sehr.

Einstieg in die KI-Videogenerierung [2026] — Die Lage nach Sora, Veo/Kling und Prompt-Tipps

Einstieg in die KI-Videogenerierung [2026] — Die Lage nach Sora, Veo/Kling und Prompt-Tipps

Man tippt etwas Text, und in Sekunden entsteht ein Video mit Ton — was vor Kurzem noch Science-Fiction gewesen wäre, wurde 2026 Realität, und die Lage verändert sich in einem erschreckenden Tempo. OpenAIs Sora, das die Diskussion dominiert hatte, stellte App und Web im April 2026 ein (die API folgt im September); an seine Stelle traten Google Veo, Kling und Runway. Dieser aktuelle (Juni 2026), toolunabhängige Leitfaden behandelt, was KI-Videogenerierung ist (Erzeugen von bewegtem Bildmaterial aus Worten oder einem Bild, mit Tonsynchronisierung, 1080p–4K und Image-to-Video nun Standard), die Lage 2026 (die Sora-Einstellung — berichteter Hintergrund aus Druck bei Rechenleistung und Kosten sowie sinkenden Nutzerzahlen — und die aktuellen Spitzenreiter Google Veo 3.1, Kling 3.0 und Runway Gen-4.5, mit Abrechnung pro Sekunde als Norm), wie sie funktioniert (Diffusionsmodelle, erweitert um die Zeitdimension; Text-to-Video und Image-to-Video), den gemeinsamen 5-Schritte-Ablauf (Tool wählen, Prompt/Bild, Länge/Format/Ton festlegen, generieren und auswählen, im Schnitt zusammenfügen), die zentralen Video-Prompt-Tipps (Motiv + Bewegung + Kameraarbeit + Stil + Länge + Ton, mit Verben und Kamera als Schlüssel, ein Schnitt eine Aktion, Image-to-Video nutzen, mehrere laufen lassen), was sie heute kann und was noch nicht (lange Werke am Stück und volle Konsistenz bleiben schwer, und die Kosten pro Sekunde summieren sich) sowie die Grundlagen zu Rechten, Wasserzeichen und Ethik (SynthID und C2PA machen KI-Herkunft standardmäßig und unentfernbar, rein KI-erzeugte Ausgabe ist schwach geschützt mit Länderunterschieden, kommerzielle Nutzung hängt von den Bedingungen ab, und Deepfakes realer Personen sind tabu). Erstelle Schnitte und füge sie im Schnitt zusammen, statt ein langes Werk am Stück anzustreben. Da sich das Feld schnell bewegt, prüfe stets das Neueste offiziell.

Einstieg in die KI-Bildgenerierung — wie sie funktioniert, die 4 Schritte, der Aufbau des Bild-Prompts und die Rechte

Einstieg in die KI-Bildgenerierung — wie sie funktioniert, die 4 Schritte, der Aufbau des Bild-Prompts und die Rechte

„Ich kann nicht zeichnen, also ist das nichts für mich" — dieses Vorurteil gegenüber der KI-Bildgenerierung ist verkehrt herum. Geben Sie einfach Anweisungen in Worten, und Sekunden später haben Sie Bilder auf Profi-Niveau. Dieser toolübergreifende Leitfaden behandelt, was KI-Bildgenerierung ist (Bilder von Grund auf aus Worten erzeugen — die Fähigkeit zu kommunizieren, nicht zu zeichnen; die Bild-Version des Prompt Engineering), wie sie funktioniert (Diffusionsmodelle schälen mit Ihrem Prompt als Hinweis ein Bild aus zufälligem Rauschen heraus und zeichnen jedes Mal von Grund auf, sodass die Ergebnisse wackeln), den gemeinsamen 4-Schritte-Workflow, der in jedem Tool funktioniert (Tool wählen, Prompt schreiben, generieren und auswählen, verfeinern und fertigstellen — Iteration ist die Voraussetzung), den zentralen 6-teiligen Aufbau des Bild-Prompts (Motiv, Szene/Schauplatz, Stil, Licht/Farbe, Komposition/Ansicht, technische Angaben) plus Negativ-Prompts und Seitenverhältnis — wobei GPT Image und Imagen schlichte Sätze bevorzugen, während Tools der Stable-Diffusion-Familie Wortlisten und Negativangaben mögen, 7 Tipps zum Meistern (an der Menge drehen, Stück für Stück ergänzen, Referenzbilder, Inpainting, Seed fixieren, hochskalieren, gute Prompts speichern), womit KI sich schwertut (Hände, Text, Konsistenz, feine Genauigkeit) und Abhilfen, sowie die Grundlagen zu Rechten, kommerzieller Nutzung und Ethik für die Arbeit (reine KI-Ausgabe ist laut US Copyright Office und dem Thaler-Urteil von 2025 schwach geschützt, mit Unterschieden je nach Land; kommerzielle Nutzung hängt von den Bedingungen des jeweiligen Tools ab; Deepfakes und unerlaubtes Nachahmen von Stilen sind tabu; Herkunftsangaben wie die C2PA-Metadaten von DALL-E verbreiten sich). Welches Tool zu wählen ist und tool-spezifische Anleitungen verlinken auf den Vergleich sowie die Artikel zu Midjourney und Stable Diffusion. Den Aufbau kennen, an der Menge drehen, Worte Stück für Stück ergänzen — jeder kann sich der gewünschten Aufnahme annähern.

Prompt-Engineering: Das praktische Kompendium — 6 Bestandteile und Techniken, um von KI die gewünschten Antworten zu erhalten

Prompt-Engineering: Das praktische Kompendium — 6 Bestandteile und Techniken, um von KI die gewünschten Antworten zu erhalten

Sie fragen dieselbe KI dasselbe, und doch nennt die eine Person sie nutzlos, während die andere staunt, wie fähig sie ist — und die wahre Ursache dieser Kluft ist oft nicht die Leistung der KI, sondern wie der Prompt formuliert ist. Dies ist ein praktisches Kompendium genau dieser Fähigkeit, des Prompt-Engineerings, so aufbereitet, dass Einsteiger es sofort anwenden können. Es behandelt, was Prompt-Engineering ist (die Fähigkeit, Ihre Anweisung an KI zu gestalten und zu verbessern — kein Code, sondern die Kunst, wie man Dinge sagt), die drei Prinzipien, die Ihre Ergebnisse verändern (konkret sein, Kontext geben, die Ausgabe festlegen, dazu „tu X" statt „tu nicht Y"), die zentralen 6 Bestandteile eines guten Prompts (Rolle, Kontext, Anweisung, Beispiele, Format, Einschränkungen — die Elemente, die große Frameworks wie COSTAR und RCOF gemeinsam aufführen; Sie brauchen nicht jedes Mal alle sechs), 7 praxistaugliche Techniken (eine Rolle geben, ein Muster/few-shot zeigen, Schritt für Schritt schließen, das Ausgabeformat festlegen, mit Trennzeichen strukturieren, nicht zu viel auf einmal verlangen und iterieren — am stärksten ist das Iterieren), ein Vorher/Nachher-Beispiel, Techniken für Fortgeschrittene (Chain of Thought, Self-Consistency, Prompt Chaining, ReAct — wobei Reasoning-Modelle wie die o-Reihe und Claudes Extended Thinking CoT intern ausführen, sodass das Nennen des Ziels besser funktioniert), 7 häufige Fehler sowie modellspezifische Tipps und Eingabesicherheit. Mit internen Links zu Prompt-Tipps für die App-Entwicklung und zu Eingabe-Vorsichtsmaßnahmen. Aus vage wird konkret, aus Hinwerfen wird Dialog — jeder kann sich ab heute verbessern.

Was ist die technologische Singularität? Ein einsteigerfreundlicher Leitfaden — Mechanismus, Prognosen und der Unterschied zu AGI

Was ist die technologische Singularität? Ein einsteigerfreundlicher Leitfaden — Mechanismus, Prognosen und der Unterschied zu AGI

Im Juni 2025 schrieb Sam Altman von OpenAI in seinem Blog: „Wir haben den Ereignishorizont überschritten; der Takeoff hat begonnen" („The Gentle Singularity"). Andere Forscher hingegen weisen die Idee schlichtweg als etwas zurück, das nie eintreten wird. Dieser Einsteigerleitfaden erklärt, dass die Singularität (technologische Singularität) „der Kipppunkt ist, an dem die KI die menschliche Intelligenz übertrifft und beginnt, sich selbst zu verbessern, sodass der Fortschritt explosionsartig schnell wird und nicht mehr vorhergesagt oder kontrolliert werden kann" (eine Hypothese, Stand 2026 nicht verwirklicht). Er behandelt den Kern — die Intelligenzexplosion = rekursive Selbstverbesserung, bei der kluge KI noch klügere KI baut und der Verbessernde vom Menschen zur KI wechselt; wie sie sich von AGI und ASI unterscheidet (AGI/ASI sind „Zustände" der Intelligenz, die Singularität ist das „Ereignis" des Unvorhersehbarwerdens; AGI → Selbstverbesserung → der plötzliche Sprung zur ASI = die Singularität); die Geschichte des Begriffs (I. J. Goods „Intelligenzexplosion" von 1965 → Vinge macht den Namen 1993 populär → Kurzweil macht sie mit „2045" salonfähig); die weite Streuung der Prognosen (Kurzweil 2045, Altman „bereits begonnen", Vinge sowie Skeptiker wie Gary Marcus und die „Komplexitätsbremse" des verstorbenen Paul Allen); plötzlicher Hard Takeoff vs. allmählicher Soft Takeoff; die Hoffnungen (Durchbrüche bei Krankheiten und in der Wissenschaft) und Risiken (Kontrollverlust, das Alignment-Problem); die tiefe Skepsis (Komplexitätsbremse, physikalische Grenzen, etwas völlig anderes); und häufige Mythen wie „herrschende Roboter", „sofort, sobald AGI eintrifft" und „fest für 2045". Sie weder übermäßig zu fürchten noch zu sehr von ihr zu träumen — die KI von heute bestmöglich nutzen und dabei ruhig beobachten, was als Nächstes kommen mag.

KI und ihre Auswirkungen auf Anwälte, Wirtschaftsprüfer und Steuerberater: Was sich ändert, was bleibt

KI und ihre Auswirkungen auf Anwälte, Wirtschaftsprüfer und Steuerberater: Was sich ändert, was bleibt

2023 wurde ein Anwalt mit Sanktionen belegt, nachdem ein mit ChatGPT verfasster Schriftsatz ausschließlich von der KI erfundene Fälle zitierte — und dieser Vorfall verbreitete weltweit Misstrauen gegenüber Recht und KI. Doch binnen weniger Jahre explodierte die Nutzung, und über 90 % der Anwälte sollen KI in der täglichen Arbeit einsetzen. Als nächster Beitrag unserer Serie zu KI-Auswirkungen nach Branche nach #068 (Handel), #094 (Marketing) und #097 (Beratung) betrachtet dieser die freien Berufe. Der aktuelle Stand in Zahlen (62 % der Anwälte berichten 6–20 % wöchentliche Zeitersparnis; Harvey und CoCounsel von Thomson Reuters verarbeiteten im 1. Quartal 2026 über 10 Mio. Rechtsdokumente; generative KI bei Steuer-/Buchhaltungs-/Prüfungskanzleien stieg von 8 % 2024 auf 21 % 2025; eine Stanford-Studie zeigt einen Rückgang der Einsteigerstellen in Feldern wie dem Rechnungswesen um 13 % gegenüber 2022, Wirtschaftsprüfer +5 % und Buchhalter -5 %), welche Arbeit KI je Beruf verändert (Anwälte = Fallrecherche, Vertragsprüfung, Pflichtenextraktion; Wirtschaftsprüfer = Buchführung, Belegprüfung, Stichproben, Risikoidentifikation; Steuerberater = Dateneingabe, Entwürfe von Steuererklärungen, Gesetzesrecherche — KI erledigt die Vorarbeit, Menschen fällen die Entscheidung), die größte Falle der Halluzination (Erfinden nicht existierender Fälle/Gesetze — mit Sanktionen und Vertrauensverlust; Harvey wirbt mit 99,7 % geprüfter Zitatgenauigkeit und markiert den Rest, CoCounsel verankert Zitate in einer Falldatenbank und zitiert nur reale Fälle), der unveränderliche wesentliche Wert (endgültiges Urteil, professionelle Skepsis, Ethik, graue steuerliche Beurteilungen und — entscheidend — Unterschrift und rechtliche Haftung, die sich nicht an die KI delegieren lässt), die Einsteigerkrise (Automatisierung der Lehrjahre-Routine) und neue Rollen (KI-Compliance-Beauftragte, Steuer-Prompt-Engineers) sowie Ratschläge nach Rolle für Praktiker, Angehende und Mandanten (Zitate und Zahlen anhand der Primärquellen überprüfen; den Umgang mit Vertraulichkeit klären). Regulierung und Haftung unterscheiden sich von Land zu Land; in Japan sind KI-Funktionen in Buchhaltungssoftware ebenfalls verbreitet. Die Frage, die KI stellt: Ist das, was Sie verkaufen, die Arbeit oder das Urteil und die Verantwortung?

Was ist der Claude-Code-Befehl /loop? Nutzung, Polling und Scheduling im Vergleich

Was ist der Claude-Code-Befehl /loop? Nutzung, Polling und Scheduling im Vergleich

„Sag mir, wenn der Build fertig ist." „Wenn CI rot wird, behebe es." „Beobachte das Deployment alle 5 Minuten." Diese fesselnden Routinearbeiten vollständig an die KI abzugeben, ermöglicht der Befehl /loop, der Claude Code 2026 hinzugefügt wurde. Dieser Einsteiger-Leitfaden erklärt, dass /loop ein sitzungsgebundener Scheduler ist, der einen Prompt oder Slash-Befehl wiederholt in einem von dir (oder der KI) festgelegten Intervall ausführt, und behandelt dann die vier Anwendungsweisen (① /loop 5m X = festes cron-Intervall ② /loop X = Self-Pacing, bei dem die KI das Intervall beurteilt ③ /loop 15m = der integrierte Wartungs-Prompt ④ /loop = Auto-Wartung), wie man Intervalle schreibt (Zahl + Einheit s/m/h/d, Minimum 1 Minute, natürliche Sprache wie „every 2 hours", und du kannst einen Slash-Befehl in einer Schleife laufen lassen: /loop 20m /review-pr 1234), die Stärke des Self-Pacing (kürzere Wartezeiten bei Aktivität, längere bei Ruhe, zwischen 1 Minute und 1 Stunde, und — anders als schlichtes cron — beendet es die Schleife automatisch, sobald es die Aufgabe als erledigt beurteilt), praktische Rezepte (CI/Deployment beobachten, PR betreuen, lange Builds prüfen, Erinnerungen, Branch-Auto-Wartung), wie man es stoppt und die Vorsichtsmaßnahmen (Esc zum Stoppen, sitzungsgebunden, sodass eine neue Konversation es löscht, das Schließen des Terminals stoppt es, feste Intervalle dauern bis zu 7 Tage, max. 50 Aufgaben pro Sitzung, feuert zwischen Turns mit Jitter, lokale Zeitzone), wie man unter drei Scheduling-Funktionen wählt (/loop für In-Session-Überwachung, Desktop scheduled tasks für residente lokale Arbeit, Routines für unbeaufsichtigten Cloud-Betrieb) sowie loop.md-Anpassung plus Deaktivierung über CLAUDE_CODE_DISABLE_CRON=1 — alles basierend auf der offiziellen Dokumentation (Stand 2026). Was /loop verändert, ist die Zeitachse der Arbeit, die du an die KI abgeben kannst.

Untertitel und Transkripte aus Video/Audio mit KI erstellen

Untertitel und Transkripte aus Video/Audio mit KI erstellen

Ein einstündiges Video von Hand zu untertiteln, hat früher einen ganzen Tag verschlungen – zuhören, pausieren, tippen, den Timecode ausrichten. 2026 erledigt sich diese Hölle durch "das Video hineinwerfen und ein paar Minuten warten". Mit Fokus auf das Untertiteln/Transkribieren von Video- und Audioinhalten (Meeting-Protokolle gehen zu #086, Bild-OCR zu #091) behandelt dieser Leitfaden die vier Stufen, die KI automatisiert (Audio-Extraktion → Transkription mit Diarisierung → Timecoding in SRT/VTT → Übersetzung und Gestaltung), den Unterschied zwischen Untertiteln (SRT/VTT) und Transkripten und wann man was nutzt, einen Tool-Vergleich (kostenlos-und-privat Whisper, alles-bearbeiten Descript, hochgenau-mehrsprachig Sonix und Happy Scribe, einsteigerfreundlich Notta, mobil CapCut, am einfachsten YouTube-Auto-Untertitel – viele mit Spracherkennung der Whisper-Familie unter der Haube), den am besten wiederholbaren 4-Schritte-Workflow (vorbereiten → transkribieren → korrekturlesen → SRT/VTT exportieren/einbinden), Empfehlungen nach Einsatzzweck (YouTube, Podcasts, Vorlesungen, Interviews, vertraulich, mehrsprachig), sechs Genauigkeits-Tipps mit der Audioqualität als 80 % des Ergebnisses (Qualität, Spracheinstellung, Eigennamenliste, Suchen-und-Ersetzen, Diarisierung, Zeilenlänge), den Königsweg-Workflow für Mehrsprachigkeit (Ausgangssprache perfektionieren → per KI übersetzen → native Prüfung) und die Stolperfallen – Übervertrauen in die Genauigkeit, Schwäche bei Rauschen und Fachjargon, Urheberrecht, vertrauliche Uploads und Timecode-Drift. Bei sauberem Ton liegt die Genauigkeit bei 90–96 % (veröffentlicht, bedingungsabhängig) und die Arbeit sinkt um 80–90 %. Die Arbeit der KI; den Feinschliff – Eigennamen prüfen und durchsehen – dir.

Nach Kategorie durchsuchen

GitHub Copilot

Alle anzeigen

Midjourney

Alle anzeigen

Stable Diffusion

Alle anzeigen

Andere KI

Alle anzeigen

Einsteiger

Alle anzeigen

KI-Entwicklung & Programmierung

Alle anzeigen

Entwicklungsumgebung & Infra

Alle anzeigen

KI-Agenten & Automatisierung

Alle anzeigen

Arbeitseffizienz

Alle anzeigen

Schreiben

Alle anzeigen

Datenanalyse

Alle anzeigen

Lernen & Bildung

Alle anzeigen

Nebeneinkommen & Monetarisierung

Alle anzeigen

Spieleentwicklung

Alle anzeigen

Sicherheit & Governance

Alle anzeigen

KI-Risiken & Gesellschaft

Alle anzeigen