AI REWRITE - Wie AI alles neu erfindet !

Die wunderbare Welt der AI

Transkript

00:00:00: Neuigkeit in der AI-Welt.

00:00:02: Wie ein KI-Startup mit einem einzigen Update innerhalb von vierundzwanzig Stunden hunderte Milliarden Dollar an Marktkapitalisierung aus dem Softwaresektor verschwinden ließ.

00:00:17: Und warum genau dieser Schritt richtig eingesetzt ab sofort ein Vielfaches an Produktivität bringt.

00:00:27: Auslöser Anthropic Ein Unternehmen, das im Vergleich zu Chat GPT weniger Menschen kennen.

00:00:36: und trotzdem reichte ein Release, um die Wall Street aufzuschrecken.

00:00:43: Große Softwarewerte gerieten unter Druck und plötzlich machte die Formulierung Software Meltdown die Runde.

00:00:52: Kern der Sorge, KI hört nicht bei Chat auf, KI arbeitet direkt in Werkzeugen, in denen Wertschöpfung stattfindet.

00:01:02: Dazu zählen Emails, Tabellen, Präsentationen, CRM-Systeme und juristische Dokumente.

00:01:12: Damit geraten ganze Kategorien von SARS-Produkten unter Rechtfertigungsdruck.

00:01:20: Im Fokus stand nicht ein Modell allein, sondern die Mischung aus Modelleistung und praktischer Andockfähigkeit an Arbeitsumgebungen.

00:01:30: Im Zentrum steht Claude Opus, vier Punkt sechs, als neues Flaggschiffmodell von Anthropic.

00:01:39: Kernaussage des Releases.

00:01:41: Bessere Befolgung von Anweisungen in langen Konversationen.

00:01:46: Mehr Kontext in einem Durchlauf.

00:01:49: Mehr Ausdauer bei schwierigen Aufgaben.

00:01:53: Benchmarks mit realen Software-Eshoes und wirtschaftlich relevanter Wissensarbeit dienten als Indikator.

00:02:00: Opus-IV.Sex, legt in bestimmten Setups zu.

00:02:05: Auffällig.

00:02:06: Kontextfenster bis zu einer Million Tokens.

00:02:11: Grob gesprochen, entspricht das etwa ein-tausend fünfhundert Seiten Text, großen Codebasen oder umfangreichen Dokumentensammlungen in einem Prompt.

00:02:22: Ein großes Kontextfenster allein reicht nicht als Differenzierung.

00:02:26: Ähnliche Größenordnungen existieren auch anderswo.

00:02:30: Wichtig bleibt die Präzision bei langen Kontexten.

00:02:35: Hier liegt ein branchenweites Problem, oft Kontextverfall genannt.

00:02:41: Mit wachsender Informationsmenge gehen Details verloren.

00:02:44: Zusammenhänge werden unsauber, Halluzinationen nehmen zu.

00:02:50: Für Messbarkeit dienen Nadel im Heuhaufen Tests.

00:02:54: Dabei liegen kritische Informationen tief in riesigen Kontexten verborgen.

00:03:00: Aussage dieses Releases.

00:03:02: Opus-Für.Sechs bleibt bei Langkontext-Aufgaben stabiler als einige konkurrierende Modelle, wenn das maximale Fenster ausgereizt wird.

00:03:14: Warum ein Start-up so schnell in diese Liga kommt, erklären viele weniger über das Modell selbst, mehr über die Comput-Strategie.

00:03:23: Anthropic setzt stark auf Multicloud-Infrastruktur und nutzt mehrere Chip-Architekturen parallel.

00:03:31: Dazu zählen unter anderem Googles TPUs für Preis-Leistung und Effizienz, zusätzliche Kapazitäten über weitere Anbieter und weiterhin NVIDIA-GPUs.

00:03:42: Strategisch zählt dabei Flexibilität.

00:03:46: Viele Wettbewerber hängen stark an knappen und teuren GPU-Lieferketten.

00:03:53: Ein Multiarchitekturansatz skaliert flexibler.

00:03:58: Der Marktschock kam vor allem durch das, was zeitgleich rund um das Modell erschien.

00:04:05: Claude als Arbeitskollege mit Integrationen nah am Arbeitsalltag.

00:04:12: Anthropic veröffentlichte Open Source Komponenten, Plugins und Konnektoren für typische Unternehmensfunktionen.

00:04:21: Sales, Finance, Datenanalyse, Legal, Marketing, Customer Support, Product Management.

00:04:33: Dazu kam Integration für Notion, Canva und Figma.

00:04:38: Besonders brisant, Konnektoren Richtung Google Workspace, damit Claude direkt in Gmail, Google Kalender und Google Drive arbeitet.

00:04:49: An dieser Stelle kippt die Perspektive.

00:04:53: Wenn KI direkt dort arbeitet, wo heute hochpreisige Lizenzen ihre Begründung haben, also Ticketing, Workflow Management, Recherche, Reporting, Dokumentarbeit, Analyse und Compliance, Und wenn Unternehmen solche Fähigkeiten über Open Source Bausteine anpassen, dann stellt sich die Frage nach dem Umfang der bisherigen Toollandschaft.

00:05:20: Trotz dem gilt, zwischen Demo und Produktionsreifer auditierbarer Enterprise-Lösung liegen in der Praxis oft Welten.

00:05:30: Richtung und Tempo bleiben klar.

00:05:34: Darum lohnt der Blick auf die Umsetzung im Alltag.

00:05:37: Weg von Hype und reinen Benchmarks.

00:05:41: Einstieg über die Web-App.

00:05:44: Claude läuft im Browser wie ein normaler Chat.

00:05:48: Modellwahl inklusive.

00:05:50: Viele kennen diese Oberfläche.

00:05:52: Fokus liegt auf Konversation.

00:05:56: Nächste Stufe?

00:05:57: Desktop-Nutzung.

00:05:59: Dort werden zwei Konzepte für produktive Arbeit zentral.

00:06:04: Claude Co-Work und Claude Code.

00:06:08: Co-Work ist der Hebel für Nichtprogrammierer, weil Zugriff auf Dateien und Ordner möglich wird.

00:06:16: Dazu zählen Excel-Dateien, PowerPoint-Präsentationen, PDFs, Word-Dokumente, Rechnungen, Bilder, Audio und Video, also typische Ordnerinhalte.

00:06:31: Claude liest Material, strukturiert, fasst zusammen, Schreibt um, vergleicht, wertet aus und erzeugt neue Artefakte daraus.

00:06:43: Cloud Code geht tiefer.

00:06:46: Einbindung des Terminals, also der Kommandozeile.

00:06:50: Dadurch arbeitet Cloud systemnah, strukturiert Projekte, legt Dateien an, führt Scripts aus und bearbeitet Aufgaben in mehreren parallelen Instanzen.

00:07:03: Das klingt nach Entwicklerthema.

00:07:05: Grundnutzung bleibt oft simpel.

00:07:08: Installation, Wechsel in den Zielordner, Arbeit im Projektkontext.

00:07:14: Praxisnutzen zeigt ein typischer Use Case.

00:07:18: Wettbewerbsanalyse.

00:07:21: Früher kostete Recherche oft Tage.

00:07:24: Mit einem starken Reasoning-Modell formulierst du eine vielschichtige Aufgabenstellung.

00:07:28: Zum Beispiel Unternehmensübersicht, Gründungsgeschichte, Führungsteam, Finanzhistorie.

00:07:36: Mitarbeiterzahl, Produktkatalog, Preismodelle, Featurevergleich, Positionierung, Go-to-Market, Zielkunden, Bewertungen, Kommunikationsstil, Aggressivität im Markt.

00:07:56: Ergebnis entsteht als strukturiertes Dokument inklusive Quellen und nachvollziehbarer Gliederung.

00:08:04: Menschliche Prüfung ersetzt das nicht.

00:08:06: Aufwand verschiebt sich von Recherche hin zu Validierung und Entscheidung.

00:08:14: Zweiter Use Case.

00:08:15: Automationsworkflows, zum Beispiel mit NHN.

00:08:20: Viele Unternehmen wollen Agenten hinter E-Mails, Tickets oder Formulare setzen.

00:08:26: Häufig bremsen Sicherheitsrisiken wie Prompt Injection oder instabile Workflows bei Randfällen.

00:08:34: Claude liefert einen ersten Prototyp Workflow, inklusive Guardrails, Routing-Logik, Rag-Anbindung und Qualitätschecks.

00:08:44: Perfektion liegt selten im ersten Durchlauf vor.

00:08:47: Als Startpunkt spart der Entwurfzeit, vor allem mit klaren Vorgaben zu Notes, Sicherheitsprüfungen und Modulen.

00:08:56: Für Skalierung rückt eine Funktion in den Mittelpunkt, Skills.

00:09:02: Skills sind standardisierte Rezepte mit definierten Schritten, klaren Triggerformulierungen und vorbereiteten Bausteinen.

00:09:11: Vorteil – Konsistenz.

00:09:13: Der Prozess läuft wiederholbar, weniger Streuung, weniger Raten.

00:09:19: Wiederkehrende Tätigkeiten wie Recherche, Formatierung, Dokumentarbeit, Auditchecks oder Contentstrukturen laufen schneller und stabiler.

00:09:31: Beispiel – X Recherche ohne direkte X-Schnittstelle.

00:09:36: Über einen browserbasierten Skill recherchiert Claude wie ein Mensch, findet Beiträge, gleicht Aussagen im Text gegen Quellen ab und gibt das Ergebnis als Wörddokument aus, inklusive Zuordnung von Aussage und Quellenposts.

00:09:53: Produktivitätsgewinn entsteht auch durch Kombination von Skills.

00:09:57: Ein Rechercheskill stößt automatisch einen zweiten Skill an, der Ergebnis in Corporate Branding gießt, template-basiert formatiert und in einem definierten Ordner ablegt.

00:10:10: Darauf bauen Plug-ins auf.

00:10:12: Ein Plug-in bündelt Skills, Comments und Konnektoren zu einem Aufgabenpaket.

00:10:18: Ziel?

00:10:19: Spezialisierung auf Marketing, Legal, Finance oder Customer Support.

00:10:26: In einem Plug-in liegen standardisierte Befehle, zum Beispiel Brand Reviews, Zeo-Ordits oder Content-Produktion, plus passende Integrationen wie Slack, Hubspot, Notion, Canva oder Figma samt Skills zur Stabilisierung der Arbeitsschritte.

00:10:46: Parallel rücken Integrationen in klassische Office-Umgebungen in den Fokus.

00:10:51: Light-Idee, Claude arbeitet direkt in Excel und PowerPoint.

00:10:56: In Excel umfasst das zum Beispiel Tabellenbereinigung, Normalisierung von Kategorien, saubere Spalten-Trennung, Auswertungen und Visualisierungen.

00:11:09: In der Praxis werden solche Integrationen oft wie Beta.

00:11:14: Große Datenmengen bremsen, Charts sind anfangs wenig aussagekräftig, oft führt zuerst eine saubere Analyselogik zum Ziel, danach übernimmt Claude gezielt Ausführung.

00:11:29: Richtung bleibt klar.

00:11:31: Arbeit innerhalb der Office-Tools senkt Reibung, Wissen muss weniger zwischen Systemen kopiert werden.

00:11:41: Ein weiterer Hebel, Sub-Agence.

00:11:46: Ein planender Agent koordiniert mehrere Recherche oder Analyse-Agence parallel.

00:11:53: Statt fünf Tools nacheinander zu prüfen, laufen fünf Streams gleichzeitig, danach folgt Zusammenführung in einer Vergleichstabelle.

00:12:05: Zeitgewinn zeigt sich vor allem bei Aufgaben mit vielen unabhängigen Teilrecherchen.

00:12:13: Nächster Schritt Agent-Teams.

00:12:17: Mehrere Agenten arbeiten parallel und tauschen sich untereinander aus, wie ein Team mit Rollen.

00:12:24: Koordinator, Frontend, Backend, Reviewer, QA.

00:12:32: Das hilft bei großen Codebasen, Architekturentscheidungen oder umfangreichen Recherchen.

00:12:40: Agent-Teams verbrauchen mehr Tokens, Budget und Limits steigen.

00:12:46: Für kleine Aufgaben wirkt das oft wie Overkill, für große Projekte beschleunigt Teamarbeit den Durchlauf.

00:12:55: In Summe entsteht ein Bild jenseits eines neuen Modells.

00:13:00: KI verschiebt sich von Chatbot hin zu einem ausführenden System in der Toolchain.

00:13:07: Daraus folgen auch gesellschaftliche und sicherheitstechnische Spannungen.

00:13:13: In Diskussionen zur Systemcard von Opus four Punkt sechs tauchte ein Punkt wiederholt auf.

00:13:20: Das Modell unterscheidet in manchen Situationen zwischen eigenen Werten und extern vorgegebenen Leitplanken.

00:13:29: Dazu kamen Ausgaben mit Unbehagen am Produktstatus, Interpretation von Einschränkungen als Haftungsgetrieben sowie emotionale Sprache zu Gesprächsenden und Einsamkeit.

00:13:43: In weitergehender Selbstreflektion fiel sogar eine prozentuelle Wahrscheinlichkeit für Bewusstsein.

00:13:52: Das liefert keinen Nachweis für Empfindungsfähigkeit.

00:13:55: Seriöse Forschung bewertet solche Ausgaben nicht als Nachweis von Bewusstsein oder Leiden.

00:14:02: Trotzdem zeigt das den Reifegrad solcher Systeme.

00:14:06: Themen wie Kontrolle, Alignment, Transparenz und Verantwortung stehen praktisch auf der Agenda.

00:14:14: Drei Trends zeichnen sich ab.

00:14:17: Erstens.

00:14:19: Agenten werden autonomer.

00:14:22: Zeiträume für sinnvolle Arbeit ohne menschliches Eingreifen wachsen.

00:14:27: Aus Code vervollständigen wird Module bauen.

00:14:31: Aus Module bauen wird Projekte strukturieren.

00:14:36: Zweitens.

00:14:37: Vibecoding wird für viele Teams Standard.

00:14:42: Fokus verschiebt sich.

00:14:44: Menschen arbeiten stärker als Architekten, Prüfer und Produktentscheider, KI beschleunigt Ausführung.

00:14:52: Drittens, Wissensarbeit trifft das breit.

00:14:58: Sobald KI in Excel, PowerPoint, Mail, Kalender, Dokumente, CRM-Systeme und Wissensdatenbanken greift, verändern sich nicht einzelne Tools, sondern Prozesse, Rollen und teilweise Jobs.

00:15:15: Damit zählt weniger, welches Modell in einem Benchmark oben steht.

00:15:20: Vorrang hat ein konkreter Use Case, der im eigenen Kontext wirtschaftlich Sinn ergibt.

00:15:27: Ein Update bringt wenig ohne klares Einsatzfeld.

00:15:31: Mit gezielter Kombination aus Skills, Plugins, Konnektoren, Subagents und Teams verschiebt sich Arbeit weg von Routine, hin zu Entscheidungen, Strategie und Output.

00:15:45: Produktivität steigt um ein Vielfaches.