AI REWRITE - Wie AI alles neu erfindet !

Die wunderbare Welt der AI

Transkript

Zurück zur Episode

00:00:00: Neuigkeit in der AI-Welt.

00:00:02: Persönliche KI-Assistenten, in den Sieben im Jahr im Jahr im Jahr ist, sehen so aus.

00:00:08: Cloudbot ist keine abgeschlossene App mit festen Funktionen.

00:00:12: Du bekommst einen lokal laufenden, erweiterbaren Agenten.

00:00:16: Du steuerst ihn über Chat-Apps, die du ohnehin täglich verwendest.

00:00:20: Open Source

00:00:22: Im Kern stecken zwei Ebenen drin.

00:00:24: Ein LLM-gestützter Agent auf deinem Rechner, mit Wahl zwischen verschiedenen Modellen, Ein Gateway für den Zugriff über Messenger wie Telegram, WhatsApp, iMessage, Slack und weitere Kanäle.

00:00:38: Der wichtigste Unterschied zu klassischen Chatbots liegt im lokalen Design mit Nähe zum Dateisystem.

00:00:44: Einstellungen, Anweisungen, Erinnerungen und Skills liegen als Ordnerstruktur und Markdown-Dateien in deinem Workspace.

00:00:53: Du siehst alles,

00:00:54: du versionierst alles, du enderst gezielt.

00:00:58: Weil der Agent auf deinem System läuft, greifen Skills mit passenden Rechten auf Shell und Dateisystem zu.

00:01:05: Der Agent generiert Skripte, führt

00:01:07: Skripte aus, installiert

00:01:09: neue Skills und bindet externe Integrationen

00:01:12: an.

00:01:13: Diese Mischung aus Persistenz,

00:01:15: lokaler

00:01:15: Kontrolle und Werkzeugzugriff

00:01:17: macht aus Chat

00:01:18: ein personalisierbares Arbeitswerkzeug.

00:01:22: In der Praxis installierst du nicht für jede Aufgabe eine neue App.

00:01:25: Der Agent orchestriert vorhandene Dienste und Geräte, zum Beispiel Notion, Todoist, Email, Musiksteuerung oder Smart Home.

00:01:35: Cloudbot ist auf Nachrüsten ausgelegt, über Community Skills oder über Skills, die der Agent selbst baut.

00:01:43: Für Sicherheit unterstützt das System Absicherung je nach Szenario, zum Beispiel Sandboxing pro Session oder pro Kanal, damit nicht jede Konversation automatisch volle Systemrechte erhält.

00:01:56: Zwei Themen machen das besonders greifbar.

00:01:58: Medien und Automationen.

00:02:01: Medien.

00:02:03: Ein Cloudbot-Setup nimmt Sprachnachrichten an, transkribiert und gibt Antworten wieder als Audio aus.

00:02:10: In den offiziellen Unterlagen steht ein kontinuierlicher Talkmode.

00:02:14: Sprache wird erfasst, an das Modell gesendet, die Antwort geht danach per Eleven Labs Streaming Text-to-Speech raus.

00:02:22: Als Standard steht dort das Modell Eleven V-III.

00:02:26: Für visuelle Ausgaben bindest du Bildgeneratoren an.

00:02:30: Im beschriebenen Szenario läuft dafür Google's Nano-Banana Pro, ein Bild- und Editing-Modell auf Basis von Gemini III Pro.

00:02:39: Versprochen werden bessere Text-Rendering-Fähigkeiten, höhere Auflösungen und webbasiertes Grounding für Infografiken.

00:02:47: Damit erzeugt ein Assistent neben Profilbildern auch strukturierte Darstellungen wie Übersichten oder Diagramme.

00:02:54: Auch bei nicht perfektem Stil zeigt der Ansatz den Schritt hin zu Assistenten, die eigene Arbeit dokumentieren und erklären.

00:03:03: Automationen.

00:03:05: Durch Chromejobs und lokale Scripting baust du typische Cloud-Automationen lokal nach.

00:03:11: Beispiele.

00:03:12: RSS-Prüfen, Nummern hochzählen, per API-Aufgaben oder Projekte anlegen.

00:03:19: Dafür fällt kein zusätzlicher Abo-Dienst an.

00:03:22: Das ändert Komfort- und Kostenstruktur.

00:03:25: weil Logik zwischen Webdiensten nicht über Drittplattformen laufen muss.

00:03:29: Aus dieser Sicht ist Cloudbot ein Hinweis auf eine breitere Entwicklung.

00:03:33: KI-Modelle werden zunehmend als Agenten mit Werkzeugen,

00:03:37: Datei-System,

00:03:38: Browser und langer Laufzeit eingesetzt.

00:03:42: Anthropic positioniert Cloudopus-Für.Fünf als Modell für Coding, Agents und Computer-Use mit großem Kontextfenster und Fokus auf agentische Workflows.

00:03:56: Parallel rückt ein anderes Thema in den Fokus.

00:04:00: Die Lücke liegt oft weniger bei Modellfähigkeiten, mehr bei Alltagstauglichkeit.

00:04:06: OpenAI beschreibt diese Differenz als Capability Overhang, also den Abstand zwischen dem, was heutige Systeme bereits leisten und dem, was Menschen und Organisationen produktiv abrufen.

00:04:22: Für für für für für für für für für für für für für für für für für für für für für für für für für für für für für für für für.

00:04:49: Gerade kleine Helfer-Apps verlieren an Bedeutung, wenn ein flexibler Agent exakt zu deinem Workflow passt.

00:04:57: Parallel wächst das Risiko, weil ein Assistent mit Shell-Zugriff auch gefährliche Rechte mitbringt.

00:05:05: Berechtigungsmodelle, Sandboxing und Sicherheitsleitplanken werden damit zur Voraussetzung.