AI REWRITE - Wie AI alles neu erfindet !

Die wunderbare Welt der AI

Transkript

Zurück zur Episode

00:00:00: Willkommen zur Neuigkeit in der AI-Welt.

00:00:02: In dieser Woche treten mehrere Trends gleichzeitig auf, die in der Praxis wichtig sind.

00:00:07: Humanoide Roboter werden geschickter.

00:00:10: Desktop-Agenten erreichen Alltagstauglichkeit.

00:00:13: Übersetzung verlagert sich durch offene Modelle stärker in lokale Setups.

00:00:18: Parallel verändert sich die Verteilung von Macht bei Compute, Standards und Talent.

00:00:24: Humanoide Roboter.

00:00:25: Aus China kommt das Start-up Matrix Robotics.

00:00:28: Das Team zeigt den dritten Prototypen mit dem Namen Matrix III.

00:00:33: Das Unternehmen setzt drei Schwerpunkte.

00:00:36: Eine gewebte biomimetische Haut.

00:00:39: Hochauflösende taktile Sensorik an den Fingerspitzen.

00:00:42: Hohe Fingerfertigkeit durch eine Hand mit siebenundzwanzig Freiheitsgraden.

00:00:47: Wenn Spezifikationen und Demos stabil bleiben, bringt das die Manipulation nach vorn.

00:00:53: In vielen Alltagsaufgaben blockiert die Hand nicht der Rest des Körpers.

00:00:58: Parallel adressiert ein X einen weiteren Engpass Training und Lernen in der Breite.

00:01:03: Ein X kündigt ein neues Weltmodell für den humanoiden Roboter Neo an.

00:01:08: Der Fokus verschiebt sich weg von starkem menschlichem Fernsteuern hin zum Lernen aus eigenen Roboter-Videos.

00:01:15: Die Idee dahinter, statt Aufgaben über vorgeführte und gelabelte Sequenzen zu verdrahten, Antizipiert ein Weltmodell mögliche Zukunftsabläufe in der Szene und führt Handlungen allgemeiner aus.

00:01:28: Ein X-Plant fernsteuern weiterhin für frühe Phasen.

00:01:31: Der Anspruch lautet, Lernen skaliert mit der Anzahl der Roboter, nicht mit der Anzahl menschlicher Operatoren.

00:01:46: Anthropic bringt Claude Cowork als Research Preview.

00:01:49: Cowork läuft auf MacOS und richtet sich an Nichtentwickler.

00:01:53: Du gibst Claude Zugriff auf ausgewählte Ordner, der Agent sortiert Dateien, extrahiert Inhalte aus Screenshots, entwirft Reports und führt webbasierte Schritte aus.

00:02:04: Anthropic beschreibt Risiken wie unklare Anweisungen, versehentliches Löschen und Prompt-Injection-Angriffe.

00:02:11: Für den Staat eignen sich klar abgegrenzte Arbeitsordner mit Kopien wichtiger Daten.

00:02:16: Zur Entstehung gibt es Berichte über eine kurze Entwicklungszeit.

00:02:20: Co-Work wirkt wie eine benutzerfreundliche Oberfläche auf Basis der Claude Code-Welt.

00:02:25: Damit entsteht Agentenproduktivität für Menschen ohne Kommandozeile und Entwicklerworkflows.

00:02:32: Die Interaktion wird so einfach, dass mehr Menschen solche Agenten im Alltag einsetzen.

00:02:38: In der Praxis passen Aufgaben, die aus vielen Teilschritten bestehen und am Ende gut prüfbare Ergebnisse liefern, zum Beispiel Ordner konsolidieren.

00:02:48: CSV-Dateien zusammenführen.

00:02:51: Wiederkehrende Buchhaltungs- oder Aboauswertungen als Dashboard aufbereiten.

00:02:55: Aus vorhandenen Informationen ein strukturiertes Dokument wie ein Mediakit formen.

00:03:01: Bei solchen Büroaufgaben mit vielen Klicks spielt ein Agent Stärke aus.

00:03:06: Kontrolle bleibt wichtig, weil Faktenfehler und falsche Links weiter auftreten.

00:03:11: Übersetzung und offene Modelle.

00:03:14: Bei Übersetzung laufen zwei Bewegungen parallel.

00:03:16: OpenAI baut Übersetzen als eigene Oberfläche aus.

00:03:21: Translate with ChatGPT positioniert Übersetzung als eigenen Modus.

00:03:26: Dazu gehören Tonalitätsvarianten und Input über Text, Sprache oder Bilder.

00:03:33: Google bringt mit Translate Gemma eine Familie offener Übersetzungsmodelle auf Basis von Gemma III.

00:03:41: Varianten umfassen vier B, zwölf B und siebenundzwanzig B-Parameter mit Fokus auf fünfundfünfzig Sprachen.

00:03:50: Der zentrale Punkt liegt in der Lokalität.

00:03:54: Übersetzung läuft je nach Setup eher on-device oder in kontrollierten Umgebungen.

00:04:01: Das hilft Branchen mit starken Compliance-Anforderungen.

00:04:05: Der Kontext entscheidet bei Übersetzung oft über Qualität.

00:04:10: Das zeigt der Begriff Jagged Technological Frontier.

00:04:14: Gemeint ist eine Grenze, bei der KI in manchen Aufgaben stark wirkt und in anderen Aufgaben schwach, mit abrupten Wechseln je nach Aufgabentyp.

00:04:25: Genau darum scheitern klassische Übersetzungen häufig an Fachbegriffen oder konzeptuellen Labels ohne Kontext.

00:04:34: Eine Harvard-BCG-Studie machte den Begriff prominent.

00:04:39: Kontext wird auch bei Assistenten zum Kernprodukt.

00:04:43: OpenAI baut Memory und Steuerung dazu aus.

00:04:48: Dazu gehört die Option, ob ChatGPT gespeicherte Erinnerungen oder die Chat-Historie als Kontext einbezieht.

00:04:57: Ziel sind weniger Wiederholungen und mehr Kontinuität mit Schaltern zur Kontrolle.

00:05:04: Standards für Agenten-Ökosysteme.

00:05:07: Standardisierung nimmt zu.

00:05:09: Google bringt im Umfeld der NRF das Universal Commerce Protocol.

00:05:15: Der offene Standard verbindet Agenten- und Handelssysteme über die gesamte Journey.

00:05:21: von Discovery über Kauf bis Postpurchase.

00:05:25: Das betrifft eCommerce, weil neben einem neuen Kanal auch ein neues Protokoll entsteht, an das Plattformen andocken.

00:05:33: Parallel entsteht Open Responses als offene Spezifikation für interoperable LLM-Interfaces.

00:05:42: Open Responses orientiert sich an der OpenAI Responses API und zielt als Community-Projekt auf Portabilität zwischen Providern.

00:05:52: Compute, Latents und Plattformverschiebungen.

00:05:56: Im Wettbewerb rücken Inferenzgeschwindigkeit und Compute-Verfügbarkeit in den Vordergrund.

00:06:03: OpenAI kündigt eine Partnerschaft mit Cerebras an.

00:06:08: Geplant sind siebenhundertfünfzig Megawatt Ultralow Latency Compute schrittweise bis zweitausend achtundzwanzig in den Inferenzsteg integriert.

00:06:19: Der Fokus liegt auf Latents, weil Real-Time Antworten, natürliche Interaktion und Agenten Workflows stark davon abhängen.

00:06:30: Auf Plattformseite setzt Apple ein Signal.

00:06:34: Apple bestätigt, Google Gemini treibt die nächste Generation von Siri und weitere Apple Intelligence Funktionen mit an.

00:06:42: Damit wird ein offizieller Kurs sichtbar und große Ökosysteme sortieren sich neu.

00:06:49: Deutschland und europäische Anbieter.

00:06:52: Auch in Deutschland gibt es Bewegung.

00:06:55: Beim Heidelberger KI-Unternehmen Aleph Alfa berichtet das Handelsblatt im Herbst, twenty-fünfundzwanzig.

00:07:03: Gründer Jonas Androulis gibt den CEO-Posten mit sofortiger Wirkung ab.

00:07:09: Vorgesehen war ein Wechsel in den Beirat zum ersten Januar, zwei-tausendsechsundzwanzig, während operative Verantwortung neu verteilt wird.

00:07:19: Das zeigt Veränderungen bei Governance und Go-to-Market-Ausrichtung europäischer KI-Anbieter.

00:07:26: BCI und Forschung Brain-Computer-Interfaces rücken wieder stärker in den Fokus.

00:07:34: OpenAI macht öffentlich, OpenAI beteiligt sich an der Siehtrunde von Merch Labs.

00:07:43: Merch Labs beschreibt langfristige Forschung zu neuen, sicheren und weniger invasiven BCI-Methoden.

00:07:53: OpenAI betont die Rolle von KI beim Interpretieren von Intentionen unter stark verrauschten Signalen.

00:08:03: Talent und Organisation.

00:08:06: Beim Thema Talent steigt die Volatilität.

00:08:10: Laut Wired verlassen zwei Mitgründer von Mira Muratis Startup, Thinking Machines Lab, das Unternehmen und gehen zurück zu OpenAI.

00:08:23: Ein weiterer Mitarbeiter folgt.

00:08:26: Solche Wechsel zeigen den Wettbewerb um wenige Spitzenprofile und die Unsicherheit junger Labs ohne etabliertes Produkt.

00:08:36: Meter und VR.

00:08:38: Meter reduziert den Metaverse-orientierten Work-Ansatz weiter und stellt Horizon Workrooms ein.

00:08:47: Das Abschaltdatum liegt am sechzehnten Februar.

00:08:54: Parallel berichten Quellen über Stellenstreichungen rund um Reality Labs und über geschlossene Studios.

00:09:03: Der Fokus verschiebt sich in Richtung Wearables und KI-gestützte Brillen.

00:09:10: In Summe zeigt die Woche ein klares Muster.

00:09:14: Modelle werden intelligenter und kommen als Produkte in den Alltag.

00:09:19: Als Agenten mit Zugriff als Standards mit Ökosystemeffekt und als Hardware-Deals die Latents zur Kernmetrik machen.

00:09:30: Für die Praxis zählt der kontrollierte Einsatz der Zeitspart und Risiken in Abläufen begrenzt.