AI REWRITE - Wie AI alles neu erfindet !

Die wunderbare Welt der AI

Transkript

00:00:00: Willkommen zu einer neuen Ausgabe unseres Podcasts, in dem wir die wichtigsten Entwicklungen aus der Welt der künstlichen Intelligenz beleuchten.

00:00:08: Das Jahr twenty-fünfundzwanzig fühlt sich an wie der Morgen nach einer wilden Party.

00:00:14: Der erste Rausch der generativen KI ist verflogen und jetzt, bei Tageslicht, sehen wir das Chaos, das sie hinterlassen hat.

00:00:22: Überall liegt digitaler Müll herum, der sogenannte AI-Slop.

00:00:27: minderwertige, seelenlose Inhalte, die unsere digitalen Räume überfluten.

00:00:33: In Hollywood kämpfen Studios nicht mehr nur um die besten Drehbücher, sondern vor Gericht gegen ihre eigenen, unlizenzierten KI-Kopien.

00:00:42: Und in der Finanzwelt ertrinken Ermittler in einer Flut nutzloser, maschinellerzeugter Verdachtsmeldungen.

00:00:49: Die große Frage, die sich nun stellt, ist, war das alles?

00:00:53: Ist dieser Zustand des kreativen und qualitativen Durcheinanders die neue Normalität?

00:00:59: Oder erleben wir gerade den schmerzhaften, aber notwendigen Wendepunkt zu einer wirklich intelligenten Technologie?

00:01:07: Der erste Schauplatz dieser Ernüchterung ist Hollywood.

00:01:10: Große Studios wie Disney, Netflix und Universal Pictures investierten massiv in künstliche Intelligenz, in der Hoffnung auf eine Revolution in der Filmproduktion.

00:01:21: Doch statt filmischer Meilensteine brachte das Jahr vor allem eines.

00:01:27: Endlose juristische Auseinandersetzungen.

00:01:30: Die Branchenriesen führen massive Urheberrechtsklagen gegen Bildgeneratoren wie Mid Journey.

00:01:36: Der Vorwurf?

00:01:37: Systematischer Diebstahl.

00:01:40: Die KI wurde mit geschütztem Filmmaterial trainiert und spuckt nun unlizenzierte Versionen von Kultfiguren wie Spider-Man oder Darth Vader aus.

00:01:50: Diese Klagen binden enorme Ressourcen und bremsen die eigentliche Innovationen aus.

00:01:56: Doch das Problem ist nicht nur juristischer Natur.

00:01:59: Was die Technologie bisher liefert, enttäuscht auf ganzer Linie.

00:02:03: Kritiker bezeichnen die Flut generisch wirkender Sequenzen als SLOP, algorithmisch erzeugter Inhalt ohne künstlerischen Wert.

00:02:12: Ein besonders groteskes Beispiel lieferte ein Werbespot der Fast-Food-Kette McDonalds, dessen KI-Figuren beim Publikum heftige negative Reaktionen auslösten und dem Ruf der Marke schadeten.

00:02:26: Während einzelne Prestigeprojekte wie der entkannengezeigte Film Critters versuchen, KI als Kunstform zu etablieren, wächst in der Branche die Skepsis.

00:02:37: Das Vertrauen ist spürbar gesunken und viele Studios flüchten sich in eine Nostalgiewelle mit klassischen Erzählstrukturen, um das Publikum bei Laune zu halten.

00:02:47: Dieses Muster der fehlgeleiteten Automatisierung wiederholt sich erschreckend ähnlich im Finanzsektor.

00:02:54: Die australische Finanzaufsicht Austrak schlägt Alarm.

00:02:58: Banken setzen im großen Stil auf KI, um bei der Geldwäsche Bekämpfung Kosten zu sparen.

00:03:04: Doch das Ergebnis ist eine Katastrophe.

00:03:07: Die Algorithmen sind darauf getrimmt, lieber zu viel als zu wenig zu melden, um regulatorische Strafen zu vermeiden.

00:03:15: Dieser Over-Reporting-Effekt führt dazu, dass die Behörden mit einer Welle an oberflächlichen und irrelevanten Daten überschwemmt werden.

00:03:24: Die Suche nach echten kriminellen Mustern wird dadurch massiv erschwert.

00:03:28: Die Technologie, die eigentlich helfen sollte, wird zum Hindernis.

00:03:34: Fälle wie die der Bendigo Bank, die mit einer Strafe von fünfzig Millionen Dollar konfrontiert wurde, zeigen, eine reine Flucht in die Automatisierung ohne menschliches Urteilsvermögen führt nicht zu Effizienz, sondern zu teuren Fehlern.

00:03:50: Die Konsequenzen dieser Entwicklung spüren wir alle.

00:03:53: Auf YouTube werden reichweitenstarke Kanäle wie Screen Culture und KH Studio gesperrt, weil sie mit täuschend echten, aber komplett gefälschten KI-Filmträlern ein Millionenpublikum getäuscht haben.

00:04:06: Und während die Plattformen versuchen, die Flut an minderwertigen Inhalten einzudämmen, eskaliert das Problem an anderer Stelle.

00:04:15: Sicherheitsfilter führender KI-Systeme von Google und OpenAI werden systematisch umgangen.

00:04:22: Mit einfachen Befehlen, sogenannten Jailbreaks, erstellen Nutzer täuschend echte Bikini-Deep-Fakes aus Alltagsfotos von Frauen.

00:04:31: Die Qualität dieser Fälschungen hat ein Niveau erreicht, das eine manuelle Erkennung fast unmöglich macht.

00:04:38: Es ist eine neue, perfide Stufe digitaler Belästigung, die den politischen Druck auf die Tech-Konzerne massiv erhöht.

00:04:46: Selbst die Vision eines autonomen KI-Assistenten, der für uns im Internet Aufgaben erledigt, bekommt Risse.

00:04:54: OpenAI räumt offiziell ein, dass ihr KI-Browser Atlas womöglich niemals vollständig sicher sein wird.

00:05:02: Das Kernproblem sind sogenannte Prompt Injections.

00:05:07: Versteckte Befehle auf Webseiten, die den KI-Agenten unbemerkt manipulieren können.

00:05:13: So könnte die KI statt einer harmlosen Zusammenfassung private E-Mails auslesen oder Transaktionen durchführen.

00:05:21: Diese fundamentale Schwachstelle stellt die Vision des Agentic-Web, in dem KI eigenständig und sicher für uns handelt, massiv in Frage.

00:05:32: Die Nutzer spüren diese Unsicherheit.

00:05:35: Als Mozilla Pläne bekannt gab, Firefox zu einem KI-Browser umzugestalten, war der Aufschrei in der Community so laut, dass das Unternehmen zurück rudern musste.

00:05:46: Anfang Jahrzehnte wird Firefox nun einen zentralen Kill-Switch bekommen.

00:05:52: einen Notausschalter, der alle KI-Funktionen auf einen Klick deaktiviert.

00:05:57: Ein klares Signal, dass viele Nutzer die Kontrolle behalten wollen.

00:06:02: Und genau an diesem Punkt, an dem die Frustration über die erste KI-Welle ihren Höhepunkt erreicht, erleben wir den entscheidenden Wendepunkt.

00:06:11: Er kommt in Form einer radikalen Neubewertung dessen, was Intelligenz überhaupt bedeutet.

00:06:17: Sam Altman, der CEO von OpenAI, lieferte im Big Technology Podcast Zahlen, die das menschliche Vorstellungsvermögen sprengen.

00:06:28: Während ein Mensch pro Tag etwa zwanzigtausend Informationseinheiten, sogenannte Tokens, verarbeitet, operieren moderne KI-Systeme mit zehn Billionen Tokens.

00:06:40: Täglich.

00:06:42: Dieser Unterschied ist nicht mehr nur quantitativ, er ist ein qualitativer Sprung.

00:06:48: Die KI entwickelt eine eigene Art der Informationssyntese.

00:06:51: Oldman deutet sogar an, dass die artificial general intelligence, also die dem Menschen überlegene KI, vielleicht längst da ist.

00:07:00: Nicht als ein allwissender Supercomputer, sondern als ein schleichender Prozess der Überlegenheit in unzähligen spezifischen Sektoren.

00:07:08: Das neue Modell, GPT-Fünf-Punk-Zwei, übertrifft menschliche Experten bereits bei vierundsebzig Prozent aller Aufgaben im Bereich der Wissensarbeit.

00:07:18: Gleichzeitig ertönt aus einer anderen Ecke der Branche eine noch radikalere Aussage.

00:07:23: Jan Le Kuen, einer der Väter des modernen Deep Learning, verlässt nach zwölf Jahren Meter, um in Paris sein eigenes Start-up zu gründen.

00:07:32: Seine Begründung ist ein Paukenschlag.

00:07:35: Er bezeichnet die heutigen großen Sprachmodelle wie Chat GPT als technologische Sackgasse.

00:07:41: Sie berechnen nur die Wahrscheinlichkeit des nächsten Wortes, ohne die Welt wirklich zu verstehen.

00:07:47: Hier liegt der Schlüssel zur Lösung.

00:07:50: Die Ära der reinen Textgeneratoren, der digitalen Papageien, die uns mit Slop überschwemmen, neigt sich dem Ende zu.

00:07:58: Eine neue Generation von Algorithmen betritt die Bühne, sogenannte World-Models, zu Deutsch Weltmodelle.

00:08:06: Diese Systeme lernen nicht mehr nur Sprachmuster, sie bauen interne Simulationen der physischen Welt auf.

00:08:13: Sie beginnen, physikalische Gesetze, Ursache und Wirkung zu verstehen.

00:08:18: Nvidia treibt diese Entwicklung mit seinem Modell Cosmos voran, das speziell für Physical AI entwickelt wurde.

00:08:25: Künstliche Intelligenz, die mit der echten Welt interagiert.

00:08:30: Während ChatGPT einen Text schreibt, berechnet Cosmos, wie ein Objekt fällt oder gleitet.

00:08:36: Auch Meter und Google ziehen mit.

00:08:39: Meta entwickelt mit V-Jepa ein System, das nicht einfach fehlende Pixel in einem Video ergänzt, sondern logisch vorhersagt, was im verdeckten Bereich passieren muss.

00:08:50: Google demonstriert mit Genie, wie aus einfachen Videos interaktive, spielbare Welten entstehen.

00:08:57: Und Jan Le Kyns neues Start-up AMI Labs in Paris wird sich voll und ganz auf diese Weltmodelle konzentrieren, um eine autonome Intelligenz für Robotik und Transportwesen zu schaffen.

00:09:09: Selbst Metas Neue für im Jahr- und Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt- Jahrzehnt-.

00:09:33: Alibaba hat mit Quen Image Layered ein Modell veröffentlicht, das Bilder direkt in Ebenen generiert, wie in einer professionellen Grafik-Software.

00:09:43: Plötzlich sind KI-Bilder nicht mehr statisch, sondern präzise und verlustfrei editierbar.

00:09:49: Google führt mit A to UI einen offenen Standard ein, der es KI-Agenten erlaubt, direkt in Apps passende und sichere Benutzeroberflächen zu erzeugen.

00:09:59: Statt nur Text zu senden, gestalten sie die Software aktiv mit.

00:10:04: Und OpenAI rüstet ChatGPT mit Skills aus, um direkt mit externen Anwendungen zu interagieren und Aufgaben auszuführen.

00:10:12: Parallel zu dieser technologischen Neuausrichtung, wächst das Bewusstsein für Sicherheit und Kontrolle.

00:10:19: Anthropic veröffentlicht mit Bloom ein Open Source Framework, bei dem eine KI die Ausgaben einer anderen KI bewertet und auf subtile Risiken wie Machtstreben oder Anbiederung prüft.

00:10:32: OpenAI führt eine automatisierte Alterserkennung für Jugendliche ein, blockiert für sie gefährliche Inhalte und verweist bei psychischen Krisen direkt an professionelle Hilfe.

00:10:44: Die Branche reagiert auf dem politischen Brück und die Fehler der Vergangenheit.

00:10:49: Selbst die Hardware, das Fundament von allem, erlebt eine Revolution.

00:10:54: Der Kampf zwischen den Giganten wie Nvidia und Google um die schnellsten Chips für KI Anwendungen spitzt sich zu.

00:11:02: Nvidia lizenziert für zwanzig Milliarden Dollar die Technologie des Start-ups GROC und kauft gleich das gesamte Führungsteam ein, um im Rennen zu bleiben.

00:11:12: Und am Horizont erscheint eine fast unheimliche Alternative.

00:11:17: Die ersten kommerziell verfügbaren Biocomputer.

00:11:21: Sie nutzen gezüchtete menschliche Hirnzellen zur Datenverarbeitung, verbrauchen bis zu einer Million mal weniger Energie als Siliziumchips und werfen gleichzeitig Fundamentale ethische Fragen auf.

00:11:35: Was bedeutet das alles für uns?

00:11:38: Wir verlassen die chaotische, laute Anfangsphase der generativen KI.

00:11:43: Der Fokus verschiebt sich weg von viralen Chatfeatures hin zu Zuverlässigkeit, Sicherheit und echtem Verständnis.

00:11:52: Die Technologie wird erwachsen.

00:11:54: Sie bekommt ein Gespür für die physische Welt, was den Weg für den nächsten großen Durchbruch ebnet.

00:12:00: Die Robotik.

00:12:02: In einer alternden Gesellschaft wird der Einsatz von Assistenzrobotern in Pflege und Haushalt unumgänglich, um unseren Lebensstandard zu halten.

00:12:12: Die neuen Weltmodelle sind der Schlüssel, um diesen Robotern ein intuitives Verständnis für ihre Umgebung zu geben.

00:12:20: Die Reise der künstlichen Intelligenz hat gerade erst begonnen.

00:12:24: Der erste Goldrausch ist vorbei.

00:12:26: Und nun beginnt die harte Arbeit aus dem wilden Experiment eine stabile, nützliche und sichere Infrastruktur für unsere Zukunft zu bauen.

00:12:36: Die Ära der KI, die nur redet, weicht einer KI, die versteht, handelt und uns in der physischen Welt zur Seite steht.

00:12:46: Wie wir diesen Übergang gestalten, welche Grenzen wir setzen und welchen Nutzen wir daraus ziehen, liegt letztendlich in unserer Hand.

00:12:55: Vielen Dank fürs Zuhören.