In den letzten Wochen haben mehrere Entwicklungen im Bereich der Künstlichen Intelligenz für Aufsehen gesorgt: TikTok setzt verstärkt auf KI-basierte Contentmoderation, was zur Entlassung hunderter Mitarbeiter führt, während Midjourney bei der Bildbearbeitung weiterhin stark auf menschliche Kontrolle setzt. Eine neue Studie zeigt zudem, dass selbst fortgeschrittene KI-Modelle von OpenAI bei komplexen Planungsaufgaben wie der Reiseplanung oft versagen. Auch der Datenschutz wird immer wichtiger: Die New York Times verklagt das KI-Startup Perplexity wegen ungefragter Nutzung ihrer Inhalte, und Penguin Random House setzt neue Urheberrechtsregeln ein, um seine Werke vor unlizenzierter Nutzung für KI-Trainings zu schützen. Mehr als 13.000 Kreative fordern zudem ein Verbot der unlizenzierten Nutzung ihrer Werke durch KI.
1. KI Essenlieferung
Uber Eats setzt künftig auf eine neue Generation von Lieferrobotern der Firma Serve Robotics, die dank verbesserter KI-Hardware und -Software schneller und kosteneffizienter arbeiten sollen. Der Lieferroboter der dritten Generation nutzt den leistungsstarken KI-Chip Jetson Orin von Nvidia, der die Navigationsfähigkeiten und Entscheidungsprozesse optimiert. Mit einer Höchstgeschwindigkeit von 19,3 km/h und einer verlängerten Betriebszeit von mehreren Stunden pro Tag können die Roboter Lebensmittel schneller und sicherer ausliefern. Auch der Stauraum wurde vergrößert, um größere Bestellungen transportieren zu können, und die wetterfeste Außenhülle ermöglicht Einsätze unter verschiedenen Wetterbedingungen. Trotz der umfangreichen technischen Verbesserungen konnte Serve Robotics die Produktionskosten halbieren – ein Vorteil, der Uber Eats dazu veranlasst hat, bis 2025 2.000 dieser Roboter in den USA zu bestellen.
2. Videogenerierung
Adobe hat auf der MAX-Konferenz die Text-to-Video-Funktion seines KI-Modells Firefly vorgestellt, die nun in Premiere Pro integriert ist. Damit können Videos aus Texteingaben erstellt und bestehende Clips erweitert werden. Nutzer können Parameter wie Seitenverhältnis und Bildrate präzise anpassen, und Adobe sorgt mit lizenziertem Trainingsmaterial für die rechtliche Sicherheit der generierten Inhalte. Die KI-Eingaben werden durch „Content Credentials“ als authentifiziert gekennzeichnet. Im Bereich der KI-gestützten Videobearbeitung verfolgt Runway mit dem Modell „Act-One“ einen anderen Ansatz: Es ermöglicht die Übertragung von Mimik und Stimme eines Schauspielers auf virtuelle Charaktere, auch mit variierenden Proportionen. Während Adobe und Runway erweiterte kreative Freiheiten durch KI bieten, zeigt der unterschiedliche Einsatz menschlicher Kontrolle in beiden Fällen das Spannungsfeld zwischen Effizienz und ethischer Verantwortung.
3. Inhaltsmoderation
TikTok setzt bei der Moderation von Inhalten zunehmend auf KI, was zur Entlassung von Hunderten von Moderatoren führte. Das Unternehmen erklärte, dass bereits 80 Prozent der problematischen Inhalte automatisiert entfernt würden. Dennoch wird die Entscheidung kritisiert, da insbesondere im Bereich des Jugendschutzes immer wieder Vorwürfe mangelnder Kontrolle laut werden. Während sich TikTok von der Automatisierung mehr Effizienz verspricht, betont das Unternehmen, dass die menschliche Moderation für komplexere Entscheidungen erhalten bleibe. Midjourney hingegen verfolgt einen hybriden Ansatz mit KI-gestützten Tools und setzt auf menschliche Kontrolle, um Sicherheit und Qualität bei der Bildverarbeitung zu gewährleisten. Diese unterschiedlichen Ansätze verdeutlichen die Herausforderungen, denen sich Plattformen gegenübersehen, wenn es darum geht, die Effizienz von KI mit der Notwendigkeit menschlicher Eingriffe in Einklang zu bringen.
4. KI bewegt Mauszeiger
Anthropic hat das Modell Claude 3.5 Sonnet aktualisiert, das nun Mausbewegungen am Computer ausführen und Bildschirminhalte erfassen kann. In einem Demonstrationsvideo füllt die KI ein Formular aus, indem sie die erforderlichen Daten sucht und die Felder selbständig ausfüllt. Diese Fähigkeit basiert auf der Analyse von Screenshots, was Funktionen wie Scrollen oder Drag-and-Drop derzeit noch erschwert. Anthropic betont die Grenzen der Technologie und warnt davor, sie für sensible Aufgaben einzusetzen. Während KI für einfache Aufgaben nützlich sein kann, sind für komplexere Aktionen noch erhebliche Verbesserungen erforderlich. Während Unternehmen wie Midjourney mehr menschliche Kontrolle aus Sicherheitsgründen bevorzugen, zeigt der Ansatz von Anthropic die Möglichkeiten und Grenzen der Interaktivität zwischen KI und Computer in Echtzeit auf.
5. Grenzen von KI
Eine neue Studie zeigt, dass selbst fortgeschrittene KI-Systeme wie o1-Preview von OpenAI bei komplexen Planungsaufgaben an ihre Grenzen stoßen. In den Benchmarks „BlocksWorld“ und „TravelPlanner“ konnten die getesteten KI-Modelle einfache Aufgaben gut bewältigen, versagten aber bei realitätsnahen Szenarien wie der Reiseplanung. Das Modell von OpenAI erreichte nur eine Trefferquote von 15,6 Prozent, andere Modelle wie GPT-4o lagen sogar unter 8 Prozent. Die Forscher identifizierten Probleme wie die unzureichende Einhaltung vorgegebener Regeln und das Nachlassen der Aufmerksamkeit bei längeren Plänen. Auch Verbesserungsansätze wie episodische Gedächtnisauffrischungen führten nur zu minimalen Erfolgen. Während Midjourney bei seiner KI-gestützten Bildverarbeitung auf mehr menschliche Kontrolle setzt, zeigt diese Studie die Grenzen der automatisierten Entscheidungsfindung bei komplexeren Prozessen auf.
6. Datenschutz
Die New York Times hat rechtliche Schritte gegen das KI-Startup Perplexity eingeleitet, das angeblich unerlaubt auf Inhalte der NYT zugreift. Trotz einer „robots.txt“-Datei, die das Crawlen der Seite blockiert, erscheinen Inhalte der Zeitung weiterhin in den Ergebnissen der KI-Suchmaschine. Perplexity weist die Vorwürfe zurück und betont, an einer Zusammenarbeit mit den Verlagen interessiert zu sein. Parallel dazu hat Penguin Random House neue Copyright-Richtlinien eingeführt, um seine Werke vor unlizenzierter Nutzung für KI-Trainings zu schützen. Gleichzeitig fordern mehr als 13.000 Kunst- und Kulturschaffende ein Verbot der unlizenzierten Nutzung ihrer Werke durch KI, was den wachsenden Druck zeigt, kreative Inhalte im digitalen Zeitalter zu schützen und ihre Rechte zu verteidigen.