Die Welt der künstlichen Intelligenz hält auch im Jahr 2025 wieder einige Überraschungen für uns bereit. Von der Simulationsplattform „Genesis“, die das Training von Robotern in Rekordzeit ermöglicht, über die innovativen „Prompting Parties“ von PwC bis hin zu Microsofts Large Action Models, die selbstständig Software bedienen können, wird gezeigt, wie vielfältig KI eingesetzt werden kann. Auch ethische Fragen stehen im Fokus, etwa beim Einsatz von KI in der Medizin oder beim Umgang mit zensierten Sprachmodellen. Gleichzeitig öffnen kreative Tools wie „Sketch2Sound“ von Adobe dem Sounddesign neue Türen. Dieser Blog wirft einen Blick auf aktuelle Entwicklungen, Herausforderungen und Innovationen, die den Weg für die KI der Zukunft ebnen.
Genesis beschleunigt Robotertraining
Die Simulationsplattform „Genesis“ macht das Training von Robotern schneller als je zuvor. Die als Open-Source-Lösung entwickelte Plattform kombiniert physikalische Löser mit GPU-basierten Parallelberechnungen, um Simulationen in Rekordzeit durchzuführen. In einfachen Szenarien erreicht Genesis bis zu 43 Millionen Bilder pro Sekunde, was einer Trainingszeit von zehn Jahren in nur einer Stunde entspricht. Darüber hinaus ermöglicht die Plattform die Erstellung komplexer 4D-Welten aus textuellen Beschreibungen, die vielfältige Anwendungsmöglichkeiten bieten. Während die einen die Ergebnisse in Frage stellen, sehen andere darin eine vielversprechende Entwicklung für Robotik und Embodied AI. Die potenziellen Anwendungsbereiche reichen von der industriellen Automatisierung bis hin zur fortgeschrittenen Forschung, was Genesis zu einem wichtigen Werkzeug für die Weiterentwicklung von KI und Robotik machen könnte.
PwCs „Prompting-Partys“
Seit 2024 organisiert PwC sogenannte Prompting-Partys, an denen Mitarbeitende in entspannter Atmosphäre KI-Tools ausprobieren können. Diese Events sollen helfen, Hemmschwellen abzubauen und praktische Anwendungsfälle zu simulieren. Mehr als 500 Partys haben bereits stattgefunden, weitere 880 sind geplant. Neben der Förderung des Austauschs innerhalb der Teams entstehen so auch neue Ideen, wie KI in den Alltag integriert werden kann. Dabei wird Wert auf ein sicheres Umfeld gelegt, in dem ohne Leistungsdruck experimentiert werden kann. Langfristig plant PwC, mit Hilfe von KI individuelle Entwicklungspläne zu erstellen, die gezielt auf Karriereziele abgestimmt sind. Die Initiative zeigt, wie Unternehmen mit kreativen Ansätzen das Potenzial neuer Technologien nutzen und gleichzeitig die Akzeptanz bei den Mitarbeitenden fördern können.
Handeln statt reden
Microsoft hat mit seinen Large Action Models (LAMs) eine neue Art von KI entwickelt, die digitale Aufgaben direkt ausführen kann. Die Modelle wurden darauf trainiert, mit Software wie Microsoft Word umzugehen. In Tests erreichte ein LAM eine Erfolgsquote von 71 Prozent bei der Bewältigung komplexer Aufgaben. Das Training umfasst mehrere Phasen, einschließlich des selbstverstärkenden Lernens und der Erweiterung der Datensätze mit Hilfe des „Data Evolving“-Ansatzes. Trotz bestehender Herausforderungen wie Skalierbarkeit und ethischer Fragen bietet diese Technologie ein großes Potenzial für effizientere Arbeitsprozesse. Perspektivisch könnten LAMs in einer Vielzahl von Bereichen eingesetzt werden, von der Automatisierung einfacher Bürotätigkeiten bis hin zu komplexeren, anpassungsfähigen Anwendungen in industriellen Szenarien. Der Ansatz von Microsoft zeigt, wie vielseitig KI-Systeme werden können, wenn sie konsequent auf praktische Aufgaben zugeschnitten sind.
Gedächtnis und Denkkraft vereint
OpenAI hat mit „o3“ ein Modell vorgestellt, das neue Maßstäbe in der KI-Entwicklung setzt. Es verarbeitet Aufgaben in kleineren Schritten und zeigte beeindruckende Ergebnisse in Benchmarks wie AIME 2024. Mit einer Genauigkeit von 96,7 Prozent und der Fähigkeit, bis zu 33 Millionen Token pro Aufgabe zu verarbeiten, bietet „o3“ vielfältige Anwendungsmöglichkeiten. Ab Januar 2025 wird eine kostengünstigere Mini-Version zur Verfügung stehen, die ähnliche Leistungen bei geringerem Ressourcenverbrauch erzielt. Gleichzeitig wurde ChatGPT um eine Gedächtnisfunktion erweitert, die frühere Gespräche berücksichtigt, um Antworten besser kontextualisieren zu können. Die gespeicherten Daten können angepasst oder gelöscht werden, was die Datensicherheit erhöht. Diese Kombination von Denkprozessen und Personalisierung zeigt, wie unterschiedlich KI-Modelle an spezifische Anforderungen angepasst werden können, um sowohl analytische als auch interaktive Aufgaben zu unterstützen.
Ethischer KI Einsatz
Ein Forschungsteam hat Leitlinien für den verantwortungsvollen Einsatz von KI in der Medizin entwickelt, um das Vertrauen zwischen Ärzten und Patienten zu sichern. Das Modell setzt auf Transparenz, standardisierte Informationen und die Einbindung von Fachleuten und Patienten in den Entwicklungsprozess. Auch Themen wie Datensicherheit und Haftung werden berücksichtigt. Ziel ist es, KI als unterstützendes Werkzeug zu etablieren, das die medizinische Praxis bereichert, ohne ethische Standards zu gefährden. Beispiele für den Einsatz solcher KI-Lösungen könnten die Diagnoseunterstützung oder die Optimierung von Behandlungsplänen sein. Die Leitlinien sollen sicherstellen, dass der technologische Fortschritt nicht auf Kosten des Vertrauens in den Menschen geht und der Patient stets im Mittelpunkt steht.
Zensierte LLM
Der Hersteller Boox sorgte für Diskussionen, als er ein zensiertes Sprachmodell aus China verwendete, das kritische Themen blockierte und Propaganda verbreitete. Nach öffentlicher Kritik kehrte das Unternehmen zu einem OpenAI-Modell zurück. Dieser Vorfall unterstreicht, wie wichtig es ist, die Werte und Trainingsdaten hinter KI-Systemen kritisch zu hinterfragen. Technologie ist oft eng mit kulturellen und ethischen Normen verbunden, die bei ihrer Entwicklung berücksichtigt werden müssen. Gerade im internationalen Kontext zeigt sich, wie unterschiedlich KI-Systeme interpretiert und genutzt werden können. Dieser Fall zeigt auch, wie wichtig eine offene Diskussion über die Transparenz und Neutralität von KI-Werkzeugen ist, insbesondere wenn sie global eingesetzt werden.
Adobes Sketch2Sound-Tool
Adobe hat mit „Sketch2Sound“ ein innovatives Werkzeug für Sounddesigner vorgestellt. Es kombiniert Imitationen und Textbeschreibungen, um individuelle Klänge zu generieren. Das System analysiert Lautstärke, Klangfarbe und Tonhöhe, um realistische Ergebnisse zu erzielen. Besonders Foley-Künstler profitieren von der intuitiven Bedienung, die die natürliche Kreativität fördert. Herausforderungen wie störende Raumklangeffekte werden gelöst. „Sketch2Sound“ hat das Potenzial, die Arbeit in Tonstudios grundlegend zu verändern. Perspektivisch könnten solche Tools auch in anderen kreativen Bereichen eingesetzt werden, z.B. für die schnelle Erstellung von Prototypen oder für Bildungszwecke, um komplexe Konzepte auditiv darzustellen. Das Tool zeigt, wie sich technologische Innovationen direkt auf kreative Arbeitsprozesse auswirken können.