In den letzten Wochen hat sich in der Welt der KI viel getan: Der kürzlich verabschiedete AI Act der EU setzt neue Maßstäbe für die Regulierung. KI-gesteuerte Spielcharaktere revolutionieren das Gaming, während Googles effizientes Gemma-2-2B-Modell beeindruckende Ergebnisse liefert. Midjourneys verbesserte Bildgenerierung hebt die Bildqualität auf ein neues Level. Der neue Sprachmodus von ChatGPT ermöglicht natürliche und emotionale Kommunikation, und Metas vielseitige Plattform AI Studio eröffnet neue Möglichkeiten für Influencer und Prominente. Allerdings kämpfen KI-Chatbots weiterhin mit Problemen bei Falschmeldungen und der Wiedergabe aktueller Nachrichten, was die Zuverlässigkeit dieser Technologien in Frage stellt.
1. AI Act tritt in Kraft
Am 1. August 2024 war es soweit: Der AI Act trat in der EU in Kraft. Das bedeutet, dass KI-Systeme nun strenger reguliert werden, um ihren sicheren und ethischen Einsatz zu gewährleisten. Der AI Act teilt KI-Systeme in verschiedene Risikokategorien ein und legt fest, dass besonders risikoreiche Systeme ab 2026 strenge Sicherheitsstandards erfüllen müssen. Interessanterweise gibt es spezielle Regeln für generative KI, die verhindern sollen, dass zum Beispiel Social Scoring betrieben wird. Und aufgepasst: Bei Verstößen drohen saftige Strafen von bis zu 35 Millionen Euro oder 7 Prozent des weltweiten Jahresumsatzes. Diese Regelungen zeigen, dass die EU ernsthaft daran arbeitet, den Einsatz von KI verantwortungsvoll zu gestalten und könnten ein Vorbild für andere Regionen sein.
2. KI-NPCs
Eine Gruppe ehemaliger Forscher von Google DeepMind hat ein Start-up gegründet, das KI-gesteuerte NPCs (Non-Player Characters) für Videospiele entwickelt. Diese NPCs sind nicht mehr einfach nur vorhersehbare Figuren – sie haben eigene Ziele und Motivationen! In einer Demo zeigte ein NPC namens Aaron, wie er dem Spieler unaufgefordert bei der Vorbereitung eines Abenteuers hilft und sogar auf persönliche Vorlieben eingeht. Das ist eine echte Innovation und könnte die Art und Weise, wie Geschichten in Spielen erzählt werden, revolutionieren. Natürlich sind die Kosten für diese Technologie noch hoch, aber das Start-up arbeitet daran, sie erschwinglicher zu machen. Wenn das gelingt, steht uns eine aufregende Zukunft in der Welt der Videospiele bevor.
3. Google Gemma-2-2B
Google hat ein neues kleines aber feines KI-Modell namens Gemma-2-2B auf den Markt gebracht. Mit nur 2 Milliarden Parametern ist es erstaunlich leistungsfähig und übertrifft in einigen Benchmarks sogar größere Modelle. Darüber hinaus hat Google Tools wie ShieldGemma und Gemma Scope eingeführt, die bei der Erkennung schädlicher Inhalte helfen und die Entscheidungsprozesse des Modells transparenter machen. Diese Innovationen machen Gemma-2-2B nicht nur leistungsfähig, sondern auch sicher und nachvollziehbar. Das Modell ist frei verfügbar und kann auf Plattformen wie HuggingFace und Google Vertex eingesetzt werden. Google zeigt damit, dass es nicht immer auf die Größe ankommt, sondern auf die Effizienz und Intelligenz der Technologie.
4. Midjourneys 6. Generation
Midjourney hat die Version 6.1 seines KI-Bildmodells mit einigen beeindruckenden Verbesserungen veröffentlicht. Die neue Version bietet eine bessere Bildqualität und eine schnellere Generierung. Besonders auffällig sind die verbesserten Details und Texturen, die nun noch realistischer wirken. Auch die Textgenauigkeit wurde optimiert, was sich besonders bei der Darstellung von Wörtern in Anführungszeichen bemerkbar macht. Die Nutzer können nun auch mehr Texturen hinzufügen, was zusätzliche kreative Möglichkeiten eröffnet. Trotz der langen Entwicklungszeit bringt das Update viele nützliche Verbesserungen. Midjourney zeigt damit, dass kontinuierliche Innovation und Nutzerfeedback entscheidend für die Entwicklung leistungsfähiger KI-Modelle sind.
5. Voice Mode für ChatGPT
OpenAI hat einen neuen Sprachmodus für ChatGPT eingeführt, der wirklich spannend ist. Er ermöglicht es den Nutzern, in Echtzeit mit dem Chatbot zu sprechen, der sogar auf Emotionen reagieren kann. Momentan ist dieser Modus nur für eine kleine Gruppe zahlender Nutzer verfügbar, aber bis zum Herbst soll er für alle Plus-Konten freigeschaltet werden. Der Sprachmodus basiert auf dem GPT-4o-Modell und bietet eine natürliche und flüssige Kommunikation. Besonders cool: Die Stimmen wurden in Zusammenarbeit mit Synchronsprechern entwickelt, um so realistisch wie möglich zu klingen. Auch auf die Sicherheit hat OpenAI großen Wert gelegt und umfangreiche Tests durchgeführt, um Missbrauch zu verhindern. Diese neue Funktion könnte die Art und Weise, wie wir mit KI interagieren, völlig verändern.
6. KI-Chatbots und aktuelle Nachrichten
KI-Chatbots haben manchmal echte Schwierigkeiten, aktuelle Nachrichten korrekt wiederzugeben. Dies liegt oft daran, dass sie auf älteren Trainingsdaten basieren, die nicht immer aktuell sind. Manche Chatbots geben bei aktuellen Themen entweder falsche Informationen oder vermeiden das Thema ganz, insbesondere wenn es kontrovers ist. Diese sogenannten „Halluzinationen“ zeigen, dass KI-Modelle bei aktuellen Ereignissen noch nicht zuverlässig sind. OpenAI arbeitet jüngst daran, Halluzinationen von KI-Systemen u bekämpfen. Experten halten es für dringend notwendig, die Datenbasis und die Aktualisierungsmechanismen dieser Modelle zu verbessern. Bis dahin bleiben klassische Informationsquellen wie Suchmaschinen oder traditionelle Medien die verlässlichsten.
7. Alles neu bei Meta
Meta hat mit dem AI Studio eine neue Plattform vorgestellt, die wirklich spannend ist. Dort können Nutzer ihre eigenen KI-Charaktere erstellen, die insbesondere Influencer und Prominente bei der Interaktion mit ihrer Community unterstützen sollen. Diese KI-Charaktere können in ihrem eigenen Stil antworten und machen deutlich, dass es sich um KI-generierte Antworten handelt. Darüber hinaus präsentierte Meta SAM 2, ein Tool zur Videobearbeitung. SAM 2 kann Objekte in Videos identifizieren und bearbeiten, auch wenn diese sich verändern. Dies eröffnet neue Möglichkeiten in Bereichen wie Mixed Reality und autonomes Fahren. Mit diesen Innovationen zeigt Meta, wie vielseitig und nützlich KI-Technologien sein können und wie sie unseren Alltag und professionelle Anwendungen bereichern können.