"Sora": KI-Videogenerator von OpenAI erschafft realistische Szenen

OpenAI hat den Text-zu-Video-Generator "Sora" vorgestellt, der aus Textanweisungen verblüffend realistisch wirkende Videos erzeugt.

216

Spaziergang durch Tokio

(Bild: OpenAI)

15.02.2024, 22:49 Uhr

Lesezeit: 2 Min.

Von

Dr. Volker Zota

OpenAI hat den Text-zu-Video-Generator "Sora" vorgestellt, der aus Textanweisungen realistisch aussehende Videos erzeugt. Sora ist Teil eines OpenAI-Forschungsprojekts, das darauf abzielt, künstliche Intelligenz zu befähigen, die physische Welt und ihre Bewegungen zu verstehen und nachzubilden. Das Modell erzeugt Videos von bis zu einer Minute Länge und soll dabei eine hohe visuelle Qualität sowie eine präzise Umsetzung der Benutzervorgaben gewährleisten.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

YouTube-Video immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

3003-Video mit Open-Source-Vergleich

Die von OpenAI präsentierten Beispielvideos decken ein breites Spektrum ab: von einem Spaziergang durch eine neon-beleuchtete Straße in Tokio über Wollmammuts in einer verschneiten Landschaft bis zu kreativen Darstellungen wie einem jungen Mann, der auf einer Wolke sitzt und ein Buch liest. Nach Angaben von OpenAI wurden alle Beispielvideos direkt von Sora ohne jegliche Modifikationen erstellt. Trotz der auf den ersten Blick oftmals überzeugenden Ergebnisse habe Sora auch Schwächen, so OpenAI. Das Modell habe beispielsweise Schwierigkeiten, die Physik komplexer Szenen genau zu simulieren oder den Unterschied zwischen Ursache und Wirkung zu verstehen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes Video (Kaltura Inc.) geladen.

Videos immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Kaltura Inc.) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Zusammenschnitt einiger mit "Sora" erzeugter Beispielvideos

(Quelle: OpenAI)

Laut OpenAI wurde der Zugang zu Sora zunächst nur speziellen Gruppen gewährt. Dazu gehören Experten für Sicherheitsbewertungen und Kreativprofis, um das Modell in verschiedenen Kontexten zu testen und weiterzuentwickeln.

Sicherheitsmaßnahmen geplant

OpenAI plant Sicherheitsvorkehrungen, um das Risiko des Missbrauchs zu minimieren – einschließlich der Entwicklung von Erkennungstechnologien für generierte Inhalte und der Integration von Schutzmaßnahmen wie C2PA-Metadaten in zukünftige Produkte.

Sora nutzt eine Diffusionsmodell-Technologie und Transformer-Architektur, um auf Basis der bei DALL-E und GPT gewonnenen Erkenntnisse aus kleinen Datenpaketen Videos zu generieren – einen ähnlichen Ansatz verfolgt das kürzlich von Google vorgestellte "Lumiere". OpenAI sieht in Sora einen weiteren wichtigen Schritt auf dem Weg zur allgemeinen künstlichen Intelligenz.