KI-Videos, die überzeugen !
Prompt schreiben, Film generieren und nen Oscar kassieren !
Sora, die KI mit Bewegtbild
OpenAI, die Macher hinter ChatGPT und Dall-E gewähren einen Einblick auf ein neues KI-Tool: Sora. Nachdem Text- und Bildgeneratoren Einzug in den Alltag vieler Menschen gefunden haben, kommt nun eine Video-KI, die es allen Anschein nach in sich hat. Wie auch bei anderen KI-Anwendungen wird von der Software nach einem Prompt verlangt. Am Ende kommt ein Video heraus, das bis zu 60 Sekunden lang ist. Es ist kinderleicht, so, wie man es von anderen OpenAI-Anwendungen gewohnt ist.
Letztes Jahr kamen die ersten Bildgeneratoren für die Massen auf den Markt und alle waren von der Qualität der oftmals noch fehlerbehafteten Werke beeindruckt. Jetzt zeigt OpenAI Videos und lässt einen sprachlos zurück. Atemberaubend gut sehen die Videos aus, denn das Bewegtbild kaschiert kleine Fehler. Doch selbst, wenn man pausiert, fallen einem kaum offensichtliche Makel ins Auge. Klar, es ist nicht perfekt, aber das wäre auch ein wenig zu viel erwartet.
Wie funktioniert Sora?
Bei Sora handelt es sich um ein Diffusionsmodell , das entweder ein ganzes Video generieren kann, oder bestehende Videos um KI-Inhalte ergänzen und verlängern kann. Das Modell kann die semantische Bedeutung von Text verstehen und diesen in visuelle Darstellungen übersetzen. Dabei hat OpenAI es zu großen Teilen geschafft der KI eine Objektpermanenz zu geben. Kurz gesagt: Gegenstände, die kurz das Bild verlassen und dann wieder ins Bild kehren, bleiben dieselben – man könnte auch von einer Art Kontinuitätsprüfung sprechen. OpenAI nutzt die Erkenntnisse, die bei der Entwicklung von ChatGPT und Dall-e entstanden sind. Sora kann jetzt schon recht gut verstehen, wie die Welt und Objekte in ihr funktionieren. Daher stellt es laut OpenAI einen Grundpfeiler für eine mögliche Generelle Künstliche Intelligenz dar – also dem feuchten Traum und absoluten Schrecken eines jeden Sci-Fi-Fans.
Man ist sich der Schwächen bewusst
OpenAI schreibt zu den Demo-Videos, dass man sich der Schwächen der KI bewusst ist. So gibt die KI Bewegungen nicht immer physikalisch korrekt wieder, was beim genauen Hingucken, dann doch ins Auge sticht. Auch werden Ursache und Folge nicht immer korrekt dargestellt. Beißt eine Person beispielsweise in einen Keks, kann es sein, dass dieser keine Bissspuren aufweist, so OpenAI. Das Klatschverhalten von Menschen sitzt auch noch nicht so richtig. Doch man kann sich sicher sein, dass das Unternehmen mit Hochdruck daran arbeitet solcherlei Fehler auszumerzen. Das Ergebnis dürfte noch beeindruckender sein, als es ohnehin schon ist.
Closed Access für Künstler
Bisher ist das Tool nur für eine ausgewählte Gruppe an Visual Artists, Filmmachern und Designern zugänglich. Sie Zugang erhalten, um Kritik und Feedback an Sora auszusprechen. Die Künstler verstehen ihre Arbeit am besten und sollen OpenAI dabei helfen das Produkt zu optimieren. Wir sind auf die Reaktionen der ersten Tester gespannt. Vielleicht sehen wir demnächst ja schon den ersten KI-Spielfilm, denn Sora soll bereits jetzt in der Lage sein mehrere Aufnahmen zu erstellen und dabei die Charaktere und den Stil beizubehalten.
Sicherheit ist Priorität
Das Tool befindet sich noch in der Entwicklung, braucht also noch ein wenig bis zur Marktreife. Wäre Sora bereits für die Massen zugängig, wären wir mit Sicherheit von einer Flut an Fake-News-Material überschwemmt worden. Mit einer KI wie Sora ließen sich in Windeseile unzählige Videos zu allerlei Themen produzieren und über die sozialen Medien distribuieren. Versehen mit pseudoauthentischen KI-Texten, würde es vielen Menschen schwerfallen Echtes vom Fake zu trennen. Um dem entgegenzuwirken, setzt OpenAI sogenanntes Red Teaming ein. Es stellt also eine unabhängige Gruppe an Devs zusammen, die die Sicherheitslücken, Hassrede und Missinformationen seitens der KI bekämpfen sollen. Zudem werden die Videos mit Metadaten versehen, anhand derer man sie als KI-Werk erkennen soll. Gerade, da wichtige Wahlen anstehen, kann man wohl eher sagen, dass es vernünftig ist, wenn die KI noch ein wenig länger unter Verschluss gehalten wird. Zudem steigert das die Vorfreude.
Wie kann man die KI fürs Marketing nutzen?
Die Frage dürfte sich recht schnell von jedem beantworten lassen, der auch nur am Rande mitbekommen hat, wozu KIs bereits im letzten Jahr im Stande waren. Werbefilme, Mock Ups und webseitendynamisierende GIFs lassen sich im Nu erstellen, um die Botschaft an die Kundschaft zu übermitteln. Content, egal, wie abstrus er auch sein sollte, kann noch schneller erstellt werden. Memes für Social Media, können erdacht und in Sekunden gemacht werden. Für alle Kreativen ist eine solche KI ein Traum. Ideen schnell umsetzen zu können, ohne, dass man Animations-, Kamera oder andere filmische Kenntnisse besitzt, ist perfekt für all jene, die sich ganze Welten in ihren Köpfen erdenken aber bisher nicht die Möglichkeit hatten diese umzusetzen.
Fazit
Es gibt noch eine Menge zu tun, gerade in Sachen Sicherheit. Aber was OpenAI bisher mit Sora gezeigt hat, ist absolut bemerkenswert. Wenn man die Kürze der Zeit und die gleichzeitige Entwicklung des KI-Könnens betrachtet, ist es umso erstaunlicher, was für Videos generiert werden können. Wir können es kaum erwarten die KI selbst in die Finger zu bekommen und eigene Videos zu erstellen. Unsere Kunden dürften sich auch über das ein oder andere Schmankerl freuen. Bis es so weit ist, behalten wir Sora genauestens im Auge und berichten, wenn es etwas Neues gibt.
Hierbei handelt es sich zwar um Bilder, aber die Videos dazu sind top!
Wir sind Ihre Agentur.
Schreiben Sie uns.