OpenAI, metin talimatlarından 60 saniyeye kadar videolar üretebilen yeni yapay zeka modeli Sora’yı duyurdu.
Diğer video oluşturma araçlarından farklı olarak Sora, görsel kaliteyi ve kullanıcının talimatlarına uyumu koruyarak tutarlılık sorunlarına çözüm sunmayı hedefliyor.
Model, karmaşık sahnelerde birden fazla karakteri, belirli hareket türlerini ve detayları başarıyla oluşturabilme yeteneğine sahip.
OpenAI, Sora’nın metin talimatlarını doğru bir şekilde yorumlayabilme yeteneğini vurgulayarak, derin dil bilgisine dayalı bir model olduğunu belirtiyor.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Çarpıcı fotogerçekçilik yeteneği ile dikkat çekiyor
Sora, diğer video oluşturuculardan farklı olarak, çarpıcı fotogerçekçilik ve uzun klipler üretebilme yeteneği ile dikkat çekiyor. Model, sadece metin talimatlarını değil, aynı zamanda sinematik unsurlara da özel önem vererek derinlik, perspektif ve dokuları başarıyla yorumlayabiliyor.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
OpenAI, Sora’nın şu anda film yapımcıları, tasarımcılar ve görsel sanatçılar gibi belirli kullanıcı gruplarına hizmet verdiğini belirtiyor. Ayrıca, modelin olası yanıltıcı içeriği tespit etmeye yardımcı olacak araçlar üzerinde çalıştığını ve kullanım politikalarını ihlal eden talimatları reddedeceğini vurguluyor.
Bazı eksiklikleri bulunuyor
OpenAI, Sora’nın şu anki sürümünde bazı zayıf yönlerin bulunduğunu kabul ediyor. Örneğin, model karmaşık sahnelerin fiziksel detaylarını doğru bir şekilde simüle etmekte veya belirli neden-sonuç ilişkilerini tam olarak anlamakta zorlanabiliyor.
Örneğin, bir kişinin bir kurabiyeden ısırık aldığı bir sahne talep edildiğinde, Sora’nın bu isteği yerine getirip daha sonra videoda kurabiyede bir ısırık izi göstermekte zorlanabileceği ifade ediliyor.
Ayrıca, modelin uzamsal detayları karıştırabilme ve zaman içinde gerçekleşen olayların kesin tanımlarını takip etme gibi sorunları da olduğu belirtiliyor.