Microsoft'un fotoğrafları konuşturan yapay zeka aracı: VASA-1

Microsoft, araştırma kolu aracılığıyla dikkat çekici bir yapay zeka modeli olan VASA-1’i tanıttı.

VASA-1, yalnızca tek bir fotoğraf ve ses örneğinden hipergerçekçi konuşan yüzler oluşturabiliyor. Bu model, video oluşturma sınırlarını başka bir boyuta taşıyor.

VASA-1’in Özellikleri:

Sesli Görsel Duygusal Beceriler (VASA): Model, yalnızca dudak senkronizasyonunun ötesine geçerek gerçek bir kişinin konuştuğuna dair inandırıcı bir yanılsama yaratmak için tüm yüzü canlandırıyor. Doğal ifadeler ve baş hareketleri, sağlanan sese karşılık geliyor.
Yüz Gizli Alanı Modeli: VASA-1, hem yüz dinamiklerini hem de kafa hareketlerini oluşturmak için bir “yüz gizli alanı” modeli kullanıyor. Bu, görüntünün görünümünün, 3 boyutlu kafa pozunun ve yüz ifadelerinin çözülmesi anlamına geliyor.
Eğitim Verilerinin Ötesinde İşlem: VASA-1, eğitim verilerinin parametrelerinin dışında kalan fotoğraf ve ses girişlerini işleyebiliyor.
Yüksek Esneklik: Model, yaratıcı olasılıkları genişleten bağımsız kontrol ve özelleştirmeye olanak tanıyor.

VASA-1’in Potansiyel Uygulamaları:

Kişiselleştirilmiş avatarlar oluşturma
Sanal asistanlar için gerçekçi sözcüler oluşturma
Video oyunu karakterleri (NPC’ler) oluşturma
Tarihi figürleri yeniden canlandırma
Eğitim amaçlı etkileşimli içerik oluşturma

Etik Kaygılar:

VASA-1’in deepfake veya yanlış bilgilendirme amacıyla kötüye kullanılabileceği endişeleri de bulunuyor. Bu nedenle Microsoft, teknolojiyi şu anda kapalı kapılar ardında tutuyor.

İlginizi çekebilir

Teknolojik gelişmelerle birlikte çalışanlar arasında “FOBO” yükseliyor

İşyerlerinde yaygın tükenmişlik: Çalışanlar ve yöneticiler arasında algı uçurumu var

Samsung ikonik mekanların önüne “Sıkıcı Reklamlar” yerleştirdi

reklam

VASA-1 şu anda araştırma projesi olarak devam ediyor ve genel kullanıma sunulmadı.

VASA-1, tek bir resim ve ses klibiyle hipergerçekçi konuşan yüzler oluşturabilen çığır açan bir yapay zeka modeli. Bu model, video oluşturma ve etkileşimli içerik alanlarında devrim yaratma potansiyeline sahip. Ancak etik kaygılar da göz önünde bulundurulmalı ve modelin sorumlu bir şekilde geliştirilmesi ve kullanılması sağlanmalı.

Microsoft’un fotoğrafları konuşturan yapay zeka aracı: VASA-1

Microsoft'un araştırma birimi, yalnızca bir fotoğraf ve ses örneği kullanarak muazzam derecede gerçekçi konuşan yüzler oluşturabilen etkileyici bir yapay zeka modeli olan VASA-1'i tanıttı.

İşyerlerinde yaygın tükenmişlik: Çalışanlar ve yöneticiler arasında algı uçurumu var

Samsung ikonik mekanların önüne “Sıkıcı Reklamlar” yerleştirdi

İlgili Haberler

Microsoft, iş uygulamaları için GPT-4 destekli “Copilot”u kullanıma sunuyor

Aktif Bank yeni temas noktasını Decentraland’de kurdu

Selpak yapay zekayı iletişim süreçlerine entegre etti