Google AI’daki yapay zeka araştırmacılarından oluşan bir ekip, Lumiere adlı yeni nesil yapay zeka tabanlı bir metinden videoya oluşturucu geliştirdi. Grup, çalışmalarını anlatan bir makaleyi arXiv ön baskı sunucusunda yayınladı.
Google AI, Lumiere adlı yeni bir yapay zeka tabanlı metin-video üreticisini duyurdu. Lumiere, metin talimatlarını gerçekçi ve çekici videolara dönüştürmek için tasarlanmıştır.

Geçtiğimiz yıllarda yapay zeka uygulamaları araştırma laboratuvarlarından geniş kullanıcı topluluğuna taşındı. Örneğin, ChatGPT gibi LLM’ler tarayıcılarla entegre edildi ve kullanıcıların benzeri görülmemiş şekillerde metin oluşturmasına olanak tanıdı. Daha yakın zamanda, metinden görüntüye oluşturucular kullanıcıların gerçeküstü görüntüler yaratmasına olanak tanıdı. Metinden videoya oluşturucular ise kullanıcıların birkaç kelimeden başka bir şey kullanmadan kısa video klipler oluşturmasına olanak sağladı.
Google ekibi bu yeni çalışmasında, Lumiere adlı metinden video oluşturucuyu duyurarak bu son kategoriyi yeni bir boyuta taşıdı. Adını muhtemelen ilk fotoğrafçılık ekipmanlarına öncülük eden Lumiere kardeşlerden alan Lumiere, kullanıcıların “birlikte kitap okuyan iki rakun” gibi basit bir cümle yazmalarına ve iki rakunun tam da bunu yaptığını gösteren tamamen bitmiş bir videoya geri dönmelerine olanak tanıyor. Bunu şaşırtıcı derecede yüksek çözünürlükte yapıyor. Yeni oluşturucu, çok daha iyi görünen sonuçlar yaratarak metinden videoya oluşturucuların geliştirilmesinde bir sonraki adımı temsil ediyor.
Google, yeni oluşturucunun arkasındaki teknolojiyi “çığır açan Uzay-Zaman U-Net mimarisi” olarak tanımlıyor. Tek bir model geçişinde animasyonlu video üretmek üzere tasarlanmıştır.
Tanıtım videosunda Google’ın, kullanıcıların mevcut bir videonun bir bölümünü vurgulayarak ve “elbise rengini kırmızıya çevir” gibi talimatlar yazarak videoyu düzenlemelerine izin vermek gibi ekstra özellikler eklediği görülüyor. Oluşturucu ayrıca, tam renkli bir temsil yerine bir konunun stilinin oluşturulduğu stilizasyonlar gibi farklı türde sonuçlar da üretiyor. Ayrıca farklı stil referansları gibi alt stillere de izin verir. Ayrıca, kullanıcının hareketsiz bir görüntünün bir kısmını veya tamamını vurgulayabildiği ve hareketlendirebildiği sinemagrafikler de yapıyor.
Google duyurusunda, muhtemelen telif hakkı yasalarını ihlal eden videoların oluşturulması nedeniyle ortaya çıkabilecek bariz yasal sonuçlar nedeniyle, Lumiere’i halka yayınlamayı veya dağıtmayı planlayıp planlamadıklarını belirtmedi.
Lumiere’in potansiyel kullanımları arasında film ve televizyon yapımı, eğitim ve öğretim, reklam ve pazarlama yer alıyor. Bu teknolojinin gelişmesi, yapay zeka tarafından oluşturulan videoların daha yaygın olarak kullanılmasını sağlayabilir.