Dünyanın önde gelen teknoloji firmalarından Google, en yeni video üretim yapay zeka (AI) modeli olan Veo 3’ü tanıtarak yapay zeka destekli içerik oluşturma alanında önemli bir ilerleme kaydetti.
Veo 3, yalnızca video üretimi sağlamakla kalmayıp aynı zamanda görsellerle uyumlu ses efektleri, arka plan sesleri ve diyaloglar gibi ses bileşenlerini de oluşturabilen bir yetenek sunuyor.
VEO 3, GÖRSELLERLE EŞ ZAMANLI SES ÜRETİMİ İLE RAKİPLERİNDEN AYRIŞIYOR
Bu yeni modelin, görsellerle senkronize bir şekilde ses üretebilmesi, onu video oluşturma araçları pazarındaki diğer rakiplerinden farklı bir konuma getiriyor.
Metin veya resim komutları ile video oluşturma becerisine sahip olan bu model, Runway ve OpenAI gibi rakiplerini geride bırakıyor.
Veo 3, şu anda aylık 249,99 dolar karşılığında Google’ın AI Ultra planına abone olan ABD merkezli kullanıcılar için Gemini sohbet robotu uygulaması üzerinden kullanılabiliyor.
VEO 3’ÜN GELİŞİMİNDE DEEPMIND TEKNOLOJİSİ KULLANILDI
Veo 3’ün geliştirilmesinde, muhtemelen DeepMind’ın “videodan sese” yapay zeka alanındaki çalışmalarının etkisi olduğu düşünülüyor.
Google, Veo 3’ü eğitmekte kullanılan içerik kaynaklarını doğrulamasa da, YouTube’un bu içerikler arasında güçlü bir aday olduğu ifade ediliyor.
Ayrıca Deepfake tehdidini azaltmayı amaçlayan DeepMind, Veo 3 tarafından üretilen karelerde görünmez işaretçilerin yer alması için SynthID isimli filigranlama teknolojisini kullanıyor.
Bunun yanı sıra, Google, Veo 3’ün tanıtımıyla birlikte selefi Veo 2 için gelişmiş karakter ve sahne tutarlılığı ile kamera hareketlerini anlama yeteneklerini de duyurdu.