Videoları Daha Erişilebilir Hale Getirmenin Yeni Yolu: Omni Betimleyici

Toplam Okunma 45

Herkese merhaba,

 

Ben Ömer. Sesli medya üzerine çalışmalar yapan, mütercim tercümanlık okumuş ve az çok yazılımdan da anlayan biriyim. Bu kısa tanıtımı yapma ihtiyacı hissettim, çünkü bu üç alan da ileride birleşecek ve sizlere tanıtmak istediğim Omni Betimleyici tam da bu kesişimde duruyor.

 

Baştan söyleyeyim, bu yazı biraz uzun olabilir :)

 

Omni Betimleyici, yapay zeka kullanarak videolara sesli betimlemeler oluşturan bir Windows uygulamasıdır. Dünya giderek daha görsel bir hâl alıyor ve biz görme engelliler, bu dijital çağda bu alandan giderek daha da mahrum kalıyoruz. En basitinden bir yemek tarifi videosundan aksiyon dolu filmlere kadar...

 

Elbette burada, "Ee, zaten sesli betimleme hizmetleri var," düşüncesi akla gelebilir. İnsanlar tarafından yapılmış bir betimlemenin kalitesini yapay zekanın geçeceğini iddia etmiyorum. Bu aşırı iddialı bir söylem olurdu ve şahsen sırf bir ürün tanıtmak için abartılı beklentiler oluşturmak hoş gelmiyor bana. İnsan eliyle yapılan sesli betimlemeler, doğru yapıldığında çok kaliteli oluyor (ki bence bizde bu işi dizi/film açısından en iyi yapan kurum SEBEDER'dir, onlara da buradan teşekkür etmek isterim).

 

Ancak betimleme yapmak maliyetli bir iştir. Bu iş, ne yazık ki "bir insan oturdu, izledi, metni yazdı ve seslendirdi" kadar basit değil. İlk izlenim, detaylı analiz, betimleme metninin yazımı, metnin değerlendirilmesi, ses kaydı ve miks-montaj derken kaç madde olduğunu benim bile unuttuğum bir sürü aşaması var. Ve bu işler gerçekten zaman ve para isteyen işler.

 

İşte Omni Betimleyici burada devreye giriyor. İnsan betimlemesinin yerini almıyor, sadece ona destekleyici bir rol üstleniyor. Ben yapay zekanın bir amaç değil, bir araç olduğunu düşünüyorum. O yüzden bu programın çalışma biçimi de tam olarak böyle: Size otonom sürüş vadetmiyor, sizi direksiyona oturtuyor ve aracı siz sürüyorsunuz. Uygulamayı bir görme engelli olarak, "bir görme engelli betimlemede ne arar, neyi merak eder?" düşüncesiyle tasarlamaya çalıştım.

 

Başlamadan Önce En Kritik Tavsiyem

 

Uygulamayı anlatmaya geçmeden önce verebileceğim en büyük tavsiye, uygulamayı indirdikten sonra Kullanıcı Kılavuzu'nu okumanız olur. Sorabileceğiniz soruların çoğunun cevabı kılavuzda mevcut. Yeri geliyor ben de kılavuz okumadan uygulama kurcalamaya başlıyorum, ancak Omni Betimleyici "tak-çalıştır" biçiminde çalışmıyor ve kılavuzu okumazsanız bu uygulama çalışmıyor diyip silme veya çok yararlı özellikleri  kaçırma ihtimaliniz çok yüksek.

 

Öncelikle uygulamayı kullanmadan önce bir Google Gemini API anahtarı almanız gerekiyor. Sıkça sorulan bir soruyu hemen cevaplayayım: "Bende Gemini Pro aboneliği var, çalışır mı?" Hayır, Gemini Pro aboneliği ile API anahtarı farklı şeylerdir. Merak etmeyin, bu yazının yazıldığı tarih itibarıyla Google belli bir kullanım kotasını zaten ücretsiz sağlıyor.

 

API anahtarını kılavuzda anlatıldığı şekilde edindikten sonra bir yere not edin, çünkü aldığınız anahtar size bir daha gösterilmeyecek. Tabii ki kimseyle de paylaşmayın. Uygulama, ayarlara girdiğiniz API anahtarınızı zaten kendisi şifreleyerek saklıyor.

 

Uygulamanın Kullanımı

 

Uygulamayı açtığınız zaman karşınıza klasik menülü bir Windows paneli gelecek. Eski tip uygulamalara alışık değilseniz hatırlatayım; bu uygulamada işlevsel "Dosya" ve "Yardım" menüleri var :) ve bazı özellikler bu menülerin içinde. Sadece Tab ile dolaşarak bazı özellikleri kaçırabilirsiniz.

 

Uygulama size üç çeşit video kaynağı yükleme olanağı sunuyor:

 

YouTube: Linki yapıştırmanız yeterli.

 

Doğrudan İndirme: Vimeo, Instagram gibi büyük platformlardan veya direkt indirme adreslerinden video çekebilirsiniz.

 

Bilgisayarınızdan Dosya: Kendi video dosyanızı seçebilirsiniz.

 

API anahtarını da ayarladıysanız, betimleme kısmına geçebiliriz!

 

Uygulama, farklı senaryolar için farklı istemler (prompt) içerir. Örneğin bir aksiyon filmi için istenecek detaylar ve betimleme dili, bir yemek tarifi videosundan farklıdır. Bu yüzden uygulama, belli varsayılan istemlerle gelir. Video tipinize uygun istemi seçebilir veya "Özel İstem" iletişim kutusundan kendinize özel bir istem de hazırlayabilirsiniz.

 

İstemi ayarladıktan sonra istediğiniz kaynak için olan düğmeye basın, dosyanızı seçin veya adresinizi yapıştırın; uygulama videonuzu indirmeye başlayacaktır. Video indirilip işlendikten sonra karşınıza oynatıcı penceresi çıkacak. (Oynatıcı ve diğer fonksiyonları kılavuzdan okuyabilirsiniz, bu yazıyı çok fazla uzatmak istemem.)

 

Oynatıcıdaki "Oynat" düğmesi ile betimlemeler size ekran okuyucunuzla okunacaktır. Eğer betimlemeleri sadece uygulamada değil, farklı yerlerde de kullanmak isterseniz, uygulama farklı çıktı formatlarını destekler:

 

Medya oynatıcılarda kullanmak için SRT dosyası,

 

Betimlemeleri doğrudan okumak için sade metin (TXT),

 

Veya her yerde dinleyebileceğiniz MP3 dosyaları oluşturabilirsiniz.

 

Ekstra Özellikler

 

Diyelim ki videonun 10. saniyesinde merak ettiğiniz bir detay var. "Bu konuyla ilgili daha fazla sor" düğmesine tıklayarak yapay zekaya mevcut bölümle ilgili sorular sorabilirsiniz.

 

Veya sahneyi zihninizde daha iyi haritalamak isterseniz, "Sahne" özelliği ile videoda bulunduğunuz yerdeki nesneleri bir ızgara üzerinde görebilirsiniz.

 

Bu pencereyi bir satranç tahtası gibi düşünebilirsiniz: En üst sol köşe (1,1), en alt sağ köşe (5,5) gibi. Uygulama, sahnenin büyüklüğüne göre ızgara boyutunu otomatik ayarlar.

 

Bu pencerede ok tuşlarıyla dolaşıp nesnelerin konumunu öğrenebilirsiniz. Örneğin: "1,4'te bir adam", "4,1'de duran bir masa." Bu konumlara göre genel sahne durumunu zihninizde canlandırabilirsiniz.

 

Püf Noktaları

 

Bu yazıya özel bir iki ipucu da bırakmazsam olmazdı :) En iyi video betimleme kalitesi için doğru ayarlarla betimleme yapmak önemlidir. Kaliteyi doğrudan etkileyen 4 faktör var:

 

1. Model Seçimi:

 

2.5 Flash (Varsayılan): Ücretsiz kotası ve kalitesi en dengeli olan model. Çoğu betimleme için yeterlidir.

 

2.5 Flash Lite: En hızlı ve en ucuz modeldir. Flash'a nazaran daha hızlı ama betimleme kalitesi biraz daha düşük olabilir.

 

2.5 Pro: Aralarındaki en yavaş, pahalı ve en kaliteli model. Karmaşık sahnelerde harikalar yaratır. Örneğin, bir dizide birbirine çok benzeyen iki karakterin şaşırdığı bir sahneyi betimletmiştim. İki yüzün de farklı kişilere ait olduğunu ayırt edebilen tek model Pro modeli olmuştu şu ana kadar. Benchmark için hep o sahneyi kullanırım :)

 

2.0 Flash: Bu eski modeli, çıktının engellendiği (sansüre takıldığı) durumlarda kullanmak yararlı olabilir. Ancak video parçalarını en fazla 5, belki zorlarsak 10 dakikadan uzun tutmamanız önemli.

Önemli not: modelleri arada tire işareti kullanarak girmeniz gerekli. Örneğin: gemini-2.5-flash, gemini-2.0-flash, gemini-2.5-pro

 

2. Detay Seviyesi: Bu ayar, istemin nasıl yazıldığını değiştirir. "Kısa" seçeneği daha az ve öz betimlemeler üretirken, "Detaylı" en kapsamlı betimlemeleri çıkarır.

 

3. Sıcaklık (Temperature): Sıcaklığı yemek üzerinden düşünürsek yanlış olmaz. Yemeği ne kadar fazla ısıtırsak tadı o kadar değişir ya, buradaki "sıcaklık" ayarı da modelin cevaplarını o kadar değişken ve "yaratıcı" yapar. Bu, modele daha fazla özgürlük sunar ve daha duygulu çıktılar almanızı sağlayabilir.

 

4. İstem Seçimi: Kullanacağınız istem, video içeriğiyle ne kadar alakalı olursa o kadar tutarlı betimlemeler alırsınız.

 

Sonuç Olarak...

 

Bu program, "tak-çalıştır" mantığıyla işlemiyor. Bütün özgürlük sizin elinizde. Betimleme kalitesi seçiminize, videoya ve biraz da şansa bağlı. Bazen aynı videoyu iki kere çalıştırmak bile farklı sonuçlar çıkarabilir.

 

Bu programı çok farklı alanlarda kullananlar oldu: Origami yapmaktan çocuklarının ilk adımlarını betimletenlere, yeni yemek tarifleri öğrenenlerden film izleyenlere kadar pek çok kişiden harika mailler alıyorum.

 

Bu yazıyı okuyanların da Omni Betimleyici'yi güzel işlerde kullanmaları dileklerimle...

 

Link: https://audioses.com/tr/yazilimlar.php

 

Yorumlar

Bu yazı için henüz yorum yok.

Yeni Yorum