Bilgisayarımızda Yapay Zeka İle Betimleme Alma

Toplam Okunma 225

 

 

Selamlar. Bu ay belki de çoğunuzun bildiği bir konuyla geldim karşınıza: Bilgisayar üzerinden yapay zeka ile betimleme almak. Hayat ne kadar kısa dimi? Geçen yıl bu aylarda Be My Eyes Yapay zeka betimlemeleri yapmaya başlayınca yaşanan heyecan ve coşkunun üzerinden çok uzun süre geçmiş gibi hissediyor insan

 Ama topu topu bir yıl ancak geçmiş. Geçen yıl hep yeni betimleme deneme yanılmalarıyla geçirdik gümlerimizi. Tüm süreçler mobil tarafta döndüğünden eski dostumuz bilgisayar ile bu işin ne zaman başlayacağını herkes sorgulamaya başlamıştı bile. Beklediğimizi almak bu seneye nasip oldu. Önce Be My Eyes bir bilgisayar uygulaması çıkardı, JAWS, Mart güncellemesiyle birlikte akıllı resim tanıma sürecine resmen dahil oldu. Bu yazıda pratik olarak bu iki sistemle nasıl betimleme alıyoruz kısaca anlatmak istedim.

  • Be My Eyes ile başlayalım dilerseniz Başlat menüsüne store yazıp gelen uygulamayı açtıktan sonra Ctrl+F yazarak gelen arama alanına Be My yazdıktan sonra, gelen sonuçlardan Be My Eyes uygulamasına tıklıyoruz. Sonra İndir diyoruz. Uygulamayı açtıktan sonra giriş bağlantısına tıklayarak bilgilerimizle giriş yaptıktan sonra basit bir ara yüzle uygulama karşımızda. Tab ile dolaşırken şu kontroller bizimle.
  • Ekranımı Tanımlayın (Alt+Ctrl+H): adı üzerinde o an bulunulan ekranın resmini çekip betimliyor. Be My Eyes açıksa herhangi bir yerde bu kısayol tuşuna basabilirsiniz. Böylece bulunduğunuz ekran betimlenir ve soru sorma alanına gelirsiniz. Buraya başka sorular yazarak da sohbeti ilerletebilirsiniz.
  • Resim Çek (Alt+Ctrl+J): bilgisayarınızın web kamerasını kullanarak resim çekmenizi ve betimleme almanızı sağlıyor.
  • Resmi tanımla (Alt+Ctrl+K): herhangi bir klasörde bir resim dosyası üzerinde bu tuşu kullanarak betimleme alabiliyorsunuz.
  • Panoyu tanımla (Alt+Ctrl+L): adından da anlayacağınız gibi o an panoya kopyalanmış olan içeriğin betimlemesiyle ilgili. Ancak bu içeriğin adresini panoya kopyalarsanız çalışıyor. Aksi halde pano boş deniyor

Burada güzel olan şey Be My Eyes uygulamasının arka planda açık olmasının yeterli oluşu. Sonrasında bu tuşları herhangi bir noktada kullanarak betimleme alabiliyor, bunu sorularla geliştirebiliyoruz. Yani klasik Be My Eyes ara yüzünün bilgisayar versiyonu Denilebilir.

 

Gelelim JAWS For Windows’a. Bence geç kaldılar epey ama nihayet onlar da akıllı resim tanıma özelliğini mart güncellemesiyle birlikte sundular, mayıs ve Temmuz güncellemelerinde de geliştirdiler. Aslında JAWS’ın zaten basit düzeyde resim betimlemesi özelliği 2021 sürümünden beri mevcut. Ama dediğim gibi eski ilkel betimlemeler. Mart güncellemesiyle birlikte bu betimlemeleri artık GPT ve Cloud üzerinden almaya başladılar. İlk güncellemede Gemini de vardı betimleme servisleri arasında ama o kadar kötü betimleme yapıyor ki, herhalde şimdilik kullanmaktan vazgeçtiler. JAWS ile de her nerede olursanız olun, aşağıda vereceğim kısayollar ile hızlıca betimleme alabiliyorsunuz. JAWS’ın bir katmanı var ve bu katman JAWS tuşu+boşluk ile açılıyor. Bu katmanda OCR yapma, kulaklık sesinin geleceği yeri ayarlama gibi pek çok işlevin yanında resim tanıma da var. Yani önce JAWS tuşu+boşluğa, sonra P harfine bastığınızda, akıllı resimle ilgili bölüme ulaşmış oluyorsunuz. Yani aşağıda vereceğim tuşlara basmadan önce JAWS Tuşu+boşluk ve sonra P harfine basmayı unutmayın. Bu tuşlara Shift ile basarsanız daha detaylı betimleme alabilirsiniz. Alt ile birlikte basarsanız, bu durumda önce soru soracağınız bir yazım kutusu karşınıza çıkar. Buraya sorunuzu yazıp girişe basarak daha nokta atışı bir betimleme alabilirsiniz.

  • Enter: bu tuş temmuz güncellemesiyle gelmiş. Neyin betimleneceğini kendisi ayarlıyor. Eğer bir resim dosyası üzerindeyseniz, onu betimliyor. Bir web kontrolü üzerindeyseniz onu betimliyor. Bir nevi kullanıcıyı fazla sayıda tuş ezberlemekten kurtarma amacı taşıyor. Ama ne derece başarılı onu kullanıp görmek lazım. Yalnız önemli bir noktayı da paylaşayım. Temmuz güncellemesiyle birlikte tuşlara alt tuşunu da ekleyerek basarsanız, yani enter yerine Alt+Enter yaparsanız bu durumda önce karşımıza bir soru sorma alanı açılıyor. Buraya sorumuzu sorup yine enter yaptıktan sonra betimleme sorumuza göre geliyor. Ben bu özelliği sıkça kullandım alakasız betimleme almamak adına.
  • C: üzerinde bulunduğunuz bağlantı veya kontrolün betimlemesini sağlıyor. Dediğim gibi Alt ille birlikte basarsak soru ekranıyla birlikte açılıyor. Önemli bir not daha bu tuşlara Shift ile birlikte basarsak örneğin Shift+C daha detaylı betimleme geliyor.
  • W: o anki uygulama penceresini betimliyor.
    S: tüm ekranın betimlemesini sağlıyor.
  • B: Pano içeriğini betimliyor.
  • A: web kamerası aracılığıyla resim çekmemizi sağlıyor.

 

Tekrar hatırlatayım bu tuşlara Shift ile bastığımızda daha detaylı betimleme alıyoruz. Alt ile bastığımızda soru sorarak betimleme alabiliyoruz. Ha Bu arada her betimleme ekranında ek sorular sorma şansımız  da var.

Ben kişisel olarak JAWS betimlemelerini daha verimli kullanıyorum. Özellikle baştan soru sorabilme şansı avantajımı arttırıyor. Geçenlerde Biletini Al sitesinde ekran betimlemesi alıp boş koltukları öğrendiğim bir video paylaşmıştım. Bu tarz farklı kullanım senaryoları ekran okuyucuların geleceği noktasında umut verici.

 

Yorumlar

Bu yazı için henüz yorum yok.

Yeni Yorum