Teknobot AI Doğal Dilde Kullanıcı Arabirimi (Natural-language User Interface)

Doğal Dilde Kullanıcı Arabirimi (Natural-language User Interface)

Doğal dil kullanıcı arabirimi (LUI veya NLUI), fiiller, deyimler ve yan tümceler gibi dil olaylarının yazılım uygulamalarında veri oluşturmak, seçmek ve değiştirmek için UI denetimleri olarak işlev gördüğü bir tür bilgisayar insan arabirimidir.

Arayüz tasarımında, hızları ve kullanım kolaylıkları nedeniyle doğal dil arayüzleri aranır, ancak çoğu, çok çeşitli belirsiz girdileri anlamada zorluk çeker.[1] Doğal dil arayüzleri, doğal dil işleme ve hesaplamalı dilbilim alanında aktif bir çalışma alanıdır. Sezgisel bir genel doğal dil arayüzü, Semantik Web’in aktif hedeflerinden biridir.

Metin arabirimleri, değişen derecelerde “doğaldır”. Birçok resmi (doğal olmayan) programlama dili, doğal insan dilinin deyimlerini içerir. Aynı şekilde, geleneksel bir anahtar kelime arama motoru, “sığ” bir doğal dil kullanıcı arabirimi olarak tanımlanabilir.

Genel bakış

Bir doğal dilde arama motoru, teoride kullanıcı sorularına hedeflenmiş yanıtlar bulur (anahtar kelime aramanın aksine). Örneğin ‘hangi ABD” şeklinde bir soru ile karşılaşıldığında. Devlet en yüksek gelir vergisine sahip mi?’, geleneksel arama motorları soruyu görmezden gelir ve bunun yerine ‘devlet’, ‘gelir’ ve ‘vergi’ anahtar kelimelerini arar. Doğal dilde arama ise sorunun doğasını anlamak için doğal dilde işlemeyi kullanmaya ve ardından sorunun yanıtını içeren web’in bir alt kümesini aramaya ve döndürmeye çalışır. Çalışırsa, dahil edilen soru nedeniyle, sonuçlar bir anahtar kelime arama motorunun sonuçlarından daha yüksek bir alaka düzeyine sahip olacaktır.

Tarihi

Prototip Nl arabirimleri, altmışların sonlarında ve yetmişlerin başlarında zaten ortaya çıkmıştı.[2]

SHRDLU, sanal bir “bloklar dünyasında” blokları yöneten bir doğal dil arabirimi
Ay, William A. Woods tarafından Apollo-11 ay kayalarının kimyasal analizlerini içeren bir veritabanına doğal dil arayüzü.
Chat-80, İngilizce soruları Prolog veritabanına göre değerlendirilen Prolog ifadelerine dönüştürdü. Chat-80’in kodu geniş çapta dağıtıldı ve diğer birkaç deneysel Nl arayüzünün temelini oluşturdu. LPA web sitesinde çevrimiçi bir demo mevcuttur.[3]
1964 ile 1966 yılları arasında Joseph Weizenbaum tarafından MIT’de yazılan ELIZA, bir psikoterapisti taklit etti ve kullanıcıların senaryolara verdiği yanıtları işleyerek işletildi. İnsan düşüncesi veya duyguları hakkında neredeyse hiçbir bilgi kullanmayan DOCTOR senaryosu bazen şaşırtıcı derecede insan benzeri bir etkileşim sağlıyordu. LPA web sitesinde çevrimiçi bir demo mevcuttur.[4]
Janus ayrıca zamansal soruları destekleyen birkaç sistemden biridir.
Trinzic’ten akıl (AICorp ve Aion’un birleşmesiyle oluşturulmuştur).
BBN’nin Parlance’i, Rus ve Irus sistemlerinin geliştirilmesinden elde edilen deneyime dayanmaktadır.
IBM Dil Erişimi
Symantec’ten Soru-Cevap.
Natural Language Inc.’den Datatalker
BIM Systems’den Loqui.
Linguistic Technology Corporation’dan İngiliz Sihirbazı.

Zorluklar

Doğal dil arayüzleri, geçmişte kullanıcıların bilgisayarı antropomorfize etmesine veya en azından makinelere garanti edilenden daha fazla zeka atfetmesine yol açmıştır. Kullanıcı tarafında bu, sistemin yeteneklerine ilişkin gerçekçi olmayan beklentilere yol açmıştır. Bu tür beklentiler, kullanıcılar sisteme çok fazla yetenek atfederse sistemin kısıtlamalarını öğrenmeyi zorlaştıracak ve 1970’lerin AI kışında olduğu gibi sistem beklendiği gibi performans göstermediğinde nihayetinde hayal kırıklığına yol açacaktır.

80’ler

1995 tarihli ‘Natural Language Interfaces to Databases – An Introduction’ başlıklı bir makale bazı zorlukları açıklıyor:[2]

Değiştirici eki
Şirketlerin ehliyet sahibi olamayacağını bilmediğiniz sürece “Şirketteki tüm ehliyetli çalışanları listeleyin” talebi belirsizdir.

Birleşme ve ayrılma
Bir kişinin aynı anda iki yerde yaşayamayacağını bilmediğiniz sürece “Kaliforniya ve Arizona’da yaşayan tüm başvuru sahiplerini listeleyin” belirsizdir.

Anaphora çözünürlüğü
Kendine referanslı bir sorguda bir kullanıcının “o”, “o” veya “o” ile ne kastettiğini çöz.

Daha genel olarak dikkate alınması gereken diğer hedefler, arayüzün hızı ve verimliliğidir, tüm algoritmalarda bu iki nokta, bazı yöntemlerin diğerlerinden daha iyi olup olmadığını ve dolayısıyla pazarda daha başarılı olup olmadığını belirleyecek ana noktadır. Ek olarak, birden çok dil sitesinde yerelleştirme ekstra dikkat gerektirir – bu, çoğu dil arasındaki farklı cümle yapısı ve dil sözdizimi varyasyonlarına dayanır.

Son olarak, kullanılan yöntemlerle ilgili olarak, çözülmesi gereken asıl sorun, milliyet, cinsiyet veya yaşı dikkate almadan farklı seslerin tüm yelpazesini tanıyabilen genel bir algoritma oluşturmaktır. Çıkarılan özellikler arasındaki önemli farklar – aynı kelimeyi veya tümceyi söyleyen konuşmacılardan bile – başarılı bir şekilde aşılmalıdır.

 

Kullanımlar ve uygulamalar

Doğal dil arayüzü, birçok farklı uygulama için kullanılan teknolojinin ortaya çıkmasına neden olur.

Ana kullanımlardan bazıları şunlardır:

Dikte, günümüzde otomatik konuşma tanıma (ASR) sistemlerinin en yaygın kullanımıdır. Buna tıbbi transkripsiyonlar, yasal ve ticari dikte ve genel kelime işleme dahildir. Bazı durumlarda, sistemin doğruluğunu artırmak için özel sözlükler kullanılır.
Komuta kontrol, sistem üzerinde görev ve eylemleri gerçekleştirmek üzere tasarlanmış ASR sistemleri, komuta kontrol sistemleri olarak tanımlanır. “Netscape’i Aç” ve “Yeni bir xterm başlat” gibi ifadeler tam da bunu yapacaktır.
Telefon, bazı PBX/Sesli Posta sistemleri, arayanların belirli tonlar göndermek için düğmelere basmak yerine komutları söylemesine izin verir.
Giyilebilir cihazlar, giyilebilir cihazlar için girdiler sınırlı olduğundan, konuşmak doğal bir olasılıktır.
Tıbbi, engelli, birçok kişi, tekrarlayan zorlanma yaralanmaları (RSI), kas distrofisi ve diğerleri gibi fiziksel sınırlamalar nedeniyle yazmakta zorluk çekiyor. Örneğin, işitme güçlüğü çeken kişiler, arayanın konuşmasını metne dönüştürmek için telefonlarına bağlı bir sistem kullanabilir.
Gömülü uygulamalar, bazı yeni cep telefonları, “eve dön” gibi ifadelere izin veren C&C konuşma tanıma özelliğini içerir. Bu, otomatik konuşma tanıma ve Linux’un geleceğinde önemli bir faktör olabilir.
Yazılım geliştirme: Entegre bir geliştirme ortamı, geliştiricilere yardımcı olmak için doğal dil arayüzlerini yerleştirebilir.[5]

Aşağıda, doğal dil tanımayı kullanan ve dolayısıyla yukarıda listelenen tümleşik yardımcı programlara sahip uygulamaların bazıları adlandırılmış ve tanımlanmıştır.

Ubiquity (Firefox)

Mozilla Firefox için bir eklenti olan Ubiquity, web hizmetlerinin bir karışımı gibi davranan, böylece kullanıcıların bilgi almasına ve mevcut ve diğer web sayfalarıyla ilişkilendirmesine olanak tanıyan, hızlı ve kolay doğal dilden türetilen komutların bir koleksiyonudur.

Wolfram Alfa

Wolfram Alpha, bir arama motorunun yapacağı gibi yanıtı içerebilecek belgelerin veya web sayfalarının bir listesini sağlamak yerine, yapılandırılmış verilerden yanıtı hesaplayarak gerçek sorguları doğrudan yanıtlayan çevrimiçi bir hizmettir.[6] Mart 2009’da Stephen Wolfram tarafından duyuruldu ve 15 Mayıs 2009’da halka açıklandı.[7]

Siri

Siri, iOS işletim sistemiyle entegre akıllı bir kişisel asistan uygulamasıdır. Uygulama, soruları yanıtlamak ve önerilerde bulunmak için doğal dil işlemeyi kullanır.

Siri’nin pazarlama iddiaları arasında, kullanıcının kişisel tercihlerine zaman içinde uyum sağladığı ve sonuçları kişiselleştirdiği ve taksi tutmaya çalışırken akşam yemeği rezervasyonu yapmak gibi görevleri yerine getirdiği yer alıyor.[8]

 

Diğerleri

Ask.com – Ask Jeeves’in (Ask.com) arkasındaki orijinal fikir, günlük, doğal dilde sorulan sorulara yanıt alma becerisiyle geleneksel anahtar kelime aramasıydı. Mevcut Ask.com, matematik, sözlük ve dönüştürme soruları için ek destekle bunu hala desteklemektedir.
Braina[9] – Braina, belirli bir eylemi gerçekleştirmek veya bilgi bulmak için İngilizce cümleler yazmaya veya konuşmaya izin veren, Windows işletim sistemi için doğal bir dil arabirimidir.
GNOME Do – GNOME ortamının çeşitli yapılarını (uygulamalar, Evolution ve Pidgin kişileri, Firefox yer imleri, Rhythmbox sanatçıları ve albümleri vb.) vb.).[10]
hakia – hakia bir İnternet arama motoruydu. Şirket, ontolojik semantik, bulanık mantık, hesaplamalı dilbilim ve matematik disiplinlerinden bir çözüm karışımı olan SemanticRank algoritmasını kullanan dizin oluşturmaya alternatif yeni bir altyapı icat etti. hakia 2014’te kapandı.
Lexxe – Lexxe, sorgular için doğal dil işlemeyi (anlamsal arama) kullanan bir İnternet arama motoruydu. Anahtar kelimeler, deyimler ve “Wikipedia kaç yaşında?” gibi sorularla arama yapılabilir. Lexxe, arama motoru hizmetlerini 2015 yılında kapattı.
Pikimal – Pikimal, şablona göre arama önerileri yapmak için kullanıcı tercihine bağlı doğal dili kullandı. Pikimal 2015’te kapandı.
Powerset – 11 Mayıs 2008’de şirket, Wikipedia’nın sabit bir alt kümesinde anahtar kelimeler yerine konuşma cümleleri kullanarak arama yapmak için bir araç tanıttı.[11] 1 Temmuz 2008’de Microsoft tarafından satın alındı.[12]
Q-go – Q-go teknolojisi, bir şirketin internet web sitesinde veya kurumsal intranetinde, doğal cümleler veya benzer şekilde anahtar kelime girişi şeklinde formüle edilmiş sorgulara yanıt olarak kullanıcılara ilgili yanıtlar sağlar. Q-go, 2011 yılında RightNow Technologies tarafından satın alındı.
Yebol – Yebol, bilgiye dayalı, anlamsal bir arama platformu geliştirmiş olan dikey bir “karar” arama motoruydu. Yebol’un yapay zeka insan zekası ile aşılanmış algoritmaları, arama sonuçlarını, web sitelerini, sayfaları ve sunduğu içeriği, başlangıçtaki insan niyetiyle daha uyumlu, görsel olarak indekslenmiş bir biçimde otomatik olarak kümeledi ve kategorize etti. Yebol, ilgili anahtar kelimeleri veya web sayfalarını analiz etmek için ilişkilendirme, sıralama ve kümeleme algoritmalarını kullandı. Yebol, korelasyon, kümeleme ve sınıflandırma algoritmalarını kullanarak bilgi sorgusunu otomatik olarak oluşturmak için gerçekten ‘öğrenen’ bir web dizini oluşturmak için her sorgu için doğal dil işleme, metasentetik mühendislik ürünü açık karmaşık sistemler ve makine algoritmalarını insan bilgisiyle entegre etti. tutuldu ve ileriye doğru yeniden oluşturuldu.

 

Kaynak:
https://en.wikipedia.org/wiki/Natural-language_user_interface

Wiki Kaynaklar:
1)Hill, I. (1983). “Natural language versus computer language.” In M. Sime and M. Coombs (Eds.) Designing for Human-Computer Communication. Academic Press.
2)Natural Language Interfaces to Databases – An Introduction, I. Androutsopoulos, G.D. Ritchie, P. Thanisch, Department of Artificial Intelligence, University of Edinburgh
3)”Chat-80 demo”. Archived from the original on 11 November 2016. Retrieved 29 January 2018.
4)”ELIZA demo”. Archived from the original on 26 November 2016. Retrieved 29 January 2018.
5)Kimmig, Markus; Monperrus, Martin; Mezini, Mira (2011). “Querying source code with natural language”. 2011 26th IEEE/ACM International Conference on Automated Software Engineering (ASE 2011). pp. 376–379. arXiv:1205.6361. doi:10.1109/ase.2011.6100076. ISBN 978-1-4577-1639-3. S2CID 6898947.
6)Johnson, Bobbie (2009-03-09). “British search engine ‘could rival Google'”. The Guardian. Retrieved 2009-03-09.
7)”So Much for A Quiet Launch”. Wolfram Alpha Blog. 2009-05-08. Retrieved 2009-10-20.
8)”iOS – Siri”. Apple. Retrieved 29 January 2018.
9)”Braina – Artificial Intelligence Software for Windows”. www.brainasoft.com. Retrieved 29 January 2018.
10)Ubuntu 10.04 Add/Remove Applications description for GNOME Do
11)Helft, Miguel (May 12, 2008). “Powerset Debuts With Search of Wikipedia”. The New York Times.
12)Johnson, Mark (July 1, 2008). “Microsoft to Acquire Powerset”. Powerset Blog. Archived from the original on February 25, 2009.
13)Humphries, Matthew. “Yebol.com steps into the search market” Archived 2012-03-15 at the Wayback Machine Geek.com. 31 July 2009.

İlgili Yazılar

Görüntü işlemeGörüntü işleme

Görüntü işleme isim (Almanca Bildbearbeitung) ölçülmüş veya kaydedilmiş olan elektronik (dijital) görüntü verilerini, elektronik ortamda (bilgisayar ve yazılımlar yardımı ile) amaca uygun şekilde değiştirmeye yönelik yapılan bilgisayar çalışması. Görüntü işleme,