Teknobot AI Diller Arası Bilgi Erişimi (Cross-Language Information Retrieval)

Diller Arası Bilgi Erişimi (Cross-Language Information Retrieval)

Diller arası bilgi alma (CLIR), kullanıcının sorgu dilinden farklı bir dilde yazılmış bilgilerin alınmasıyla ilgili bir bilgi alma alt alanıdır.[1] “Diller arası bilgi erişimi” terimi birçok eşanlamlıya sahiptir ve bunlardan belki de en sık olanları şunlardır: diller arası bilgi erişimi, diller arası bilgi erişimi, çok dilli bilgi erişimi. “Çok dilli bilgi erişimi” terimi, daha genel olarak, hem çok dilli koleksiyonların geri alınması için teknolojiye hem de bir dildeki materyali başka bir dile taşımak için taşınan teknolojiye atıfta bulunur. Çok Dilde Bilgi Erişimi (MLIR) terimi, çeşitli dillerdeki bilgi sorgularını kabul eden ve çeşitli dillerden kullanıcının diline çevrilmiş nesneleri (metin ve diğer ortamlar) döndüren sistemlerin incelenmesini içerir. Diller arası bilgi alma, daha spesifik olarak, kullanıcıların bilgi ihtiyaçlarını bir dilde formüle ettikleri ve sistemin ilgili belgeleri başka bir dilde aldığı kullanım durumunu ifade eder. Bunu yapmak için çoğu CLIR sistemi çeşitli çeviri teknikleri kullanır. CLIR teknikleri, farklı çeviri kaynaklarına göre farklı kategorilerde sınıflandırılabilir:[2]

Sözlük tabanlı CLIR teknikleri
Paralel derlem tabanlı CLIR teknikleri
Karşılaştırılabilir derlem tabanlı CLIR teknikleri
Makine çevirmeni tabanlı CLIR teknikleri

CLIR sistemleri o kadar gelişti ki, günümüzde en doğru çok dilli ve diller arası adhoc bilgi alma sistemleri neredeyse tek dilli sistemler kadar etkilidir.[3] Medya izleme, bilgi filtreleme ve yönlendirme, duyarlılık analizi ve bilgi çıkarma gibi diğer ilgili bilgi erişim görevleri, daha karmaşık modeller ve genellikle ilgilenilen bilgi öğelerinin daha fazla işlenmesini ve analiz edilmesini gerektirir. Bu işlemenin çoğunun konuşlandırıldığı hedef dillerin özelliklerinin farkında olması gerekir.

Çoğunlukla, insan dilindeki çeşitli varyasyon mekanizmaları, bilgi erişim sistemleri için kapsam zorlukları ortaya çıkarır: bir koleksiyondaki metinler, ilgi konusu bir konuyu ele alabilir, ancak kullanıcı tarafından verilen bilgi ihtiyacının ifadesiyle eşleşmeyen terimler veya ifadeler kullanabilir. Bu, tek dilli bir durumda bile doğru olabilir, ancak bu özellikle kullanıcıların hedef dili yalnızca bir dereceye kadar bildikleri diller arası bilgi alma için geçerlidir. CLIR teknolojisinin hedef dilde yeterliliği zayıf ve orta düzeyde olan kullanıcılar için sağladığı faydaların, akıcı olanlara göre daha fazla olduğu bulunmuştur.[4] CLIR hizmetleri için yürürlükte olan belirli teknolojiler, bileşik terimleri işlemek için çekim, ayrıştırma veya bileşik bölmeyi işlemek için morfolojik analizi ve bir sorguyu bir dilden diğerine çevirmek için çeviri mekanizmalarını içerir.

CLIR ile ilgili ilk çalıştay Zürih’te SIGIR-96 konferansı sırasında düzenlendi.[5] 2000 yılından bu yana her yıl Çapraz Dil Değerlendirme Forumu (CLEF) toplantılarında çalıştaylar düzenlenmektedir. Araştırmacılar ayrıca, farklı bilgi alma sistemleri ve yöntemleriyle ilgili bulgularını tartışmak için yıllık Metin Erişim Konferansı’nda (TREC) bir araya gelirler ve konferans, CLIR alt alanı için bir referans noktası işlevi görmüştür.[6]

Google Arama, 2013’te kaldırılan bir diller arası arama özelliğine sahipti.[7]


Kaynak:

https://en.wikipedia.org/wiki/Cross-language_information_retrieval

 

Wiki Kaynak:

1)Wang, Jianqiang, and Douglas W. Oard. “Matching meaning for cross-language information retrieval.” Information Processing & Management48.4 (2012): 631-53.
2)Tsai, Peishan. “An Introduction to Cross-Language Information Retrieval Approaches”. www.mikeandpeishan.com. Archived from the original on 2022-11-04. Retrieved 2022-11-04.
3)Oard, Douglas. “Multilingual Information Access.” Understanding Information Retrieval Systems(2011): 373-80. Web.
4)Airio, Eija (2008). “Who benefits from CLIR in web retrieval?”. Journal of Documentation. 64 (5): 760–778. doi:10.1108/00220410810899754.
5)The proceedings of this workshop can be found in the book Cross-Language Information Retrieval (Grefenstette, ed; Kluwer, 1998) ISBN 0-7923-8122-X.
6)Olvera-Lobo, María-Dolores. “Cross-Language Information Retrieval on the Web.” Handbook of Research on Social Dimensions of Semantic Technologies and Web Services(n.d.): 704-19. Web.
7)”Google Drops “Translated Foreign Pages” Search Option Due To Lack Of Use”. 20 May 2013.

İlgili Yazılar

Durum Tabanlı ÇıkarsamaDurum Tabanlı Çıkarsama

Durum tabanlı çıkarsama (case-based reasoning), geçmişte karşılaşılan benzer problemlerin çözümlerinden yararlanılarak problem çözme yöntemidir. Süreç Durum tabanlı çıkarsama, dört adımdan oluşur, bunlar: Getir (Retrieve): Yeni problem ile ilgili geçmişte karşılaşılan