Belge işleme, bir araştırma alanı ve bir analog belgeyi dijital hale getirmeyi amaçlayan bir dizi üretim sürecidir. Belge işleme, dijital bir görüntü elde etmek için bir belgeyi fotoğraflamayı veya taramayı değil, aynı zamanda onu dijital olarak anlaşılır hale getirmeyi de amaçlar. Bu, belgenin yapısının veya mizanpajının ve ardından metin veya resim biçimini alabilen içeriğin çıkarılmasını içerir. Süreç, geleneksel bilgisayar görme algoritmalarını, evrişimli sinir ağlarını veya el emeğini içerebilir. Ele alınan sorunlar anlamsal bölümlendirme, nesne algılama, optik karakter tanıma (OCR), el yazısı metin tanıma (HTR) ve daha geniş anlamda otomatik olsun veya olmasın transkripsiyon ile ilgilidir.[1] Terim aynı zamanda belgenin bir tarayıcı kullanılarak sayısallaştırılması aşamasını ve örneğin doğal dil işleme (NLP) veya görüntü sınıflandırma teknolojileri kullanılarak belgenin yorumlanması aşamasını da içerebilir. İdari süreçlerin optimizasyonu, posta işleme ve analog arşivlerin ve tarihi belgelerin sayısallaştırılması için birçok endüstriyel ve bilimsel alanda uygulanmaktadır.
Arka Plan
Belge işleme, başlangıçta olduğu gibi, bir dereceye kadar, verilerin tasnif edilmesi, ayıklanması veya büyük ölçüde çıkarılması amacıyla mektuplar ve paketler gibi belgelerin işlenmesiyle ilgili bir tür üretim hattı çalışmasıydı. Bu çalışma şirket içinde veya iş süreci dış kaynak kullanımı yoluyla gerçekleştirilebilir.[2][3] Belge işleme gerçekten de mekanik Türk gibi bir tür dışsallaştırılmış el emeği içerebilir.
Manuel belge işlemeye bir örnek olarak, 2007 gibi nispeten yakın bir tarihte[4], “milyonlarca vize ve vatandaşlık başvurusu” için belge işleme, “posta odasını ve veri girişini yönetmek” için çalışan “yaklaşık 1.000 sözleşmeli işçinin” kullanılmasıyla ilgiliydi.
Belge işleme, bir bilgisayar faresi veya bilgisayar tarayıcısı kullanılmadan çok önce klavye aracılığıyla veri girişini içerirken, The New York Times’da “kağıtsız ofis” olarak adlandırılan 1990 tarihli bir makale, “belge işlemenin tarayıcıyla başladığını” belirtiyordu.[5 ] Bu bağlamda, eski bir Xerox başkan yardımcısı olan Paul Strassman, bilgisayarların bir ofisteki kağıt hacmini azaltmak yerine artırdığını söyleyerek eleştirel bir görüş dile getirdi.[5] Bir uçağın mühendislik ve bakım belgelerinin “uçağın kendisinden daha ağır” olduğu söylendi.
Otomatik belge işleme
Son teknoloji geliştikçe, belge işleme, “belge bileşenlerini … veritabanı varlıkları olarak” işlemeye geçti.[6]
Otomatik belge işleme veya bazen akıllı belge işleme (ID) olarak adlandırılan bir teknoloji, Makine Öğrenimi (ML), Doğal Dil İşleme (NAP) veya Akıllı Karakter Tanıma (ICE) gibi yapay zekayı birleştiren belirli bir Akıllı Süreç Otomasyonu (IPA) biçimi olarak ortaya çıktı. ) çeşitli belge türlerinden veri çıkarmak için.[7][8]
Uygulamalar
Otomatik belge işleme, yapılandırılmış olsun ya da olmasın tüm belgeler için geçerlidir. Örneğin, iş ve finans dünyasında, kağıt tabanlı faturaları, formları, satın alma siparişlerini, sözleşmeleri ve döviz faturalarını işlemek için teknolojiler kullanılabilir.[9] Finans kurumları, düzenleyici formlar veya kredi belgeleri gibi yüksek hacimli formları işlemek için akıllı belge işlemeyi kullanır. ID, manuel veri girişi yerine belgelerden veri ayıklamak ve sınıflandırmak için yapay zekayı kullanır.[10]
Tıpta, özellikle tıbbi veya laboratuvar analiz raporlarını sayısallaştırarak, hasta takibini kolaylaştırmak ve idari prosedürleri kolaylaştırmak için belge işleme yöntemleri geliştirilmiştir. Amaç aynı zamanda tıbbi veritabanlarını standart hale getirmektir.[11] Algoritmalar ayrıca doktorlara tıbbi teşhiste yardımcı olmak için doğrudan kullanılır, örn. manyetik rezonans görüntülerini[12][13] veya mikroskobik görüntüleri[14] analiz ederek.
Belge işleme, tarihsel büyük verileri arşivlerden veya miras koleksiyonlarından çıkarmak için beşeri ve dijital beşeri bilimlerde de yaygın olarak kullanılmaktadır. Gazete arşivleri[15] gibi metin belgelerinin yanı sıra görüntüler[16] veya haritalar[17][18] gibi çeşitli kaynaklar için özel yaklaşımlar geliştirildi.
Teknolojiler
1980’lerden itibaren, belge işleme sorunlarını çözmek için geleneksel bilgisayar görme algoritmaları yaygın olarak kullanıldıysa,[19][20] bunların yerini 2010’larda kademeli olarak sinir ağı teknolojileri aldı.[21] Bununla birlikte, bazı sektörlerde, bazen sinir ağları ile birlikte, geleneksel bilgisayarla görme teknolojileri hala kullanılmaktadır.
Birçok teknoloji, özellikle metnin otomatik olarak kopyalanmasına izin veren optik karakter tanıma (OCR) ve el yazısı metin tanıma (HTR) olmak üzere belge işlemenin geliştirilmesini destekler. Bu tür metin bölümleri, bazen belgenin yapısını algılamak için de kullanılabilen örnek veya nesne algılama algoritmaları kullanılarak tanımlanır. İkinci sorunun çözümü bazen anlamsal bölümleme algoritmalarını da kullanır.
Bu teknolojiler genellikle belge işlemenin çekirdeğini oluşturur. Ancak bu işlemlerden önce veya sonra başka algoritmalar müdahale edebilir. Aslında, ister klasik ister üç boyutlu tarama biçiminde olsun, belge sayısallaştırma teknolojileri de işin içine giriyor.[22] 3D belgelerin sayısallaştırılması, özellikle fotogrametri türevlerine başvurabilir. Bazen, belgelerin boyutuna uyum sağlamak veya tarama ergonomisi nedeniyle belirli 2B tarayıcıların da geliştirilmesi gerekir.[16] Belge işleme aynı zamanda belgelerin uygun bir dosya biçiminde dijital olarak kodlanmasına da bağlıdır. Ayrıca, heterojen veritabanlarının işlenmesi görüntü sınıflandırma teknolojilerine dayanabilir.
Zincirin diğer ucunda çeşitli görüntü tamamlama, ekstrapolasyon veya veri temizleme algoritmaları bulunur. Metin belgeleri için yorumlama, doğal dil işleme (NLP) teknolojilerini kullanabilir.
Kaynak:
https://en.wikipedia.org/wiki/Document_processing
Wiki Kaynaklar:
1)Len Asprey; Michael Middleton (2003). Integrative Document & Content Management: Strategies for Exploiting Enterprise Knowledge. Idea Group Inc (IGI). ISBN 9781591400554.
2)Vinod V. Sople (2009-05-25). Business Process Outsourcing: A Supply Chain of Expertises. PHI Learning Pvt. Ltd. ISBN 978-8120338159.
3)Mark Kobayashi-Hillary (2005-12-05). Outsourcing to India: The Offshore Advantage. Springer Science & Business Media. ISBN 9783540247944.
4)Julia Preston (December 2, 2007). “Immigration Contractor Trims Wages”. The New York Times.
5)Lawrence M. Fisher (July 7, 1990). “Paper, Once Written Off, Keeps a Place in the Office”. The New York Times.
6)Al Young; Dayle Woolstein; Jay Johnson (February 1996). “Unknown Title”. Object Magazine. p. 51.
7)”Intelligent Document processing by Floriana Esposito , Stefano Ferilli , Teresa M. A. Basile , Nicola Di Mauro” (PDF). Department of Computer Science – University of Bari. 2005-04-07. Retrieved 2018-09-08.
8)Floriana Esposito , Stefano Ferilli , Teresa M. A. Basile , Nicola Di Mauro (2005-04-01). “Intelligent Document Processing” in Proceedings. Eighth International Conference on Document Analysis and Recognition, Seoul, South Korea, 2005 pp. 1100-1104. doi: 10.1109/ICDAR.2005.144. doi:10.1109/ICDAR.2005.144. S2CID 17302169.
9)US active US7873576B2, John E. Jones; William J. Jones & Frank M. Csultis, “Financial document processing system”, published 2011-01-18, issued 2011-01-18
10)Bridgwater, Adrian. “Appian Adds Google Cloud Intelligence To Low-Code Automation Mix”. Forbes. Retrieved 2021-04-21.
11)Adamo, Francesco; Attivissimo, Filippo; Di Nisio, Attilio; Spadavecchia, Maurizio (February 2015). “An automatic document processing system for medical data extraction”. Measurement. 61: 88–99. doi:10.1016/j.measurement.2014.10.032. Retrieved 31 January 2021.
12)Changwan, Kim; Seong-Il, Lee; Won Joon, Cho (September 2020). “Volumetric assessment of extrusion in medial meniscus posterior root tears through semi-automatic segmentation on 3-tesla magnetic resonance images”. Orthopaedics & Traumatology: Surgery & Research. 101 (5): 963–968. doi:10.1016/j.rcot.2020.06.003. Retrieved 31 January 2021.
13)Despotović, Ivana; Bart, Goossens; Wilfried, Philips (1 March 2015). “MRI Segmentation of the Human Brain: Challenges, Methods, and Applications”. Computational Intelligence Techniques in Medicine. 2015: 963–968. doi:10.1155/2015/450341. PMC 4402572. PMID 25945121.
14)Putzua, Lorenzo; Caocci, Giovanni; Di Rubertoa, Cecilia (November 2014). “Leucocyte classification for leukaemia detection using image processing techniques”. Artificial Intelligence in Medicine. 63 (3): 179–191. doi:10.1016/j.artmed.2014.09.002. hdl:11584/94592. PMID 25241903.
15)Ehrmann, Maud; Romanello, Matteo; Clematide, Simon; Ströbel, Phillip; Barman, Raphaël (2020). “Language Resources for Historical Newspapers: the Impresso Collection”. Proceedings of the 12th Language Resources and Evaluation Conference. Marseille, France. pp. 958–968.
16)Seguin, Benoit; Costiner, Lisandra; di Lenardo, Isabella; Kaplan, Frédéric (April 1, 2018). “New Techniques for the Digitization of Art Historical Photographic Archives – the Case of the Cini Foundation in Venice”. Archiving 2018 Final Program and Proceedings. Society for Imaging Science and Technology. pp. 1–5. doi:10.2352/issn.2168-3204.2018.1.0.2.
17)Ares Oliveira, Sofia; di Lenardo, Isabella; Tourenc, Bastien; Kaplan, Frédéric (11 July 2019). A deep learning approach to Cadastral Computing. Digital Humanities Conference. Utrecht, Netherlands.
18)Petitpierre, Rémi (July 2020). Neural networks for semantic segmentation of historical city maps: Cross-cultural performance and the impact of figurative diversity (MSc). arXiv:2101.12478. doi:10.13140/RG.2.2.10973.64484.
19)Fujisawa, H.; Nakano, Y.; Kurino, K. (July 1992). “Segmentation methods for character recognition: from segmentation to document structure analysis”. Proceedings of the IEEE. 80 (7): 1079–1092. doi:10.1109/5.156471. Retrieved 3 February 2021.
20)Tang, Yuan Y.; Lee, Seong-Whan; Suen, Ching Y. (1996). “Automatic document processing: a survey”. Pattern Recognition. 29 (12): 1931–1952. doi:10.1016/S0031-3203(96)00044-1. Retrieved 3 February 2021.
21)Ares Oliveira, Sofia; Seguin, Benoit; Kaplan, Frederic (5–8 August 2018). dhSegment: A Generic Deep-Learning Approach for Document Segmentation. 2018 16th International Conference on Frontiers in Handwriting Recognition (ICFHR). Niagara Falls, NY, USA: IEEE. arXiv:1804.10371. doi:10.1109/ICFHR-2018.2018.00011.
22)”Revolutionary Scanning Technology for Art”. Artmyn. Retrieved 3 February 2021.
