BAŞA DÖN

ONTOLOJİ NEDİR

1  ONTOLOJİ NEDİR

1.1 Taksonomi ve Ontoloji

Ontoloji bazen taksonomi ile karıştırılabilmektedir. Taksonomi bir alana (domain) ait verilerin sınıflanmasından ibarettir. Ontoloji ise daha geniş olup; kavramlar arasındaki ilişkiler ile kısıtları tanımlayarak bilginin ortak bir terminoloji kullanılarak paylaşılmasını sağlar.

Örneğin belge  ve doküman yönetimi alanında bir ontoloji tanımlanmak istenirse; belgeler, belge türleri ve aralarındaki ilişkiler ile kısıtların tanımlanması yeterli olacaktır. Dolayısıyla her alana özgü ontolojiler de birbirinden farklı olacaktır.

1.2 Varlık Felsefesi Olarak Ontoloji Kavramı

Ontoloji (varlık felsefesi) varlığı var olmak bakımından ve ne olduğunu inceleyen, varlığın temel özelliklerini konu alan felsefe dalıdır. Ontoloji; bir şeyin genel olarak özünü, cismin özünü, özelliklerin özünü, ilişkilerin özünü araştırırken “Bir şey nedir?”, “Bir özellik nedir?” ve “Bir ilişki nedir?” sorularını cevaplamaya çalışır. Bu türden sorulara verilecek cevaplar ‘şey’, ‘cisim’, ‘ilişki’ terimlerinin “Bir cisim şu şudur” gibi tanımlarından ibarettir. Felsefe soyut varlığı ele almasına karşın bilim, bunun aksine somut varlığı ele alır ve bunu bir bütün olarak değil parçalara ayırarak inceler.

1.3 Bilgi Teknolojilerinde Ontoloji Kavramı

Bilgi teknolojileri alanında ontoloji belirli bir bilgi alanındaki (domain) varlıkların, kavramsal olarak anlamlarını ve aralarındaki ilişkileri içeren bir sözlük olarak tanımlanabilir. Veri ve bilginin anlamını ifade ederek bilgisayarlara (yazılım) tanıtmak ontoloji kullanmak ile başarılabilir. Ancak, böylelikle veri/bilgi, etmen (agent) yazılımlar veya çıkarsama servisleri tarafından algılanıp kullanılabilir.

Burada bilgi alanından kasıt, ortak kavramların kullanıldığı süreçler veya alanlardır. Ontoloji, sadece sınıflar hakkında bilgi içermekle kalmayıp aynı zamanda sınıfların öznitelikleri, sınıf ve öznitelikler arasındaki ilişkiler ile sınıf ve özniteliklerin birer örneklerini içerir. Bu çalışma kapsamında özniteliklere ait örnek değerler yapılmamıştır. Ontoloji, bir veri/bilgi etki alanı oluşturmak amacıyla, kavramlar veya nesne sınıfları tanımlamak için kullanılan bir dil veya mekanizmadır. Ontolojilerin ana özelliklerinden birisi diğer ontolojiler tarafından kullanılabilmesidir.

Ontoloji ortak bir kavramsallaştırmanın açık ve biçimsel gösterimidir[1]. Kavramsallaştırma, dünya üzerinde gözlemlenebilen herhangi bir olaya veya duruma ait kavramların belirlenmesiyle, bu olay veya durumun soyut bir modelini oluşturma anlamına gelir. Gösterimin açık olması, kullanılan kavramların tipinin ve bu kavramların kullanımıyla ilgili kısıtların açıkça belirtilmesidir. Biçimsel gösterim, yaratılan ontolojinin makineler tarafından okunabildiği anlamına gelir.

Kavramsallaştırmanın ortak olması ise, ontolojinin genel olarak kabul edilmiş bilgiyi modellemesi  olarak algılanabilir. Ontolojiler, tanımlamalar ve sınıflar olmak üzere iki yapı ile ifade edilirler.

Tanımlamalar, uzmanlar tarafından geliştirilirler ve ayırt edici özelliklerine (bölümler, fonksiyonlar ve öznitelik bilgileri) ve anlamsal ilişkilerine (parçasıdır, bütünüdür, bir –şey-dir/dır) göre depolanırlar. Bu yapı vasıtasıyla mevcut bilginin anlamı hakkında bilgi sağlanır. Bu sayede kullanıcılar, veri tabanında ne olduğunu sorgulayarak öğrenebilirler. Sınıflar ise, ontolojilerin gerçeklenmesinin bir sonucudur. Ontolojiler, değişik alanların belirli özelliklerini tanımlamak için sınıflandırılabilir.

Bilgisayar biliminde ontolojiler;

  • Üst seviye ontolojiler
  • Orta seviye ontolojiler
  • Alan ontolojileri

olarak üç grupta toplanırlar.

Üst seviye ontolojiler, orta seviye ve alan ontolojilerinin her ikisi için de kullanılabilecek kavramları kapsamaktadır. Üst seviye ontolojisi bütün alanlarda aynı olan çok genel kavramları tanımlar. Genellikle bu kavramlar, bütün alanlarda benzer olan varlıklar ve kurallar sınıflarından oluşmaktadır. Üst seviye ontolojiler, farklı kaynaklardan elde edilen heterojen bilginin birleştirilmesinde anahtar bir teknoloji olarak kullanılmaktadır. Üst seviye ontolojilerinin kullanım amacı, ontolojiler arasında anlamsal birlikte çalışabilirliğin desteklenmesidir. Daha belirli alan ontolojileri için bir temel role sahiptir.

Bazı üst seviye ontolojiler ile üst veri standartlarının bazı temel elemanlarının eşlenmesine ihtiyaç duyulmaktadır. Bu eşleme işlemi, üst veri elemanlarının tanımlayıcı özelliklerinin geliştirilmesine yardımcı olmaktadır. Dublin Core, web ortamında bilgi kaynaklarının tanımlanması için kullanılan bir üst veri standardıdır. On beş adet üst veri elemanından oluşan bir kümedir. Elektronik belge yönetim standardıyla belirlenen üst veriler de belgelerin tanımlanması için kullanılan bir küme oluşturur. Üst veri elemanları için temel modeller olarak üst seviye ontolojilerin kullanımı, bilgi gösteriminin yeniden kullanımı için önemlidir.

Orta seviye ontolojiler, alan ontolojileri içinde belirlenen alt seviyedeki alana özel kavramlar ile üst seviye ontolojilerinde tanımlı soyut kavramlar arasında bir köprü görevi görmektedir. Herhangi bir seviyede ontoloji eşlemesi gerçekleşebilir. Orta seviye ontolojiler ile üst seviye ontolojiler arasındaki eşleme alanları arasında kavramlar eşlemeyi sağlar. Orta seviye ontolojiler, üst seviye ontolojilerindeki soyut kavramların daha somut gösterim şeklidir. Böylece bu ontoloji kategorisi, ortak olarak kullanılan kavramları gösteren ontoloji kümelerini kapsar. Orta seviye ve üst seviye ontolojilerin kullanımı, alan ontolojilerinin eşlenmesi veya birleştirilmesi işlemlerinde kolaylıklar sağlamaktadır.

Alan ontolojisi ise, belirli alana özel kavramları ve kavramların ilişkilerini gösterir. Aynı kavramlar birçok alanda varken, kavramların gösterimi alan içeriklerinin farklılıklarından dolayı değişmektedir. Alan ontolojileri, orta seviye veya üst seviye ontolojilerinde tanımlanan kavramların eklenmesiyle genişleyebilir. Daha belirli alan ontolojileri için üst seviye ontolojileri temel rol oynamaktadır.

1.4 Ontolojiye Neden İhtiyaç Duyulur

Web’de anahtar kelimeye dayalı olarak bilgiye erişim sunan arama motorları günümüz web siteleri için kullanılan temel araçlardır. Web siteleri için kullanılan bu araçlar, bilgi yönetiminde büyük başarılar sağlayamamaktadır.

Bunun nedenleri aşağıda sıralanmıştır:

  • Bilgi arama

Web sitelerinde bilgi araması genellikle anahtar kelimelere dayanan arama motorları sayesinde gerçekleşir. Anahtar kelimeye dayalı olarak bilgi arama sürecinde kişi ve kurumların konuyla doğrudan ilgili bilgilere ulaşması zordur.

  • Bilgiye erişim

Web siteleri için anahtar kelimeye dayalı tarama sayesinde belgelere ulaşım, hem zaman hem de enerji kaybı anlamına gelmektedir. Anahtar kelimeye dayalı aramalar, farklı anlamlara sahip, fakat yazılışları aynı olan terimlerin yer aldığı konuyla ilgili olmayan gereksiz birçok bilgiye erişim sağlar. Aynı şekilde, aynı anlama gelip farklı terimlerle ifade edilen bilgilere de erişimi engeller.

  • Bilgi ediniminin sürdürülmesi

Web sitelerinde aranan bilgilere ilişkin terminolojideki tutarsızlıklar olumsuzluğa neden olur.

  • Bilginin açığa çıkışı ve görülmesi

Kurumlara ilişkin veri tabanlarındaki mevcut yeni bilgilerin veri madenciliği kullanılarak alenen ortaya çıkışı bir olumsuzluktur. Yine belli bilgiler saklansa bile web üzerinde yer alan veri tabanlarından bilgiye erişilebilmesi mümkündür. Bu durum kurum ve çalışanlarına ait bazı bilgilere erişimin sınırlandırılmasını gerektirmektedir,

Günümüz web sitelerine ilişkin tüm bu olumsuzluklar, bilgi yönetimi sistemlerinde önemli zayıflıklar olduğunu göstermektedir. Semantik web teknolojileri bu olumsuzluklara çözüm olarak düşünülmektedir.

1.5 Anlamsal (Semantik) Web

Anlamsal web’in (web 3.0) temel yapı taşı kavramları ve ilişkileri tanımlayan ontolojilerdir. Anlamsal web, web’deki veriyi hem insanların okuyabileceği hem de makinelerin anlayabileceği şekilde tanımlar ve bağlar. Bilgi gösterimi, bilgi getirme, veritabanları, çok etmenli sistemler, doğal dil işleme ve makine öğrenimi gibi birçok alanı kapsayan anlamsal web, web bilgisinin anlamını modeller.

Web sitelerinin 1990–2000 yılları arasındaki dönemi kapsayan ilk jenerasyonu HTML sayfalarının sunucu üzerinden yayınlanması biçimindedir. 2000 yılında başlayan web 2.0 ise, önceki jenerasyondan daha dinamik ve daha interaktif  belgelerin yer aldığı sitelerden oluşur. Anlamsal web öncesi web siteleri, insanların okuması için bilginin nasıl gösterileceğini ve web sayfalarında bu bilgilerin nasıl düzenleneceğini tanımlayan HTML’ ye dayanmaktadır. HTML’ ye dayalı web sitelerinde bilgiye erişim manüel olarak girilen anahtar kelimelerle sınırlıdır ve mevcut bilgilerin çoğu doğal dilde sunulmaktadır. Merkezinde insan, makine ve bilgi olmakla birlikte web 2.0, insan öğesi olmaksızın verileri anlayamaz ve geliştiremez.

Web 2.0’ın söz konusu zorluklarına karşın, bilgiyi makinece yorumlayabilen yeni nesil web siteleri olarak bilinen anlamsal web (web 3.0) gündeme gelmiştir. Web 3.0, bilginin makineler (programlar) tarafından yorumlanmasına imkân tanır. Böylece makineler, belgeler arasındaki mevcut bağlantıları bildirmekten ziyade farklı bilgi kaynakları arasındaki ilişkiyi kurabilirler.

Anlamsal web iki konu ile yakından ilgilidir:

  • Verinin değişimi için ortak formatlar,
  • Verinin gerçek nesneler ile ilgisini kuran programlama dili.

1.6 Anlamsal Web ve Ontoloji

Anlamsal web, bilgi sunumu için standart olarak ontolojiyi kullanır. Ontolojiler, insanlar tarafından oluşturulan sembollerin anlamlarının makinelerce işlenmesini sağlar. Böylece bilgi, anlamsal web üzerinde paylaşılabilir, tekrar kullanılır ve değiştirilebilir. Web ontolojisi, web üzerindeki bir alanda (domain, özel bir konuya ait bilgi alanı), paylaşılabilinir bilgiye ulaşmak isteyen ihtiyaç sahiplerine nesnelerin kurallı tanımını yaparak ortak kelimeler ve anlamlar sunmaktadır.

Ontolojiler genel olarak terimlerin sınırlı bir listesi ile bu terimlerin arasındaki ilişkilerden ibarettir. Ontolojiler sayesinde özellikle anlamsal web etmenleri, eriştikleri bilgiyi yorumlayabilirler ve diğer etmenlerle iletişim kurarak web hizmetlerini geliştirebilirler.

Farklı veri tabanlarında, aynı kavram için farklı tanımlar kullanılmaktadır. Anlamsal web’de ontolojiler kullanılarak bu tür problemler çözülmeye çalışılmaktadır. Bir anlamsal web dokümanında mevcut olan terimlerin anlamları ve bu terimler arası ilişkiler, hazırlanacak olan bir ontoloji ile anlaşılabilir hale getirilmektedir. Anlamsal web’de aynı kavram için farklı tanımların kullanımından kaynaklanan sorunlar ontolojiler kullanılarak ortadan kaldırılmaktadır.

Bir tanımı ontoloji olarak adlandırmak için aşağıdaki özelliklerin mevcut olması gerekmektedir:

  • Sınırlı kontrollü sözlükler
  • Belirli anlamdaki terim ve sınıf ilişkileri
  • Sınıflar arasındaki hiyerarşik alt sınıf ilişkileri

Zorunlu olmayan özellikler ise şunlardır:

  • Her sınıf için özellik tanımlamaları
  • Ontolojiye bireysel olarak dâhil olma
  • Her sınıf için değer kısıtlama tanımı

Olması arzulanan, fakat zorunlu ve tipik olmayan özellikler şunlardır:

  • Ayrık sınıfların tanımlanması
  • Terimler arası mantıksal ilişkilerin tanımlanması

Anlamsal web’in sunacağı hizmetlerin gerçekleştirilmesinde şu anki web’e anlam eklenmesini sağlayacak yeni dillerin tanımlanması şarttır. Anlamsal web için hazırlanacak dillerin üç özelliği içermesi gerekmektedir:

  • İçeriklerinin otomatik olarak işlenebilmesini sağlayacak biçimsel sözdizimleri (“syntax”),
  • Biçimsel anlamsallar (“semantic”),
  • Etmenlerin ve insanların bilgi paylaşımını sağlayacak standartlaşmış sözlükler.

2  ONTOLOJİ DİLLERİ

2.1 Giriş

Ontoloji dilleri genelde; ontoloji geliştirmek ve ontoloji yardımıyla web ortamındaki nesneleri tanımlamak için kullanılmaktadır, bu ise RDF’ dir. İlk RDF, web 3.0’ın temel dili olup verileri ve üst veriyi tanımlamak için kullanılmıştır. Ayrıca RDF, grafik veri formatı da kullanır. RDF grafiği, hemen her veri başlığının URI olarak isimlendirilen tek bir veri tanımlayıcısına sahip olduğu hem de her veri başlığının, diğer başlıklarla bağlantı kurulabileceği fikrine dayanır. Bu yüzden semantik web programcıları URI’ li veriler yaratırlar; URI’ lerle isimlendirilen ilişkileri kullanarak bu verileri birbirlerine bağlarlar. Böylelikle veriler, RDF ve popüler ontoloji belirleme dili olan OWL (Web Ontology Language) kullanılarak tanımlanıp birbirlerine bağlanabilirler. Aşağıda Ontoloji dilleri ilgili detaylara yer verilmiştir.

2.2 Ontoloji Dilleri

Aşağıdaki ontoloji dilleri geliştirilmiştir:

RDF: RDF (Resource Description Framework) bilgisayarlarca işlenecek verinin anlamını temsil edecek olan bir veri modelinin düzenlenmesini sağlamaktadır. RDFS (RDF Schema) gösterimi ise,  RDF veri modelini genişleterek, alanda kullanılacak sözcük kümesini nesneler, nesneler arası ilişkiler, özellikler ve özelliklerin alabileceği değerler açısından tanımlamaktadır.

RDF, XML üzerine inşa edilmiştir. W3C, XML’ i HTML’ nin genişletilmiş bir versiyonu olarak veri depolama amacıyla oluşturmuştur. XML, veri depolama ve web üzerinden veri değişimine imkân tanır; ancak, verinin anlamı hakkında hiçbir şey söyleyemez. Yani XML, yetersizdir ve aynı anlama gelen farklı terimleri anlayamaz. Örneğin <fiyat>120 TL</fiyat> ile <ücret>120 TL</ücret> etiketlerinin aynı anlama sahip olabileceğini programlar anlayamaz. Bu noktada ontolojiler gibi semantik web teknolojilerine ihtiyaç duyulur.

OWL: W3C tarafından 2002 yılında geliştirilen OWL (Web Ontology Language) yaygın olarak kullanılmaktadır. RDF(S)’e göre daha güçlü bir çıkarsama mekanizması sunarlar.

OWL, ontolojileri tanımlamak ve çeşitlemek için kullanılan bir dildir. OWL, bilginin içeriğini sadece insanlara gösteren değil, bunun yanında bilgisayarlar tarafından işlenebilmek üzere tasarlanmıştır. OWL, XML, RDF ve RDF-S tarafından desteklenen web içeriğinin bilgisayarlar tarafından daha iyi yorumlanabilmesini sağlamayı hedef almaktadır. OWL; OIL ve DAML+OIL gibi dilleri temel alır. OWL, DAML+OIL web ontoloji dilinin araştırma tabanlı bir sürümüdür. OWL dilinde terimler arasındaki bağlantı RDF söz dizimi ile yapılmaktadır. Söz dizim kuralları bilgiyi anlamlaştırmak için tasarlanmıştır.

OWL üç alt dile sahiptir: OWL Full, OWL DL ve OWL Lite. Bu üç dil, kullanıcılar için özel olarak tasarlanmıştır.

OWL Full: Tanımlama bilgisinin hesaplama bilgisinden önemli olduğu durumlarda kullanılabilir. RDF ve RDF(S)’in bütün bileşenlerinden yararlanır. RDF’ in sağladığı tüm kolaylıkları sağlar, ancak hesaplanabilirliği desteklemez, tam kararlı olmadıklarından kavramlar arasında tam ve etkili bir mantık yürütemez.

OWL DL: OWL Full’ un bir alt dilidir; terimlerin anlamlarını tanımlamada kolaylık sağlayıp, otomatik hesaplamaları mümkün kılar. OWL ve RDF’ i oluşturan yapılara kısıtlar ekleyerek kullanılır. Bu kısıtlar tanımlama mantığı bağlantısını sağlar.

OWL Lite: OWL dilinin tek bir kısmı ile OWL DL’nin kısıtlarını kullanır. OWL Lite, sadece üst sınıfı tanımlar. Üst sınıflarında karar yapıları kullanılır. Sınıflar arasında eşitlik ve alt sınıf ilişkileri vardır. OWL Lite mantıksal sonuçlarını değerlendirerek iki değer gönderir. Bu değerler 0 ve 1 dir. Özellikle durum belirteçlerinde eğer bir çıkarım varsa 1, diğer durumlar 0 kabul edilir. Örneğin bir bilgisayarın sahip olduğu işlemci, ana kart, ram belleğine bakıldığında sunucu özelliği varsa 1, diğer durumlarda 0 değeri gönderilir.

DAML, OIL: Bu bir semantik web ontoloji dilidir ve ABD Hükümetinin desteği ile DAML (DARPA Agent Markup Language) ve Avrupa Birliği tarafından geliştirilen OIL (Ontology Interface Layer) ontoloji geliştirme dilleri de tanımlanmıştır. ABD ve AB tarafından ilk olarak 2000 yılında geliştirilen ve 2001 yılında da son sürümü yayınlanan DAML+OIL dili de pek çok araştırıcı tarafından kullanılmaktadır.  En temel amacı ise web üzerinde bulunan bilginin bilgisayarların anlayacağı hale getirilmesidir.

3  ONTOLOJİ ALANINDA YAPILMIŞ ÇALIŞMALAR

3.1 Giriş

Bu kısımda belge ontolojisine en yakın örnekleri kapsaması bakımından uluslar arası literatürde yapılmış olan doküman ontoloji çalışmalarından örnekler verilecektir.

Doküman Ontolojisi çalışmaları özellikle son yıllarda hızla kullanılmaya başlamış olup özellikle de bilgi ve belge yönetimi alanında paylaşılabilinir bilgiye örneğin e-belge, dijital doküman’a ulaşmak isteyen ihtiyaç sahiplerine bu bilgilerin kurallı tanımlarının yapılarak ortak kelimeler ve anlamlar bütünlüğü içinde sunulmasını kapsamaktadır.

Dokümanların kullanım yerine göre farklı farklı doküman ontolojileri tasarlanmıştır, bu çalışmalardan bazıları aşağıdaki paragrafta anlatılmaya çalışılmıştır.

3.2 Semantik Doküman Mimarisi Doküman Ontolojisi

Semantik doküman mimarisi doküman ontolojisinin [5] amacı web üzerindeki dokümanların tıpkı ofis dokümanları gibi işlenmesini sağlamaktır. Bunun için üç tür ontoloji geliştirilmiştir;

  • Doküman Ontolojisi: Web ortamında dokümanları tanımlamak için kullanılır.
  • Doküman Değişimi Ontolojisi: Web ortamında bulunan dokümanların transferleri için kullanılır.
  • Kullanıcı Model Ontoloji: Dokümanların kullanıcılara sunumları sağlamak için kullanılır, her kullanıcıya farklı sunum yapılabilmesini sağlar.

Bu doküman ontolojisi düğüm noktaları dokümanlara ait birimleri temsil eden bir graf şeklinde sunulurlar (DU:Document Unit). Doküman Birimlerinin tipini ve dokümanlar arasındaki ilişkileri içerik birimi (CU: Content Unit) ile Bilgi Birimi (KU: Knowledge Unit) kavramları belirtilmektedir.

İçerik Birimi dokümana ait dijital içerik bilgisini, farklı formlarda sunar; örneğin Grafik, Metin, Ses ve Video formatları şeklinde. Buna karşılık Bilgi Birimi ise; bu içeriğin toplu kümesini sunarak  içerik birimleri arasında dolaşımı sağlar; örneğin paragraf, bölüm, tablo arasındaki geçişler.  Bir paragraf birkaç metin fragmanından ve grafiklerin belli sıralamasından meydana gelebilir. Buna ilaveten içerik birimleri arasındaki ilişkileri de tanımlar bunlar; dokümana ait tür, kavram, konu ve özelliklerdir.

Aşağıdaki şekilde bu tür bir doküman Ontolojisi verilmiştir.

Şekil 1: Semantik Doküman Mimarisi Doküman Ontolojisi

3.3 SALT Doküman Ontolojisi

SALT (Semantic Annotated LaTeX) [6] semantik yayın çıkarma çerçevesini sunarak, ek açıklamalar ile bilimsel yayınları zenginleştirmeyi hedefler. SALT doküman ontolojisi (SDO) bilimsel yayınların lineer yapısını belirleyerek yayın içeriklerinin tanımlanabilmesinde ve revizyonlarının yapılıp izlenmesinde yardımcı olur. Ana hedefi ise bilimsel yayınların içerik modelini farklı boyutlarda/seviyelerde sunmaktır. Bu ontoloji dokümanlar üzerindeki içerik örneklerinin birbirleri ile ilişkilendirilmesinden ibarettir, bunun için hasText (İçerir) özelliği tanımlanmıştır. Aşağıdaki şekil bu ontolojiyi tasvir eder, ayrıca dokümanlara ilişkin kavramlar ve özellikleri de detaylı olarak veren bir ontoloji modelidir.

Şekil 2: SALT Doküman Ontolojisi

SDO ontolojisi ilk önce sistem içinde var olan nesneleri ve özellikleri belirleyerek işe başlar.

Örneğin yukarıdaki ontoloji modeli için bir varlık listesi oluşturulmuş daha sonra da bu varlık listesindeki sınıflar ve özellikler detaylandırılmıştır, sistemin en üstündeki sınıf ise kaynak (Resource), sınıfı olup şekilde verilmemiştir diğer tüm sınıflar bu sınıfın altsınıfıdır.

Varlık listesi: Sınıflar ve Özellikleri

Classes

Publication, Section, Paragraph, Sentence, TextChunk, Revision, Table, Figure

Properties

hasSection, hasSubSection, hasParagraph, hasSentence, hasTextChunk, hasRevision, hasOrderNumber, hasStartPointer, hasEndPointer, hasSectionTitle, hasCaption, hasTable, hasFigure, hasRevisionDate, hasLocation, hasAnnotation, hasSALTVersion


Ontoloji sınıflarını tanımlamak:
Publication

Superclasses

rdfs:Resource

Subclasses

--

In domain of:

sdo:hasSection, sdo:hasSALTVersion, sdo:hasLocation, sao:cites, sao:isCitedBy, sao:hasCitationKey, sao:hasCitationContext

In range of:

sao:cites, sao:isCitedBy, sao:pointsTo


Ontoloji özelliklerinin tanımlanması:
hasSection

Type

rdf:Property, rdfs:Resource

Domain

sdo:Publication

Range

sdo:Section


3.4 Ajan Tabanlı RDF(S) Doküman Ontolojisi

Ajan Tabanlı Doküman Ontolojisi [7] yüksek öğrenim ortamında bilgi kaynaklarına erişim için tasarlanan ajan mimari tabanlı bir sistemdir. Burada öğrenciler ve öğretim elemanları tarafından üretilen/kullanılan tüm dokümanlar RDFS (Resource Definition Framework Schema) kullanarak tanımlanmaktadır. Bu modelde; farklı işlevleri gerçekleştiren üç ajan (agent) bulunmaktadır, kullanıcı ile etkileşim, ontolojinin düzenlenmesi ve üstveri kullanarak arama yapma.

Bir yüksek öğrenim kurumundaki öğrenciler değişik bilgi ve belge kaynaklarına hem erişirler hem de bu tür bilgi ve belge üretirler. Öğrenim bilgi yoğunluklu bir aktivite olduğu için bilgi yönetimi ve bilginin kayıt edilmesi büyük önem taşır. Bilginin tanımlanması ve bilgi kaynaklarının oluşturulması önem arz eder. Bu nedenle bilgi yönetim teknolojileri ve stratejilerinin uygulanması onların gelecekteki eğitim aktivitelerine önemli katkılar sağlayacaktır. Kullanılmakta olan DCMI (Dublin Core Metadata Initiative) ve RDF (Resource Description Framework) ve OWL (Ontology Web Langauage) metodolojileri farklı dokümanları tanımlamak ve kategorize etmek için önemlidir (ev ödevi, makale yazma, raporlama). İşte bu nedenle doğru ontolojinin geliştirilmesi yardımıyla dokümanların yönetimi için gerekli araçların geliştirilmesi yapılabilir.

Bu ontolojide öncelikle sistemde kayıt altına alınacak olan dokümanlar ve doküman tiplerinin belirlenmesi çalışması ile doküman taksonomi hiyerarşisi yapılır.[7]. En yukarıda kök olarak da adlandıran üst doküman sınıfı bulunur, alt dallarda ise ilgili köke bağlı dokümanları karakterize eden dokümanlar bulunur, bunlar en soyut hali ile verilirler. Bu tür bir taksonomi çalışmasında dokümanlara ait ortak özellikler belirlenerek dokümanların tanımlamalarına yardımcı olunur. Örneğin bir doküman içinde en azından şu özellikler bulunur; başlık, içerik tanımı, yazarı gibi. Farklı bir bakış açısı ile de dokümana ait tek bir öznitelik belirlenerek diğer dokümanlarla olan ilişkisi belirlenebilir. Bu dokümanlara ait öznitelik sınıflarının belirlenmesi ile farklı kavramsal içerikleri bulunan dokümanların ortak özellikler kullanılarak etkin ve hızlı erişimi sağlanabilir. Aşağıdaki şekilde bu tür bir ontolojinin sunumu verilmiştir.

Şekil 3:Yüksek Öğrenim Doküman Ontolojisi

Bu ontolojide bazı özellikleri doküman tipleri arasında paylaşılmakta hem de bu özellikler dokümanların tanımlanmasına yardımcı olmaktadır. Örneğin her dokümanda olması gereken özellikler şunlardır; başlık (title), tanım (description) ve kaynak yeri (URL). Buna ek olarak dokümanın domain ontoloji içinde diğer dokümanlarla ilişkisini belirten hasConcept (vardır) özelliği bulunur.

Yukarıdaki şekilde bu tür bir ontoloji modeli verilmiştir, burada doküman (document) hiyerarşinin en üstünde yer alır (root) diğer dokümanlar sadece soyut olarak verilmişlerdir. Şekil içindeki diğer sınıflar olan assignment, report ve notes ise document sınıfının bir altsınıfıdır. Bu kavramlar ilgili alana özgü özel dokümanları tanımlarlar ve böylece de birbiri ile ilişkili dokümanlara ve kavramlara erişim kolayca sağlanabilir. Aşağıdaki şekilde bir dokümanın özelliklerinin birbirleriyle olan ilişkisi verilmiştir.

Şekil 4: Bir dokümana ait özellikler ve ilişkileri

Bu tür doküman ontolojileri RDF[3] (Resource Description Framework) veya RDFS[4] kullanılarak sunulurlar. Bu modelde bilgi kaynaklarının semantik olarak sunumu standart XML kullanılarak yapılmaktadır. Bu model üç ana öğe üzerine kurulmuştur; kaynak, öznitelik ve değer (resource, property, value), bu ise o dokümana ait üstveriyi ifade eder. Bu stratejinin odaklandığı nokta ise bu ontolojinin bir işaretleme dili olan XML ile nasıl sunulacağı, nasıl paylaşılacağı ile farklı kullanıcılar için tekrar kullanılabilirlik konularıdır. Bu tür bir doküman ontolojisi aşağıdaki gibi sunulabilir; burada doküman, ödev ve rapor grafa ait düğümleri gösterir ve alt sınıflar da dokümana ait sınıfları ifade eder. Burada ilişki subClass (altSınıfı) ile ifade edilmektedir, yani bir doküman bir dokümanın altsınıfı olabilir.

Şekil 5: RDF Şemasına Göre Dokümanlar ve İlişkileri

Aşağıdaki şekil (Şekil 6) bir dokümanı tanımlayan bir graf olarak verilmiştir. Bu şekilde #article01 dokümanı tanımlamak için kullanılmış olan bir ID’ dir ve rdf:type ise dokümanın tipini tanımlamak (paper) için kullanılmıştır. Bunlara ek olarak doküman özellikleri ile doküman sunulmuştur, dc:title ve doc:url.

Şekil 6: RDF Şemasına göre dokümanın graf olarak gösterilmesi

Bu doküman RDF olarak aşağıdaki gibi tanımlanabilir, burada ekstra özellik olan FOAF[8] (Friend Of a Friend) dokümana ait yazar bilgisini vermek için tanımlanmıştır.

<rdf:Description rdf:about=”#article01”>

<rdf:type rdf:resource=”#paper”/>

<dc:title>Knowledge Management for

Beginners</dc:title>

<doc:url>www.…./article01.pdf</doc:url>

<doc:hasConcept rdf:resource=”#Knowledge”/>

<author>

<foaf:person>

<foaf:name>A. Rojas</foaf:name>

<foaf:mbox>arojas@mail.com<foaf:mbox>

</foaf:person>

</author>

</rdf:Description>


İçişleri Bakanlığı Nufus ve Vatandaşlık İdaresi Dijital Arşiv Projesi (NVİ DAP)

İçişleri Bakanlığı Nufus ve Vatandaşlık İdaresi Dijital Arşiv Projesi (NVİ DAP)

Erkyazılım, TÜBİTAK Ulusal Elektronik ve Kriptoloji Araştırma Enstitüsü, T.C. İçişleri Bakanlığı Nüfus ve Vatandaşlık İşleri (NVİ) ortaklığında Ulusal Bilim Fonu - KAMAG Projesi, %100 devlet tarafından fonlanmıştır.

01.11.2010 tarihinde başlayan ve 01.09.2013 tarihinde bitirilen proje ile;

  • Vatandaşlardan, Mahkemelerden ve diğer kurumlardan gelen taleplere daha hızlı cevap verebilecek,
  • Arşivlenmiş olan kağıt ortamındaki belgelere ulaşılması, arşivden çıkarılarak çoğaltılması ve tekrar arşivlenmesi gibi  iş akışından doğan zaman ve iş gücü kaybının önlenmesi ,
  • Kağıt ortamındaki belgelerin kurumsal fonksiyonlara ve asli düzene uygun olarak sayısal ortamda indekslenmesi,
  • Belgelerin fiziki kullanımından kaynaklanan yıpranmanın ve yok olmanın önüne geçilmesi, böylece belgelerin yok olmasından doğacak kurumsal sorumlulukların ve hak mahrumiyetlerinin önlenmesi,
  • MERNİS gibi diğer e-devlet projeleriyle birlikte çalışabilirliğine imkan tanıyan alt yapının oluşturulması  amaçlanmıştır.

Belgelerinin hızlı ve güvenilir şekilde elektronik ortama aktarılması, yönetilmesi ve paylaşılması için  e-belge yönetim ve paylaşım sisteminin geliştirilmesi hedeflenmiştir.

Nufus ve Vatandaşlık İdaresinde bulunan toplam 259.405.100 adet belge içerisinden örneklenen %1’lik 2.594.051 sayfanın; hızlı ve güvenilir şekilde elektronik ortama aktarılması, elektronik ortamda yönetilmesi, diğer kurumlar ile paylaşılması için e-belge yönetim ve paylaşım sisteminin kurulması çalışması yapılmıştır.

Aile Kütükleri (60 X 80 cm), Atik Defterler (60 X 80 cm), Dayanak Belgeleri (A5-A4), 1974 öncesi dayanak belgeleri, Vukuat Defterleri (55x 40 cm), Sicil Defterleri (55x 40 cm), Vatandaşlık Dosyaları (A4)’nın dijitalleştirilmesi için Zuetchel, Book2Net, Bookeye firmalarına ait A0, A1 ve A2 boyutlarında belge tarayacak farklı özelliklerde hassas tarama cihazları kullanılmıştır.

Tarama standartı olarak TSE 13298 T1 standartı (400 dpi sıkıştırmasız TIFF formatında ana kopya saklama) uygulanmıştır.

Kuruma özel belge Ontolijisinin geliştirilmesi, Osmanlıca el yazısı tanımlama yapılması için ARGE çalışması yapılması için Hacettep Üniversitesi, Marmara Üniversitesi, Sabancı Üniversitesi ve İstanbul Üniversitelerinden danışmanlık hizmetinin alınarak hem bilgi belge yönetimi hem de el yazısı tanıma, doğal dil işleme konularında arge çalışmaları yapılmıştır.

Document Ontologies

Aşağıdaki arge çalışmaları yapılmıştır.

  • Belge Ontolojisi
  • Osmanlıca ve Türkçe Karakter Tanıma (OCR),
  • Belgelere internet ortamında erişim,
  • MERNIS vb. e-devlet projeleriyle entegrasyon

Özellikle osmanlı belgeler üzerinde el yazısı tanıma teknikleriyle yer, tarih, şahıs isimlerinin bilgisayar tarafından tanınabilmesi için ARGE çalışmaları yapılmıştır.


T.C. Dışişleri Bakanlığı Arşiv Otomasyon Projesi İlerliyor

T.C. Dışişleri Bakanlığı Arşiv Otomasyon Projesi hızla ilerliyor. Proje kapsamında yaptığımız çalışmaların tanıtımını yapabilmek için bakanlık nezaretinde tanıtım filmi hazırlandı. Tanıtım filminde hem bakanlık arşivinin önemi hemde ortaya çıkacak yeni bir dijital arşiv veritabanının faydaları anlatılmaktadır.

Türkçe Tanıtım Videosu:

,

Tanıtım filmini izlemek için: - https://www.youtube.com/watch?v=asAioqDafpY

Turkish Ministry of Foreign Affairs eArchive Project presentation video:

 

e-Archive's Project - https://diplomatic.mfa.gov.tr/ApplicationNewsDetail.aspx?id=104

Turkish Foreign Ministry opens its diplomatic archives for researchers - http://www.armradio.am/en/2014/11/28/turkish-foreign-ministry-opens-its-diplomatic-archives-for-researchers/

Turkish Foreign Ministry opens its diplomatic archives for researchers - http://www.hurriyetdailynews.com/turkish-foreign-ministry-opens-its-diplomatic-archives-for-researchers-.aspx?pageID=238&nID=74906&NewsCatID=338


T.C. Dışişleri Bakanlığı Arşiv Otomasyon Projesi

Dışişleri Bakanlığı Arşiv Otomasyon Projesi, hem devlet yetkililerini hemde firmamızda emeği geçen bütün iş arkadaşlarımı heyecanlandırıyor.

T.C. Dışişleri Bakanlığı eArşiv Projesi Tanıtım Dokümanı from Bulent Arslan

Proje kapsamında; Türkiye ile yabancı ülkeler arasındaki siyasi ilişkilerin tamamını içine alan 25 milyon belgenin sayısal ortama aktarılması planlanmaktadır. Bu işlemin yapılabilmesi için 250 personel dünyadaki en gelişmiş 2 adet endüstriyel tarayıcı ve 6 adet hassas tarayıcı kullanılıyor.

Projede daha önce T.C. Cumhurbaşkanlığında yaptığımız TSE 13298 standartlarını uyguluyoruz. 400 dpi sıkıştırmasız TIFF üretiyoruz, imajları OCR işleminden geçirerek searchable PDF kopyalarını oluşturuyoruz. Ana kopyalar, dolaşım kopyaları, OCR PDF dosyaları derken ürettiğimiz verinin boyutu PB (Petabyte)'ları geçiyor. Aslında bir manada bigdata ile uğraşıyoruz diyebiliriz.

Proje hakkında detaylı bilgiyi Prof. Dr. Çağrı Erhan bey, Türkiye gazetesindeki yazısında güzel ifade etmiş.

 

Tekrar yazmak yerine Çağrı beyin yazısını sizinle paylaşıyorum:

Dışişlerinin hafızası araştırmacılara açılıyor

Diplomatik Muhakeme’de birkaç kez Dışişleri Bakanlığı arşivinin durumuyla ilgili görüşlerimi sizlerle paylaşmıştım. Birçok ülkenin arşivlerinin aksine Türkiye’nin diplomatik arşivlerini araştırmacıların hizmetine açmamasının, Türk Dış Politikası hakkında bilimsel çalışmalar yapanları ne kadar zor durumda bıraktığından bahsetmiştim. Bugün ise arşivde çalışabilecekleri günü dört gözle bekleyenler için bir müjde vermek istiyorum.

Başbakan Prof. Dr. Ahmet Davutoğlu’nun, Dışişleri Bakanı iken verdiği talimat doğrultusunda başlatılan Dışişleri Bakanlığı Arşivi Otomasyon Projesi ilk somut meyvelerini vermeye başladı. Dışişleri Bakan Yardımcısı Büyükelçi Naci Koru’nun koordinasyonunda ve Arşiv Daire Başkanı Elçi Dr. Nevzat Uyanık’ın yönetiminde hızla ilerleyen çalışmalarda, arşivin araştırmacılara açılacağı güne çok yaklaşıldı. 2015 yılı içinde, 91 yıllık Cumhuriyet tarihimizde bir ilk gerçekleşecek; yerli ve yabancı araştırmacılar Dışişleri Bakanlığı’nın Ankara Çiğdem Mahallesindeki arşiv binasının araştırma salonlarını doldurmaya başlayacaklar.

Bugüne kadar, Dışişleri Bakanlığı arşivinde çalışmak için posta ya da BİMER yoluyla başvuranlara hep aynı cevap verilmekteydi: “Arşivin tasnif işlemleri tamamlanmamış olduğundan bu talebinize olumlu cevap veremiyoruz.” Gelecek yıl ortalarından itibaren artık kimse böyle bir mesaj almayacak. Birkaç yıl içinde Türkiye diplomatik arşiv belgelerine atıfların yer aldığı binlerce Türkçe ve yabancı dilde makale ile kitap bilim evrenine eklenecek.

Yürütülmekte olan çalışmanın ne kadar muazzam olduğunun daha iyi anlaşılabilmesi için birkaç veriyi sizlerle paylaşmama izin veriniz:

Diplomatik arşivimizde 1919-2008 yılları arasını kapsayan 65 milyon 300 bin sayfa belge bulunuyor. Bunlar 110 bin büyük klasörde saklanıyor. 2015 yılı sonuna kadar, Türkiye ile yabancı ülkeler arasındaki siyasi ilişkilerin tamamını kapsayan 25 milyon belgenin sayısal ortama aktarılması tamamlanacak. Bu işlemin yapılabilmesi için dünyadaki en gelişmiş 2 adet endüstriyel tarayıcı ve 6 adet hassas tarayıcı kullanılıyor.

Hâlihazırda 1919-1958 yılları arasına ait Latin Amerika ve Orta Doğu ülkeleriyle ilgili belgelerin hazırlanması işlemi neredeyse tamamlanmış durumda. Bu işlemlerin hem süratli hem de doğru yapılabilmesi için 250 uzman, günde iki vardiya hâlinde çalışıyorlar. Belgelerin yaklaşık %65’inin gizlilik derecesi bulunmuyor. Yani bu belgeler sayısallaştırma işlemleri tamamlanır tamamlanmaz araştırmacıların hizmetine sunulacak durumda. Geriye kalan belgelerin üzerindeki gizlilik kaydının olabildiğince hızlı kaldırılabilmesi için de bir komisyon çalışmalarına devam ediyor. Sevindirici bir diğer konu da, belgelerin tamamı üzerindeki gizlilik kaydının kalkması beklenmeden, gizlilik kaydı olmayan tüm dosyaların araştırmacıların hizmetine sunulacak olması.

Belki de hepsinden önemlisi, arşivin tamamen araştırmacı dostu bir mantıkla çalışması. Bugüne kadar bilimsel çalışmalarım çerçevesinde ABD, İngiltere ve Fransa arşivlerinde bulunma imkânım oldu. Rusya ve Almanya arşivlerindeki çalışma şartlarını da, oralarda uzun süreler çalışmış akademisyenlerden öğrendim. Dışişleri Bakanlığı arşivinde kısa süre sonra hizmete girecek olan sistem bütün bu ülkelerdekinden çok daha ileri. Gireceğiniz bir anahtar kelime üzerinden milyonlarca sayfayı tarayarak, ulaşmak istediğiniz belgeleri sadece saniyeler içinde size sayısal ortamda sunacak bir programdan bahsediyoruz. Ulaştığınız belgelerin üzerlerine sanal ortamda notlar alabilecek, bunları ayrı klasörlerde toplayabilecek, neredeyse belgelerin kopyalarını almaya bile gerek duymadan bilimsel çalışmanızı arşiv binasında size tahsis edilen bilgisayarda tamamlayabileceksiniz.

Türkiye’nin diplomatik arşivlerini açması sadece bizim siyasi tarihçilerimiz açısından önemli değil. Yabancı araştırmacılar da, tıpkı İstanbul’daki Osmanlı Arşivimiz gibi, Dışişleri Bakanlığı arşivinden yararlanabilmek için yıllardır bekliyorlar.

Siyasal Bilgiler Fakültesi’nin Siyasi Tarih Kürsüsünde asistan olarak göreve başlamamın üzerinden 20 yıl geçti. Benim kuşağımdan diplomatik arşivlerde çalışma izni alabilen kimseyi duymadım. Benim hocalarım ve onları yetiştiren hocalar da çok arzu ettikleri halde maalesef arşivimizde istedikleri gibi çalışma imkânı bulamamışlardı. 20 yıllık meslek hayatım boyunca içimde kalan en büyük ukde, diplomatik arşivimizin kapalı oluşuydu. Genç araştırmacılarımız ise en modern teknolojiyle donatılmış bir ortamda bilimsel üretimleri için araştırma yapma imkânı bulacaklar. Ne mutlu onlara.

Bilim dünyamıza yapılan bu muazzam katkıya emeği geçenlere teşekkür etmek yetmez, hepsinden teker teker Allah razı olsun...

Yazının orjinali için http://www.turkiyegazetesi.com.tr/prof-dr-cagri-erhan/583044.aspx

 

Proje hakkında basında çıkan diğer haberler için;

http://www.mfa.gov.tr/disisleri-bakani-sayin-mevlut-cavusoglu_nun-elektronik-arsiv-projesi-tanitim-konusmasi_-16-ocak-2015_-ankara.tr.mfa

http://www.aa.com.tr/tr/politika/451483--ermeni-iddialarina-karsi-bizim-de-calismalarimiz-var

http://www.sabah.com.tr/gundem/2014/11/27/disisleri-bakanligi-arsivleri-aciliyor

http://www.turkiyegazetesi.com.tr/prof-dr-cagri-erhan/583044.aspx

http://www.milliyet.com.tr/diplomatik-arsiv-otomasyon-projesi-ankara-yerelhaber-575808

- http://www.haberler.com/cavusoglu-disisleri-bakanligi-arsiv-binasi-nda-6875265-haberi/

http://www.cnnturk.com/video/turkiye/disisleri-bakanligi-arsivi-arastirmacilara-aciliyor

http://www.dailymotion.com/video/x2evwkf_cavusoglu-disisleri-bakanligi-arsiv-binasi-nda-incelemelerde-bulundu_news

http://www.tarihhaber.net/disisleri-bakanligi-arsivi-aciliyo/


e-BEYAS 2014, Elektronik Belge Yönetimi ve Arşiv Uygulamaları Sempozyumu sponsorları arasındayız

Kurumlarda klasik arşivlerin yeni dönemle birlikte dijitalleştirilmesinin artık hız kazandığı günümüzde konuyu enine bonuna incelemek, yeni fikirleri dinlemek ve yenilikçi uygulamalar hakkında bilgi paylaşımı yapmak için 20-21 Mart 2014 Tarihleri arasında  Ankara Üniversitesi öncülüğünde "e-Beyas 2014, Elektronik Belge Yönetimi ve Arşiv Uygulamaları" sempozyumu düzenleniyor.

e-BEYAS 2014 Sempozyumu;

  • Kurumlarda Belge Merkezi ve Arşiv Mekânları
  • Arşiv Belgelerinin Dijitalleştirilmesi ve e-Arşiv Uygulamaları
  • Elektronik Belge Yönetim Sistemleri ve Birlikte Çalışabilirlik
  • e-İmza / m-İmza Çözümleri ve Mobil Uygulamalar
  • Elektronik Belge Yönetim Sistemlerinde Teknolojik Boyut

konu başlıklarında akademisyen ve uygulamacıların bilgi birikimi ve deneyimlerini paylaşmayı, kurumlar ve firmalar arasındaki diyaloğu geliştirmeyi, bilimsel ve sosyal etkileşim gerçekleştirmeyi amaçlamaktadır.

Ayrıca Sempozyum öncesinde açılışı gerçekleştirilecek olan, Belge yönetimi ve arşiv disiplininin öngördüğü yöntem ve teknikler uygulanarak kurumsal belge yönetimi ve arşiv çalışmalarının yürütülmesi için Arşiv Mekân Standartlarına uygun bağımsız ve güvenli bina olarak tasarlanan ve yaptırılan “Ankara Üniversitesi Kurum Belge Merkezi ve Arşiv Binası” ile Türkiye için alanında ilk olan uygulama örneğinin sunulması amaçlanmaktadır.

Sponsor olarak destek verdiğimiz e-Beyas 2014'de Erkyazılım'ın dijitalleştirme süreçlerindeki tecrübelerini paylaşacağımız bir sunum da olacak.

Sempozyum gününü beklemeden Dijital Arşiv Hizmetleri bağlantısından hizmetlerimizi inceleyebilir, dijitalleştirme maceramızda geliştirdiğimiz "Bigtara" ürünümüz hakkında detaylı bilgi alabilirsiniz.