@ssonmez
Oluşturduğum veritabanını daha önce söylediklerimden anlaşılacağı gibi semantic davranabilecek uygulamalar için oluşturdum. Örneğin şuanki istatistiğimde sondaj ile ilgili bir makalede hangi kelimelerin ne oranda kullanabilecekleri olasılıkları var. (Maden, Enerji Bakanlığı, Hilmi Güler, İzin (...) gibi)
Veritabanı şimdiden basit bir uygulamayla TDK imla klavuzundan bağımsız oluşturuldu, sadece oradan sözcük köklerini kontrol ettim o kadar. Popüler genel jenerik sözcüklerde 150-200 bin kelime kadar da fazlam var. (kelimelerin çekim - yapım ekleri imla klavuzunda zaten yok, eğer yapım-çekim ekleriyle düşünülürse veritabanında şu anda 450bin kelimeden fazlası var, ve her gün 1000 kadar kelimeyle büyümekte)
Hızlıca XMLRPC kullanılarak erişilebilecek bir spellcheck webservisi oluşturabilirim. Sadece check yaparsa pek
sorun olmaz. Fakat sadece check işlemi çok büyük bir yarar sağlamıyor, önemli olan öneri (kelimenin olası doğru yazılanı) sunabilmek. Bu büyüklükte bir veritabanında her check'e bir de tavsiye listesi oluşturulması ciddi performans sorunlarına yol açabilir.
Çalışmamı bu yöne de taşıyabilirim, iyi bir başlangıç olabilir. Daha sonra projeye katılmak isteyen de illa ki insanlar olacaktır. Spellchecking ile başlayıp
web 3.0'a -semantic
web- ilkelerine büyük bir katkıda bulunabiliriz. Interneti 5 yıl arkadan takip eden bilişim sektörümüz için de büyük bir adım olur. Fakat genelde böyle projelere gerçekten yarar sağlayabilecek insanlar bu türden projelerden finansal nedenlerden dolayı korkuyorlar. Bu türden araştırmalarda tıpkı yabancıların yaptığı gibi bir bağımsız, bağış üsülü bir destek gerekiyor, maalesef bu destek, ülkemiz insanları tarafından projede çalışabileceklerin artniyetli olabileceklerine dair inançlarından ötürü pek sağlanamıyor. Sanırım yıkmamız gereken internetle ilgilenen insanımızın önyargı ve tabuları.. Belli bir kitleden veya şirket-sponsordan en azından gelişme sürecinde finsansal destek görmeyen bir uygulama, pek yaşayamıyor.