TÜRKİYE BİLİŞİM DERNEĞİ Kamu Bilişim Merkezleri Yöneticileri Birliği Kamu Bilişim Platformu
BÜYÜK VERİ UYGULAMALARI Çalışma Grubu RAPORU
http://www.tbd.org.tr 11 Mayıs 2016
TBD Kamu-BİB Kamu Bilişim Platformu XVIII
Hedef Kitle Bu raporun hedef kitlesi, tüm kamu kurum ve kuruluşları, sivil toplum kuruluşları, özel sektör ve uluslar arası kuruluşlardır. Belge No
:
TBD/Kamu-BIB/2016-BG4
Tarihi
:
11 Mayıs 2016
Durumu
:
Nihai Rapor
1
Yayını Hazırlayanlar Başkan Prof. Dr. Erdoğan DOĞDU
TOBB Ekonomi ve Teknoloji Üniversitesi
Başkan Yardımcısı Yrd. Doç. Dr. Ziya KARAKAYA
Atılım Üniversitesi
Kamu-BİB YK Temsilcileri Mesut KÜÇÜKİBA
TCDD
Sadettin KAYA
T.C. Başbakanlık
Grup Üyeleri Ayşe Gül İBRİŞİM
TSE
Barış Tamer AKYILMAZ
İŞKUR
İrem SOYA
İŞKUR
Lütfi ÖZBİLEN
Fokus Akademi
Refia KARACA
İDE Danışmanlık
Semih ÇELİK
Adalet Bakanlığı
Serhan KARS
Başbakanlık
Umut ELMAS
Sağlık Bakanlığı
Veysel Uğur KIZMAZ
İŞKUR
2
TEŞEKKÜR Bu kılavuzu hazırlanmasında yorumlarıyla ve önerileriyle yardımlarını esirgemeyen Onsekizinci Dönem TBD Kamu-BIB Yönetim Kurulu üyelerine teşekkürlerimizi sunarız.
3
İÇİNDEKİLER TEŞEKKÜR.....................................................................................................iii İÇİNDEKİLER..................................................................................................iv YÖNETİCİ ÖZETİ………………………………………………………………….……..viii
TANIMLAR VE KISALTMALAR......................................................................x ŞEKİLLER.......................................................................................................xi TABLOLAR.....................................................................................................xi ÖNSÖZ...........................................................................................................xii BÖLÜM 1..........................................................................................................1 Büyük Veri.......................................................................................................1 1.1 Tanım...................................................................................................................................1 1.2 Araçlar................................................................................................................................2 MapReduce............................................................................................................................2 Hadoop..................................................................................................................................3 Spark......................................................................................................................................4 Storm.....................................................................................................................................5 FLink.....................................................................................................................................5 Apache Ranger......................................................................................................................6 Knox Gateway.......................................................................................................................7 Kafka.....................................................................................................................................7 R............................................................................................................................................7 Cascading..............................................................................................................................8 Elasticsearch..........................................................................................................................8 HBase....................................................................................................................................9 Hiv.........................................................................................................................................9 Pig..........................................................................................................................................9 Cassandra...............................................................................................................................9
4
MongoDB..............................................................................................................................9 CouchDB...............................................................................................................................9
BÖLÜM 2........................................................................................................10 Kamuda Büyük Veri......................................................................................10 2.1 Kamuda büyük veri kullanımı ve fayda........................................................................10 2.1.1 Güvenlik.....................................................................................................................10 2.1.2 Geliştirilmiş Şeffaflık ve Maliyetleri Düşürürken Karar Alma..................................10 2.1.3 Kişiselleştirilmiş Vatandaş Deneyimleri.....................................................................11 2.1.4 Sosyal medya, IoT, Endüstri 4.0, Akıllı şehirler.........................................................12
BÖLÜM 3........................................................................................................13 Türkiye’de Kamuda Büyük Veri...................................................................13 3.1 Türkiye’de Kamuda Veri İşlemenin Geçmişi................................................................13 3.1.2 Türkiye’de Kamuda Bilişimin Gelişimi.....................................................................13 3.2 Türkiye’de Kamuda Büyük Veri İçerikli Projeler........................................................15 3.2.1 Sosyal Güvenlik Kurumu (SGK) Projeleri.................................................................16 3.2.2 Milli Eğitim Bakanlığı (MEB) Projeleri.....................................................................16 3.2.3 Sağlık Bakanlığı Projeleri...........................................................................................17 3.3 Kamu Kurumlarının Büyük Veri Uygulamaları...........................................................18 3.3.1 Kamu Kurumlarında Gerçekleştirilen Uygulamalar..................................................18 3.3.2 Kamu Kurumlarında Gerçekleştirilebilecek Projeler.................................................19 3.4 Mevzuat ve Strateji..........................................................................................................26 Açık Veri ve Veri Güvenliği................................................................................................26 Kişisel verilerin kullanımı yasasına büyük veri süreçlerinin dâhil edilmesi.......................27 Yasal Dayanaklar ve Strateji................................................................................................27 3.5 Kamu Kurumlarında Büyük Veri Kullanımı ve Büyük Veri Algısı............................29 Soru 1. Kurumunuzun çalışma alanı nedir?........................................................................29 Soru 2. Verilerinizi nerede tutuyorsunuz?...........................................................................29 Soru 3. Kurum olarak “büyük veri” konusuna ilginiz var mı?............................................30 Soru 4. Kurum olarak “büyük veri” stratejiniz var mı?.......................................................30 Soru 5. Kurumunuzdaki verinin büyüklüğü nedir?.............................................................31
5
Soru 6. Kurumunuzda yapısal ve yapısal olmayan veri büyüklüğü oranları nedir?............31 Soru 7. Kurumunuzda veri işlemede aşağıdaki hangi yaklaşımı uyguluyorsunuz?............32 Soru 8. Büyük ölçekli veri işlemede hangi yöntemleri kullanıyorsunuz?...........................33 Soru 9. Büyük veri konusunda kurumunuzda hangi yatırımlar yapıldı?.............................33 Soru 10. Büyük veri yatırımlarınızın yaklaşık değeri nedir?..............................................34 Soru 10. Büyük veri projeniz var mı?.................................................................................34 Soru 11. Büyük veri projeniz yoksa kurumun büyük veri konusunda gelecek planları nelerdir?.............................................................................................................................................35 Soru 12. Büyük veri projelerinde çalışan sayınız kaçtır?....................................................36 Soru 13. Büyük veri işlemede hangi teknolojileri kullanıyorsunuz ya da inceliyorsunuz? 36 Soru 14. Kurumunuzda “Büyük Veri Analitiği” konusunda aşağıdaki konularda yetkin çalışan sayısını belirtiniz....................................................................................................................37
BÖLÜM 4........................................................................................................38 Dünya’da Kamuda Büyük Veri Uygulamaları............................................38 4.1 ABD’de Kamuda Büyük Veri..........................................................................................38 4.2 AB’de Kamuda Büyük Veri.............................................................................................40 4.3 Asya Ülkelerinde Kamuda Büyük Veri..........................................................................41 Güney Kore.........................................................................................................................41 Singapur...............................................................................................................................42 Japonya................................................................................................................................42 Çin Halk Cumhuriyeti.........................................................................................................43 4.4 Avustralya'da Kamuda Büyük Veri................................................................................43
BÖLÜM 5........................................................................................................44 Kamu için öneriler........................................................................................44 5.1 Ulusal öncelikler...............................................................................................................44 Savunma ve güvenlik..........................................................................................................44 Ekomomi, Üretim, Büyüme, ve İstihdam............................................................................45 Eğitim ve Sağlık..................................................................................................................45 Şeffaflık...............................................................................................................................45 5.2 Analitik kurumu...............................................................................................................46
6
5.3 Gerçek-zamanlı analiz.....................................................................................................46 5.4 Küresel işbirliği................................................................................................................46 5.5 Özel sektör işbirliği..........................................................................................................47
KAYNAKÇA...................................................................................................48
7
YÖNETİCİ ÖZETİ İnternet ve Web’in hayatımıza girmesi, her alanda sayısallaşma, veri saklama teknolojilerinde ucuzlama ve kapasite artışı gibi gelişmelerle birlikte çok büyük veri kaynakları oluşmuş bulunmaktadır. Büyük veri şu üç temel nitelikle klasik veriden ayrılmaktadır: veri hacmi (volume), veri hızı (velocity), veri çeşitliliği (variety). Veriler büyüdükçe bu verileri geleneksel yöntemlerle işlemek zorlaşmış ve “büyük veri” işleme yöntem ve teknolojileri ortaya çıkmıştır. Son yıllarda tüm dünyada ve ülkemizde “büyük veri”ye ilgi artmaktadır. “Büyük veri” işleme yöntemleri kullanılarak sanayi, ticaret, bilim, sağlık, eğitim, kamu ve sosyal bilimler gibi hemen her alanda toplanan büyük verilerden bilgi üretilebilmekte ve bu bilgi kullanılarak karar destek sistemleri daha etkin çalışmakta ve sonuçta insan hayatı daha kolay yaşanır hale gelmektedir. Bu raporun odak noktası kamu alanında büyük veri uygulamalarıdır. Kamu kurumları kendi sorumlulukları altında bulunan alanlarda uzun zamandır (büyük) veri toplamaktadır. Son yıllarda geliştirilen “büyük veri” teknolojilerini kullanarak bu büyük verinin analiz edilmesi ile kamu yararına önemli farklılıklar oluşturmak, toplumu ve ülkeyi etkileyecek önemli kararların alınması ve uygulamaya konması artık mümkün hale gelmiştir. Büyük veri uygulamaları öncelikle özel sektörde, özellikle internet firmalarında, ortaya çıkmıştır. Kamu kurumlarında mevcut büyük veriler de son yıllarda tüm dünyada ilgi odağı haline gelmiştir ve kamuda büyük veri uygulamaları yaygınlık kazanmaktadır. Bu çalışma çerçevesinde yapılan çalışmalar ve raporun ilgili bölümleri şöyle özetlenebilir: 1. Bölüm’de “büyük veri” kavramı ve büyük veri teknolojileri incelenmiş ve son yıllarda geliştirilen, özellikle açık kaynak ve yayın olarak kullanılan araçlara ve teknolojilere değinilmiştir. 2. Bölüm’de kamuda büyük veri kavramı ve neden kamuda büyük veri uygulamalarının önemli olduğu konusunda bir giriş yapılmıştır. Kamuda büyük veri uygulamalarının hayatı nasıl etkilediği, ayrıca bu verilerin mahremiyet ve güvenliği konularına, bu konuda kamunun sorumluluklarına değinilmiştir.
8
3. Bölüm’de Türkiye’de kamuda büyük veri konu detaylı olarak incelenmiştir. Tüm dünya ülkeleri ile birlikte Türkiye’de de kamu kurumlarında bu alana ilgi çok fazla artmış bulunmaktadır. Sayısallaşma ile birlikte kamu kurumlarında büyük veri kaynaklarına ve uygulamalarına detaylı bir şekilde, kurum ve uygulama örnekleri ile değinilmiştir. Ayrıca kamu kurumları temsilcileri ile detaylı bir anket çalışması yapılmış ve 29 kurumdan alınan geri dönüşler bu raporda değerlendirilmiştir. “Büyük veri” alanında Türkiye’de kamuda mevzuat ve strateji çalışmaları da bu bölümde incelenmiştir. 4. Bölüm’de dünyada kamu alanında büyük veri uygulamaları ülkeler bazında ve örnek uygulamalarla birlikte incelenmiştir. 5. Bölüm’de Türkiye’de kamu kurumları için bundan sonra büyük veri alanında yapılabilecek çalışmalarla ilgili öneriler ortaya konarak rapor sonuçlandırılmıştır.
9
TANIMLAR VE KISALTMALAR
MapReduce
Büyük veri uygulamalarında kullanılan temel algoritma, Google tarafında önerilmiştir
Hadoop
MapReduce algoritmasını açık yazılım olarak gerçekleştiren çerçeve yazılım, ilk defa Yahoo tarafından geliştirildi, şimdi Apache tarafından geliştiriliyor
Spark
Hadoop’a alternatif olarak Berkeley Üniversitesi’nde geliştirildi, şimdi Apache tarafından açık yazılım olarak geliştiriliyor. Bellek tabanlı veri yönetimi ile çok daha hızlı.
10
ŞEKİLLER Şekil 1. Hadoop 2.0 Ekosistemi.....................................................................4 Şekil 2. Spark modülleri.................................................................................5 Şekil 3. Flink yapısı........................................................................................6 Şekil 4. Kafka.................................................................................................7 Şekil 5. ElasticSearch ile Hadoop yapılanmasının bütünleştirmesi (Kaynak: ElasticSearch web sayfası).......................................................................................9
TABLOLAR Tablo 1. Türkiye'de kamuda önemli bilişim gelişmeleri.................................13
11
ÖNSÖZ İnternet ve Web’in hayatımıza girmesi, her alanda sayısallaşma, veri saklama teknolojilerinde ucuzlama ve kapasite artışı gibi gelişmelerle birlikte çok büyük veri kaynakları oluşmuş bulunmaktadır. Büyük veri şu üç temel nitelikle klasik veriden ayrılmaktadır: veri hacmi (volume), veri hızı (velocity), veri çeşitliliği (variety). Veriler büyüdükçe bu verileri geleneksel yöntemlerle işlemek zorlaşmış ve “büyük veri” işleme yöntem ve teknolojileri ortaya çıkmıştır. Son yıllarda tüm dünyada ve ülkemizde “büyük veri”ye ilgi artmaktadır. “Büyük veri” işleme yöntemleri kullanılarak sanayi, ticaret, bilim, sağlık, eğitim, kamu ve sosyal bilimler gibi hemen her alanda toplanan büyük verilerden bilgi üretilebilmekte ve bu bilgi kullanılarak karar destek sistemleri daha etkin çalışmakta ve sonuçta insan hayatı daha kolay yaşanır hale gelmektedir. Çalışma grubunun odak noktası kamu alanında büyük veri uygulamalarıdır. Kamu kurumları, büyük veri konusunda en önemli veri kaynağı ve uygulama alanlarından birisidir. Kamu kurumları hemen her alanda (büyük) veri toplamaktadır. Bu büyük verilere dayalı yürütülecek çalışmalarla toplumu ve ülkeyi etkileyecek önemli kararların alınması ve uygulamaya konması mümkün olabilmektedir. Bu çalışma çerçevesinde, Türkiye’de kamu kurumlarındaki “büyük veri resminin çekilmesi,
kurumlarda
mevcut
ve
potansiyel
“büyük
veri”
uygulamalarının
incelenmesi ve nihai olarak kamu kurumlarına “büyük veri” konusunda bir strateji yol haritasının sunulması hedeflenmiştir.
12
BÖLÜM 1 Büyük Veri 1.1 Tanım Büyük verinin farklı tanımlarına geçmeden önce tüm tanımlar için geçerli olan ve Büyük Veri kavramını diğerlerinden ayrıştırmamızda yardımcı olacak önemli ve kısa bir cümle ile başlayalım : “ilişkisel veritabanı, veri ambarı, veri siloları ve bu ortamlar için hazırlanmış olan geleneksel yöntem ve arçlarlar ile işlenemeyen veriler (boyut, hız, kompleksite, çeşitlilik, vb. unsurlar nedeniyle) büyük veri olarak algılanabilir”. En temel ve basit anlatımı ile; büyük hacimli (volume), yüksek hızlı (velocity), çok çeşitlikte (variety) veri kaynakları “büyük veri” olarak tanımlanır. Bu tanıma 3V kuralı
da
denilir.
Günümüzde
bu
V’lerin
sayısı
artırılarak
zenginleştirilen
tanımlamalara sıkça rastlanabilmektedir. Örneğin, veracity (doğruluk), value (değerli), validity (geçerli), visible (görülebilir) gibi özellikler de büyük verinin tanımına eklenebilmektedir. Teknolojinin gelişimi ile veri üretim hızının artması ve toplanan verilerin işlenebilmesi gittikçe güçleşmiştir. Günümüzde veri üretmeyen ürünün kalmadığı bir çağa doğru ilerlerken RFID, akıllı sensörler, akıllı evler, akıllı şehirler, akıllı arabalar ve akıllı telefonların ürettiği verilerin dahi geleneksel yöntemlerle işlenemeyeceği gerçeği ile yüzleşilmesi sonucunda Büyük Veri kavramı ortaya çıkmış ve her geçen gün popüleritesi daha da artmaktadır. Özellikle internet’in yaygınlaşması, sosyal medya kavramlarının ortaya çıkışı ile toplanan veri miktarlarında ve çeşitliliğinde büyük oranda artışlar gerçekleşmiştir. Bu verilerin anlamlı bir şekilde kullanılması yönünde Google’in attığı adımlar önemli yer tutmaktadır. Buna ilaveten Facebook Twitter
TM
gibi
sosyal
medya
şirketlerinin
yanısıra,
Amazon
TM
,
TM,
büyük
telekomunikasyon şirketleri, sağlık kuruluşları ve bankaların verileri hızlı bir şekilde işleyerek kişisel bazda anlamsal bilgiler üretme çalışmaları bu teknolojinin hızlı bir şekilde gelişmesini sağlamıştır. Günümüzde artık alışveriş sitelerinden, sağlık sigorta kuruluşlarına kadar her yerde büyük veriden bahsetmek mümkün olabilmektedir.
1
Yukarıda anlatılan boyut ve çeşitlilikte verilerin bir arada gerçek zamanlı yada gerçek zamana yakın bir hızda toplanması, depolanması, işlenebilmesi ve anlamlı bilgiler üretilmesinin en önemli gereksinimleri büyük oranda veri depolama olanağı ve yüksek hızlarda işlem gücüdür. Bu iki teknoloji aslında büyük veriyi var eden anahtar teknolojiler olarak görülmektedir. Son yıllara kadar veri depolama ve yüksek başarımlı hesaplama gücü çözümleri çok pahalı ve büyük teknolojileri gerektirmekte iken, dağıtık ve paralel hesaplama tekniklerinin gelişiminin yanı sıra, dağıtık depolama ünitelerinin oluşturulabileceği dosya sistemlerinin gelişmesi ile sıradan bilgisayarlar
ile
büyük
veri
işleyebilecek
yapıların
düşük
maliyetlerle
oluşturulabilmesi mümkün hale gelmiştir.
1.2 Araçlar Büyük veriyi alıp işleyecek olan programlama tekniklerinin ve yazılım çözümlerinin üretilmesi ihtiyacı ortadadır. Bu yönde en önemli ivmeyi kazandıran gelişme Google
TM
tarafından üretilmiş olan GFS dosya sistemi ve MapReduce
TM
programlama tekniği olmuştur. Aşağıda bu araçlarla ilgili özet bilgilere yer verilmektedir.
MapReduce MapReduce programlama metodu Google tarafından geliştirilen ve çok sayıda sıradan bilgisayardan oluşan küme üzerinde dağıtık/eş zamanlı olarak işlem yapmak için kullanılan bir tekniktir. Google bu metodu kamuoyu ile paylaştıktan sonra çok sayıda MapReduce metodu kullanan yazılım çözümleri üretilmeye başlandı ve büyük veri üzerinde kullanımı ile yaygınlaşmaya başladı. Bu tekniğin en önemli özelliği iki farklı işlem türü kullanarak sonuca ulaşmasıdır. MapReduce işleminin nasıl çalıştığını anlamak için bir örnek üzerinden açıklamakta fayda var. Diyelim ki elinizde çok büyük boyutlarda (örneğin Petabyte boyutlarında) düz metin yazıları bulunmakta ve siz bu yazılarının tamamı üzerinde kullanılan tüm kelimelerin her birinin toplam sayısına ihtiyaç duymaktasınız. Bu işlem için tek bir bilgisayar üzerinde çalışan bir tarama çözümü üretebilirsiniz ancak çok uzun sürelerde bu işlemin sonuçlarını alabilirsiniz. Bu durumda yapılacak olan çözümün eş zamanlı (paralel) programlama tekniğini kullanması akıllıca olabilir. Şu halde algoritmanızın eş zamanlı çalışır hale getirilmesi gerekecektir. Elinizdeki en büyük bilgisayarın 32 adet işlemci çekirdeği olduğunu varsayarsak, bu durumda gerçek anlamda eş zamanlı çalışacak olan iş sayısı bu kadarla sınırlı olacaktır. Verileriniz de tek bir depolama ünitesinde tutuluyor olduğuna göre her bir eş zamanlı çalışan iş
2
sürecinin veri erişim hızı paylaşımlı olduğundan yine istenilen sonucu almak zor olacaktır. Bir adım daha ileriye gidelim ve diyelim ki siz dağıtık programlama yöntemini de biliyorsunuz ve bu yöntemi uygulayacaksınız. Bu durumda işlerin dağıtılması işlemini, bunların herhangi birisinde hata çıkması durumunda (fault) bunu algılayıp hemen gerekli tedbirleri almak zorundasınız, tüm verileri doğru şekilde iş yapan bilgisayarlara gönderebilmeniz gerekir. Peki ya bu eş zamanlı işlerden hangisine, verilerinizin hangi bölümünü gönderdiniz? Onlarda herhangi bir sorun olması durumunda aynı verileri tekrar vermeniz ve yeniden hesap yaptırmanız gerekir. Hadi bunları da yaptığınızı düşünelim, iyi ama verileriniz tek bir disk üzerinde duruyor ise bu verileri o kadar sayıdaki eş zamanlı iş parçacıklarına hızla nasıl aktarabileceksiniz?
Gördüğünüz gibi çok sayıda sorun ile baş etmek zorundayız. İşte bu kadar çok sorunla boğuşmamak için gelin MapReduce tekniğini eş zamanlı dosya sistemleri ile birleştirerek kullanmayı düşünelim. Google’ın bu işi nasıl çözerdi? Tabii ki öncelikle kullandığı GFS (Google File System) tekniği ile verileri çok sayıdaki bilgisayara küçük bloklar halinde dağıtarak tutmayı, sonra o veri’ler üzerinde iş yapacak kod parçalarını da aynı bilgisayarlar üzerinde çalıştırmak sureti ile yukarıda bahsettiğimiz sorunların bir çoğunu bertaraf edecektir. Bunu yaparken elbette ki hata yakalama ve gerekli düzenlemeleri yapma yeteneği de yine MapReduce kod kütüphanesi içerisinde bulunacaktır. Şu halde tek yapmamız gereken önce MAP fonksiyonu ile her bir bilgisayar kendisinde mevcut olan küçük bloklar üzerinde tarama işlemi çok hızlı bir şekilde tamamlayabilir, daha sonra da REDUCE işlemi ile bu sonuçlar bir merkezde toplanabilir. İşte MapReduce programlama metodu bu şekilde çalışmaktadır. Google’in geliştirdiği GFS yerine genellikle açık kaynak kodlu olan Apache HDFS (Apache Hadoop Distributed File System) kullanılmaktadır. MapReduce hakkında : https://en.wikipedia.org/wiki/MapReduce
Hadoop Yukarıdaki anlatımımızda MapReduce programlama metodunun sonunda HDFS’den bahsettik. Ve öncesinde de bu yapılanma için birçok kütüphaneden oluşan bir ekosistemin var olması gerekliliğini ortaya koymuş olduk. Bu noktada yardımımıza
Hadoop
koşmaktadır.
Hadoop
bir
ekosistemdir
ve
içerisinde
MapReduce gibi programlama metodlarını kolaylıkla gerçekleştirebileceğimiz
3
bileşenler bulunmaktadır. Temel yapı taşlarını ise iş parçacığı yönetimi, dağıtık dosya sistemi ve MapReduce kütüphanesi oluşturmaktadır. Elbette ki bu ekosistemin iyi bir biçimde çalışabilmesi için gerekli olan diğer bileşenler de bulunmaktadır. Aşağıda Hadoop 2.0 ekosistemini gösteren şekil bulunmaktadır (Şekil 1). Hadoop Web Sayfası : http://hadoop.apache.org/
Şekil 1. Hadoop 2.0 Ekosistemi
Spark Hadoop’un MapReduce motoruna alternatif olarak geliştirilmiş olan genel amaçlı bir işlem motorunu hadoop’un diğer ekosistemi ile birleştirmek sureti ile, işlemleri hafızada yapmak sureti ile çok daha hızlı sonuçlar elde edilmesini sağlayan bir kümeleme yapısıdır. Spark’ın en önemli avantajı hafıza-içi (in-memory) çalışmasıdır. Böylelikle bazı uygulamalarda Hadoop Mapreduce’a göre 100 katı daha hızlı çalışabildiği gösterilmiştir. Bu noktada dikkat edilmesi gereken unsur çözüm için büyük miktarda hafızaya ihtiyaç olmasıdır. Spark’ın bir diğer önemli özelliği ise akan veri (streaming data) üzerinde çalışabilmesidir ve çok güçlü bir Makine Öğrenmesi desteğidir. Bünyesinde barındırdığı Spark SQL kütüphanesi ile kullanıcıya hem temel SQL işlemleri konusunda destek vermekte, hem de Hadoop
4
Ekosisteminde bulunan HiveQL gibi özelliklerle entegre çalışabilmektedir. Spark’ın 4 önemli modülü (Error: Reference source not found) şunlardır; ● ● ● ●
MLlib Makine Öğrenmesi kütüphanesi, Spark SQL kütüphanesi GraphX kütüphanesi Spark Streaming kütüphanesi
Spark Web Sayfası : https://spark.apache.org/
Şekil 2. Spark modülleri
Storm Twitter tarafından açık kaynak olarak sunulan Apache Storm akan veri işleme konusunda dağıtık hesaplama mantığını kullanan önemli bir framework olarak karşımıza çıkmaktadır. Özellikle farklı kaynaklardan gelen verilerin entegre edilmesi, bunlar üzerinde filitreler çalıştırılması gibi bir işlem bandı mantığının uygulandığı Storm içerisinde uygulamalar kendi deyimleri ile “topoloji” mantığında ve üretim bandı tekniği ile çalışması sağlanmaktadır. Spark’da bu işlem DAG (Directed Asyclic Graph) mantığı ile yapılarak gerektiğinde döngüsel iş akışlarının yaratılması sağlanırken Storm daha basit bir mantık kullanmıştır. Her ikisinin de akan veri üzerinde Makine Öğrenmesi, event processing gibi işlemleri kolaylaştırdığını söyleyebiliriz. Storm Web Sayfası : https://storm.apache.org/
FLink FLink de Spark ve Storm gibi akan veri üzerinde işlem yaparken aynı zamanda tasarımı gereği Hadoop gibi yığın veriler üzerinde de dağıtık küme işleme tekniğini kullanabilmektedir. Dolayısı ile FLink hem yığın veriler üzerinde hem de akan veriler üzerinde işlem yapabilmek için geliştirilmiş bir platformdur. Öte yandan 5
yerel olarak çalışabildiği gibi, YARN, Amazon EC2 yada Google Cloud gibi ortamlara da rahatlıkla entegre olabilecek şekilde tasarlanmıştır. Diğer platformlarda olduğu gibi, burada da Makine Öğrenmesi, Graph İşleme, İlişkisel yapılar üzerinde çalışabilme ve olay işleme (event processing) gibi yetenekleri de barındırmaktadır. Aşağıda temel yapı taşlarını gösteren bir resim bulunmaktadır (Şekil 3). FLink Web Sayfası : https://flink.apache.org/
Şekil 3. Flink yapısı
Apache Ranger Hadoop platformu için merkezi bir güvenlik mekanizması oluşturan bir framework olan Ranger, özellikle birden çok kişinin (multi-tenant) veri erişimi yapması gereken yerlerde Hadoop Ekosistemi’nin boydan boya güvenli erişim, yetki kontrolü gibi işlemlerini üstlenebilmektedir. Hadoop’un son yapılanmasında bulunan YARN desteği ile daha geniş kapsamlı özellikleri barındırabilmektedir. Proje kuluçka (incubator) aşamasında olduğundan dikkatle izlenmesi ve çok sık güncelleme ve düzeltmelerin var olduğunun bilinmesinde fayda var. Ranger Web Sayfası : http://ranger.incubator.apache.org/
6
Knox Gateway REST servislerinin tek noktadan ve güvenli bir şekilde verilmesini sağlayan bir yapılanma sağlamaktadır. Özellikle Hadoop ortamlarının güvenli şekilde yönetimini sağlamak üzere bu araç kullanılabilir. Bu proje de henüz kuluçka aşamasında bulunmaktadır. Knox Web Sayfası : https://knox.apache.org/
Kafka LinkedIn tarafından geliştirilen ve bir Apache projesi olarak açık kaynaklı olarak kullanıma sunulan Kafka akan verinin toplanması ve akan veri işleme yazılımlarına gönderilmesi için kullanılan hata-toleranslı (fault-tolerant) publishsuscribe (yayınla-abone) modelinde çalışan bir mesaj taşıyıcı aracıdır. En büyük özelliği Spark, Storm, FLink ve benzeri yapılarla entegre olabilmesi ve çok hızlı şekilde verileri aktarabilmesidir. Aşağıdaki resimde (Error: Reference source not found) görüldüğü gibi çok sayıda veri üreticisinin bir merkeze bu verileri göndermesi, ve aynı verileri çok sayıda tüketici (işlem yapacak olan küme elemanları) o merkezden verileri çekerek üzerinde yapacakları gerekli işlemleri yapmalarını sağlayan bir mekanizmadır. Örneğin bir tır filosundan devamlı olarak coğrafi bilgilerin ve aynı zamanda bu araçta bulunan birçok sensör tarafından üretilen verilerin tek merkezde toplanmasını, ve bu merkezi noktada toplanan verilerin gerçek zamanlı olarak yüzlerce bilgisayardan oluşan bir küme tarafından büyük veri analizine tabi tutulmasını istiyorsanız Kafka tam aradığınız araçtır. Kafka Web Sayfası : https://kafka.apache.org/
Şekil 4. Kafka
R R dili açık kaynak olarak geliştirilmiş olan ve özellikle istatistiksel hesaplamaya yönelik tasarlanmış bir dildir. Bu dilin Büyük Veri ortamında kullanımı gittikçe yaygınlaşmakta ve yukarıda anlatılmış olan platformların çoğu tarafından
7
kullanımı desteklenmektedir. Bu dil ile verilerin görsel hale getirilmesi de kolaylıkla yapılabilmektedir. R Web Sayfası : https://www.r-project.org/
Cascading Hadoop ve Spark ortamlarının desteklendiği bir yazılım geliştirme platformu olarak geliştirilmiş olan Cascading ve diğer destek yazılımları ile çok kolaylıkla ve güçlü yapılarda veri işleme yazılımı geliştirmek mümkündür. Büyük veri için çözüm geliştirecek olan kişilerin mutlaka incelemesi gereken bir uygulama platformudur. Özellikle verilerin alınması, işlenmesi ve yüklenmesi (ETL) işlemlerini çok kolaylıkla yapmamızı sağlayacak bu platform aynı zamanda diğer veri analizi tekniklerinin kullanımı da kolaylaştırırken, hızlı çözüm üretebilmeyi sağlamaktadır. Java yada Scala ile çözüm üretenlerin mutlaka bu projeyi takip etmesi gerektiğine inanıyoruz. Cascading Web Sayfası : http://www.cascading.org/
Elasticsearch REST
tabanlı
çalışan
Arama
motoru
sunucusu
olarak
geliştirilen
Elasticsearch, büyük veri çözümleri ile kolaylıkla entegre olabilmektedir. Örneğin hadoop ortamı ile entegre olmasını sağlayan es-hadoop yapısı sayesinde elasticsearch uygulamasının YARN ve HDFS özelliklerini kullanarak entegre olması sağlanabilmektedir. Hadoop’a gerçek zamanlı arama yapma yeteneği konusunda oldukça büyük katkılar sağlayan bu çözümün de kurumlarımızda ihtiyaç olması halinde kullanımı mümkündür. Elasticsearch Web Sayfası : https://www.elastic.co/
8
Şekil 5. ElasticSearch ile Hadoop yapılanmasının bütünleştirmesi (Kaynak: ElasticSearch web sayfası)
Diğer Araçlar HBase Hiv Pig Cassandra MongoDB CouchDB
9
BÖLÜM 2 Kamuda Büyük Veri Büyük veri teknolojileri hükümetlere bütçe yönetimi konusunda büyük tasarruf yapabilecekleri olanaklar ve avantajlar sunmaktadır. Bu sebeple son yıllarda tüm dünyada devletler ve kamu kurumları büyük veri kullanımına yönelmişlerdir. Bu alanda hızlı ilerleyen ülkeler bu avantajları daha kısa sürede kullanıyor olacak ve diğer ülkelerle yarışta arayı açacaklardır. Bu bölümde kamuda büyük veri kullanımına genel bir bakış yapılacaktır.
2.1 Kamuda büyük veri kullanımı ve fayda 2.1.1 Güvenlik Adalet sistemi için suçun ne zaman gerçekleşmek üzere olduğunu biliyor olmak hayati önem taşımaktadır. Örneğin ABD’de polis; setlerinin oluşturduğu geniş bir data yelpazesi
suçların tarihsel veri
kullanan algoritmalar yardımı ile
muhtemel işlenecek suçlar hakkında araştırma yapabilmektedir. Birçok farklı veri kümelerinin temel aldığı tek bilgi merkezli yaklaşım uygulanarak ceza ve adalet sisteminin verimliliği ve etkinliği artıracaktır. Büyük veri araçları hükümetlerin kendi ülkelerinde neler olup bittiğini izlemek ve yaklaşan (dijital) terör saldırılarını ve kötü niyetli faaliyetleri tespit etmek için kullanıldıklarında suçla mücadeledeki başarı artacaktır. Hükümetler büyük veri olanaklarını kullanabildiklerinde bürokrasi bütçelerini azaltırken aynı zamanda güvenlikten de vazgeçmeyerek vatandaşlarına çok daha etkin ve verimli bir şekilde hizmet edebilirler.
2.1.2 Geliştirilmiş Şeffaflık ve Maliyetleri Düşürürken Karar Alma Yönetimler arası şeffaflık geliştirilebilir, bunun yanı sıra, vergi mevzuatına uyacak idarenin memurlarına ve vatandaşlara gerekli olan zaman ve para da azaltılabilir. Vergi dairelerinin çoğu tüm kamu sektörüne kopyalanan kişisel verileri depolamaktadırlar. Vatandaşlar, çoğu devlet dairesinde zaten var olan bilgilerle yeni formları tekrar tekrar doldurmak zorunda kalmaktadırlar. Önceden doldurulmuş formlar hataları önler ve işlem zamanını hızlandırırlar. İsveç Vergi İdaresi, zaman
10
kazanma bağlamında, formların kişisel verilerle önceden doldurulması hizmeti sunmaktadır. Hollanda Hükümeti yıllık vergi formlarını önceden işverenlerden gelen bilgiler ve banka hesabı bilgileri ile doldurmaktadır. Tüm veriler bir merkezi birimde depolandığı zaman, idarenin memurlarının tüm bilgilere bu merkezi birimden erişmesine olanak sağlanacaktır. Bu nedenle, idaredeki hatalar ve verimsizlikler azalmakta ve doğru bilgilerin kullanılması sağlanmaktadır. Bu ise idarenin memurlarının kendi vatandaşlarına ait en güncel bilgilere erişmesine olanak sağlamaktadır. İdareler, NSA tarafından geliştirilmiş olan Accumulo gibi açık kaynak araçlarından yararlanmalıdırlar ki, bu araç bir devlet memurunun yetkisine dayalı olarak sorgulamaya ve sonuçlara olanak tanımaktadır. Büyük veri setlerini hazır bulunduran idareler, bilginin serbestçe takibini motive etmekte, şeffaflığa katkı sağlamakta ve vatandaşlarına güven vermektedir. Vatandaşların idareler tarafından toplanan ve oluşturulan bu verileri ve idarenin bunlarla ne yaptığını anlamasına izin verecektir. Bu tür veri setlerinin paylaşılması, bir yandan yeni ve yenilikçi hizmetleri geliştirme konusunda idarelere yardımcı olurken,
girişimci vatandaşlar da bu çözümlerin yapılandırılmasına yardımcı
olacaklardır. Şeffaflık, vatandaşlara idarelerin kamu kaynaklarını nasıl harcadıklarını izleme ve anlama olanağı tanıyacak ve vatandaşlar kamu kaynaklarının doğru harcanması konusunda idareleri zorlayacaklardır. Para tasarrufu sağlayıcı diğer büyük unsur da şudur ki, idareler büyük verilerle, hangi memurun nereye, hangi amaçla, ne zaman ve kimle seyahat ettiği konularında eksiksiz bir genel bakış elde edebilirler. Büyük veri teknolojileri ile güçlendirilmiş akıllı bir seyahat ve harcama yönetimi sistemi, aynı yere çok sayıda insan gönderilmesine engel olmak amacıyla, seyahatin ve yer ayırtmanın yapılmasının gerekli olup olmadığının memurlar tarafından anlaşılabilmesine olanak tanımaktadır.
2.1.3 Kişiselleştirilmiş Vatandaş Deneyimleri Vatandaşlar
mutlu
değillerse
ve
yardıma
gereksinimleri
varsa,
yapılandırılmamış ve yapılandırılmış sosyal / kamu verilerinin analizi idarelere değişen oluşlara cevap verme ve çabucak tepki gösterme olanağı sağlayacaktır. Vatandaşların bölümlenmesi ve kişiselleştirilmesi, işsiz olmalarından veya daha farklı bir hassasiyet içinde olmalarından dolayı yardıma gereksinimi olan bu vatandaşların tanımlanmalarına yardımcı olabilecektir. Algoritmalar, gerek duyulan yardımı otomatik olarak tanımlayacaktır.
11
İdareler, (ulusal) hassasiyeti ve hangi vatandaşların ne aradıklarını (yerel muhit seviyesinde, şehir seviyesinde ve eyalet seviyesinde) daha iyi anlamak için, yapılandırılmamış ve yapılandırılmış çevriniçi(on-line) verileri ve bunun yanında idareyi arayan vatandaşların ses tanıma verilerini de kullanabilir ve karar mercilerinin yeni kamu hizmetlerini geliştirmelerine ve öncelik tanımalarına yardımcı olabilirler. Buna ek olarak, hassasiyet analizi sivil itaatsizliğin potansiyel alanlarının keşfedilmesi ve gerekiyorsa önleyici faaliyetler yapılması için kullanılabilir. Böylesi bir kişiselleştirilmiş yaklaşım, seçmenlerin ne aradıkları ve en iyi nasıl hedeflenebilecekleri konusunda tam bir mutabakat elde edilmesi amacıyla seçimlerde de kullanılabilir. 2012 yılındaki Obama kampanyası, büyük verilerin politikacıların seçim kazanmalarına nasıl yardımcı olduğuna dair muazzam bir örnektir.
2.1.4 Sosyal medya, IoT, Endüstri 4.0, Akıllı şehirler Yerel yönetimler için bilgi teknolojileri çözümleri, coğrafi bilgi sistemi, veri tabanı yönetim sistemi, içerik yönetim sistemi, servis odaklı kurumsal bütünleştirme (entegrasyon) altyapısı, yönetim bilgi sistemi, mobil belediyecilik vb. uygulamaları içermektedir. Akıllı kentler yolunda daha hızlı ilerlemek için bu uygulamalar doğrudan karar alıcıların ihtiyaçlarına yönelik, ön yatırım maliyeti gerektirmeyen, tüm bilgi teknolojileri uygulamalarını birleştiren, kurumsal bütünleştirme sağlayan ve aynı zamanda merkezi yönetimin e-devlet sistemleri ile uyumlu olması gerekmektedir. Türkiye yüzde 77 oranında kentleşme yüzdesi olan yani kırsaldan kente göçün yüksek ölçüde devam ettiği, bunun sonucu olarak da kent içinde yapılaşmanın, altyapı çalışmalarının, kamusal hizmetlerin sürekli arttığı bir ülke konumundadır. Bu sayısal artışın kentlerin lehine sonuç vermesi ya da sürdürülebilir sonuçlar üretilmesini sağlaması için bilgi teknolojilerine dayalı veri toplanması, dinamik yapısı yüksek olan şehirlerimizin kalkınmasını ön plana alarak bu verinin değerlendirilmesi ve şehre özel yenilikçi çözümlere dönüşmesi gerekmektedir. Şehre özel çözümler için bilgi sistemlerine bağlı veri toplama yöntemleri; bütünleştirici, akıllı yönetişim sağlayan ve sosyal ağ temelleri üzerine kurulu bir platform niteliği taşımakta olup karar alıcılara kent içindeki insanların ihtiyaçlarına yönelik gerçek zamanlı, imkanı sağlamaktadır.
12
BÖLÜM 3 Türkiye’de Kamuda Büyük Veri 3.1 Türkiye’de Kamuda Veri İşlemenin Geçmişi Türkiye’de bilişimin ve veri işlemenin geçmişi, esas itibariyle ilk bilgisayarın girdiği 1960 yılına kadar dayanmaktadır. Dünya’daki gelişmelere paralel olarak ülkemiz kamusal alanında bilgi işlem altyapısı veriye dayalı otomasyon projeleri ile birlikte son 20 yılda büyük bir hız kazanmıştır. İnternet çağına giriş ile birlikte ilerleme hızı yeni bir boyuta da sahip olmuştur. Dağıtık verinin yaygınlaşmasıyla da beraber veriyi işleme süreci iki alanda gelişmeye başlamıştır. Bunlardan ilki çok boyutlu yapısal veri temelli İş Zekası ve Karar-Destek sistemleri olup, ikincisi ise henüz yeni gelişmekte olan Büyük Veri sistemlerdir.
3.1.2 Türkiye’de Kamuda Bilişimin Gelişimi Dünya’da bilişimin, elektronik bilgi işlem delikli kart makineleri adı verilen yığın verileri ayrık işlemlerle işlemeyi insana oranla yüz kat daha hızlı işleyen "unit record" birim kayıt makineleri ile başlandığı görüşü yaygındır. Buna göre de ülkemizdeki bilişimsel gelişmenin kısa tarihini aşağıdaki gibi zaman dizinsel olarak verebiliriz. Tablo 1. Türkiye'de kamuda önemli bilişim gelişmeleri
Yıl 1890
ABD İstatistik Bürosunda H. Hollerith, nüfus sayımı işlemlerini hızlandırma amacı ile sayma, sıralama, ayırma, listeleme, hesaplama makineleri geliştirdi. Bu makineler 1970’lere kadar istatistik, muhasebe, bankacılık, sigortacılık alanlarında yaygın olarak kullanıldı.
1923
Hollerith Muhasebe Makineleri Türkiye’de Tekel İdaresi’nde kullanılmaya başlandı.
1960
30 Ekim 1960 tarihi ülkemizin bilgi işlem tarihinde önemli bir başlangıç noktası olmuştur. Türkiye’ye bilgisayar ilk olarak Karayolları Genel Müdürlüğü’ne, yol-köprü muhasebe, stok denetimi süreçlerini yönetmek için getirtilmiş olan IBM-650 sistemidir.
13
1963
Türkiye’deki ikinci bilgisayar IBM-1620 sistemi İstanbul Teknik Üniversitesi’nde kurulmuştur. Yine aynı yıl bankacılık ve finans sektöründeki ilk bilgisayar IBM-1401 sistemi Başak Sigorta'da hizmete girmiştir.
1966
Orta Doğu Teknik Üniversitesi’nde ilk bilgisayar hizmete girmiştir.
1967
Devlet Su İşleri Genel Müdürlüğü ve Türkiye İş Bankası’nda kurumsal bilgisayarlar ilk defa kullanılmaya başlanmıştır.
1969
Bu yıldan itibaren kurumsal tip anaçatı(mainframe) tip bilgisayar sistemleri Türk Ticaret Bankası ve sonra başta Hacettepe Üniversitesi olmak üzere diğer kamu ve endüstri kesiminde şirket ve kuruluşlara yayılmaya başlamıştır.
1971
Türkiye kamu genelinde kurumsal bilgisayar sayısı 76’ya ulaşmıştır. Ayrıca bu yıl içerisinde ülkemizde örgütsel anlamda çok önemli bir adım atılmış ve 22 Nisan 1971 yılında Türkiye Bilişim Derneği (TBD) kurulmuştur. Kuruluş dilekçesinin altında imzası bulunan bilişimciler Aydın Köksal, Önal Örs, Tamer Uykal, Bülent Dikman, Ersay Gürsoy, Coşkun Arslan, Atalay Yunusoğlu ve Ünal Yarımağan’dır.
1973
Türkiye kamu genelinde kurumsal bilgisayar sayısı 82 olmuştur. Ayrıca ülkenin hava savunmasını NATO savunma sistemi içinde sağlamak üzere kullanılmakta olan 12 büyük bilgisayarla bu sayı 94’tür. 1973 yılında kurulan bilgisayarlarla bu sayı 100’ü aşmıştır.
1974
PTT Genel Müdürlüğü otomasyona geçme kararı doğrultusunda UNIVAC9030 sisteminin kuruluş ve ön hazırlık çalışmalarına başlamıştır.
1980
Bu yıllardan itibaren tüm dünyada olduğu gibi ülkemizde de kişisel bilgisayarlar (PC) hızlı bir biçimde hayatın her alanına girmeye başlamış ve bilgisayar eğitimi veren dershaneler kurulmuştur. Bilgisayarların daha küçülerek ofislere girmesiyle gelişmeler hızlandı ve her sektöre yönelik yazılımlar geliştirilmeye başlandı. Böylelikle yazılım sektörünün temelleri bu yıllarda atılmış oldu.
1986
Türkiye, Geniş Alan Ağları (WAN) ile tanıştı ve bu bağlamda Ege Deniziİtalya hattı ile EARN/BITNET sistemine entegre olmuştur.
1991
ODTÜ-TÜBİTAK’tan bir ekip ile bir DPT projesi olan TR-NET projesine başlanılmış oldu.
1993
12 Nisan 1993 tarihinde ise Ankara-Washington 64K’lık bağlantısı ile Türkiye, İnternet’le tanıştı.
1994
Kamu ve üniversitelerde büyüme/tanışma yılı olmuş, halka yönelik internet ile tanıtıcı toplantılar yapılmış ve Dialup ve X.25 üzerinden TR-
14
NET’e bağlantı oluşturulmuştur.
3.2 Türkiye’de Kamuda Büyük Veri İçerikli Projeler Kamu sektörü büyük veri konusunda araştırmalara başlamıştır. Öncü bir kısım bakanlık ve kamu kurumları şu anda büyük verinin sağladığı imkânlar ile neler yapılabileceğini görmeye çalışmaktadır. Şu an için aktif olarak büyük veri üzerine kurgulanmış bir kamu projesi bulunmamaktadır. Ancak Kalkınma Bakanlığı 20142018 Onuncu Kalkınma Planı 412. maddesinde “Açık kaynak kodlu yazılımlar, büyük veri, bulut bilişim, yeşil bilişim, mobil platform, nesnelerin interneti gibi ürün, hizmet ve yönelimler değerlendirilerek kamu için uygun olabilecek çözümler hayata geçirilecektir.” hedefi yazılmıştır. Ayrıca Kalkınma Bakanlığı 2014-2018 Bilgi Toplumu Stratejisi ve Eylem Planı Taslağı 50. Eylemi “Kamuda Büyük Veri Pilot Uygulaması Gerçekleştirilmesi” 20142016 yıllarında tamamlanması planlanmıştır. Bu eylem ile büyük verinin ekonomik değere dönüşmesi sağlanması ve sosyal güvenlik, sağlık, vergi, güvenlik gibi alanlar başta olmak üzere kamuda büyük veri uygulamalarının geliştirilmesi hedeflenmiştir. Ayrıca bu eylemin hayata geçirilmesiyle kamu kurum ve kuruluşları tarafından büyük veri alanında pilot uygulamalar hayata geçirilecek ve kamu verisi kullanılarak sosyal güvenlik alanında büyük veri pilot uygulamasının geliştirilmesi ve başarı örneklerinin oluşturulması bu teknolojilerin Türkiye’de yaygınlaştırılmasına öncülük edecektir. Sosyal Güvenlik Kurumu (SGK) sorumlu kurum olarak tespit edilmiş olup TUBİTAK ve TÜRKSAT işbirliği yapılacak kuruluşlar olarak yazılmıştır. SGK, toplamış olduğu büyük miktardaki yapılandırılmış ve yapılandırılmamış veriler üzerinde çeşitli analizler yaparak verimliliği artırmak, kayıp-kaçak oranlarını düşürmek ve hizmet kalitesini yükseltmek için büyük veri konusunda çalışmalara başlamıştır. 50. Eylemin uygulama adımları aşağıdaki şekilde belirlenmiştir: - Sosyal güvenlik alanında büyük veri uygulamaları belirlenecektir. - Büyük veri uygulama alanları ile ilgili fayda ve maliyet analizleri yapılacaktır. - Fayda ve maliyet analizine göre öncelikli alanlar ve gereksinimler belirlenecektir.
Büyük verinin kamudaki kullanım alanları hakkında ilgili kamu
çalışanlarının eğitilmesi ve büyük veri alanındaki bilinç artırılacaktır.
Ülkemizde, büyük veri çalışmalarına girdi sağlayabilecek belli başlı kamu kurum projeleri bulunmaktadır. Bunlar şöyle sıralanabilir:
15
3.2.1 Sosyal Güvenlik Kurumu (SGK) Projeleri Hizmet Sunumu Genel Müdürlüğü bünyesinde yürütülmekte olan projeler aşağıdaki başlıklarda sıralanmaktadır.
1
e-Bildirge Sistemi Tüm
sigorta prim
tahsillerinin ve işyeri tescil kayıtlarının takibinin
gerçekleştirildiği en büyük sosyal güvenlik projesidir.
2
MEDULA Vatandaşlarımıza
ait
tüm
sağlık
ödemelerinin
belirlenen
kurallar
çerçevesinde yürütülmesine yönelik olarak uygulamaya alınmış bir projedir.
3
Aylık Tahsis ve Diğer Uygulamalar Emeklilere yönelik Aylık Tahsis Uygulaması başta olmak üzere 1500 adet
olgunlaşmış eski (legacy) uygulamadan oluşan bir uygulama grubu bulunmaktadır.
4
ALO 170 Projesi Çalışma ve Sosyal Güvenlik İletişim Merkezi, 15 Kasım 2010 tarihinde
hizmete girdi. İletişim merkezi, Çalışma ve Sosyal Güvenlik Bakanlığı ile Sosyal Güvenlik Kurumu ve Türkiye İş Kurumu Genel Müdürlüğü tarafından sunulan tüm hizmetlerle ilgili olarak bilgilendirme yapmakta ve çözüm üretmektedir.
5
Veri Ambarı Projesi Sağlık, Sigortalama, Tahsis (Emeklilik) rapor grupları ile ortalama 500
standart rapordan on binlerce farklı birleşimlerde (kombinasyonda) sorgu yapılarak rapor üretilebilen bir veri ambarı oluşturulmuştur. Tüm Türkiye genelinde hizmet veren 500’e yakın uygulamaya ait verileri raporlayabilmek ve analiz etmek için kurulan veri ambarı 150 TB büyüklüğe ulaşmıştır.
3.2.2 Milli Eğitim Bakanlığı (MEB) Projeleri Bakanlığın çeşitli zamanlarda başlatmış olduğu büyük kapsamlı projeler şunlardır.
6
MEBBİS Milli Eğitim Bakanlığı Bilişim Sistemleri (MEBBİS) Milli Eğitim Bakanlığı'na
bağlı olan Bilgi İşlem Grup Başkanlığı bünyesinde faaliyet gösteren bir modüller bütünüdür. Bu modüllere öğretmenler, okul yöneticileri vb. Milli Eğitim Bakanlığı'na bağlı olarak görev yapan kullanıcı grupları giriş yapabilmektedir. 16
7
e-Okul e-Okul, Milli Eğitim Bakanlığı tarafından Milli Eğitim Bakanlığı Bilişim
Sistemleri (MEBBİS) projesi kapsamında 2007 yılının Ocak ayında kullanıma açılmış olan bir okul yönetim bilgi sistemi web yazılımıdır. Bir öğrencinin okula kaydından başlayıp, mezuniyetine kadar olan tüm süreci içeren bir sistemdir. Bilgi İşlem Dairesi Başkanlığı tarafından geliştirilmektedir.
8
FATİH Projesi FATİH (Fırsatları Arttırma ve Teknolojiyi İyileştirme Hareketi) Projesi, Milli
Eğitim Bakanlığı ve Ulaştırma, Denizcilik ve Haberleşme Bakanlığı işbirliği ile Türkiye'deki tüm dersliklere birer adet dizüstü bilgisayar, projeksiyon cihazı ve akıllı tahta koymaktır. Projenin ön kısımlarında her öğrenciye tablet bilgisayar verilmesi öngörülmektedir. Projenin amacı, bilgi toplumu yaratmak ve eğitimde teknolojiyi yararlı kılmaktır.
9
e-YANGIN e-YAYGIN Otomasyon Sistemi; Milli Eğitim Bakanlığı, Hayat Boyu Öğrenme
Genel Müdürlüğüne bağlı yaygın eğitim kurumları (halk eğitimi merkezi, mesleki eğitim merkezi, olgunlaşma enstitüsü ve turizm eğitim merkezi) tarafından sürdürülen seminer, faaliyet ve kurslara ilişkin tüm iş ve işlemlerin internet ortamında yürütüldüğü otomasyon sistemidir.
10
ALO 147 Projesi 1 Mart 2012 tarihinde Van-Erciş’te hizmete giren ve MEB İletişim Merkezi
kapsamında sürdürülen bir proje olup, Bakanlığın görev ve sorumluluklarıyla ilgili her türlü talep, şikayet, görüş ve öneri, ihbar, bilgi edinme soruları ile bakanlığın vermiş olduğu tüm hizmetler hakkında bilgiyi etkin ve hızlı bir biçimde sunabilmek ve sorunların çözüme kavuşturulabilmesi amacıyla kurulmuştur.
3.2.3 Sağlık Bakanlığı Projeleri Sağlık Bakanlığı, son yıllarda gerçekleştirmiş olduğu, birbiri ile bütünleşik çalışan büyük kapsamlı veri merkezli uygulamaları kamu hayatına kazandırmıştır.
11
e-Nabız Projesi e-Nabız Projesi muayene, tetkik ve tedavi bilgileri başta olmak üzere tüm
sağlık verilerinin yönetebildiği, tıbbi özgeçmişe tek bir yerden ulaşabilen bir kişisel sağlık kaydı sistemidir.
17
12
UBYS Projesi (Sağlık.NET) USBS, (Ulusal Sağlık Bilgi Sistemi) tüm vatandaşları kapsayan, her bireyin
kendi bilgilerine erişebildiği, bireyin doğumundan önce başlayıp tüm yaşamı boyunca sağlığıyla ilgili verilerden oluşan işlevsel bir veri tabanının, yüksek bant genişlikli ve tüm ülkeyi kapsayan bir iletişim omurgasında paylaşılması ve tele-tıp uygulamalarına varan teknolojilerin mesleki pratikte kullanılmasını temel alan elektronik kayıt sistemidir. Bu sistem ayrıca sağlık hizmeti sunan tüm kurum ve kuruluşların insan gücü, taşınır, taşınmaz, idari ve mali verilerini de kayıt altına alacak şekilde tasarlanmıştır.
13
MHRS Projesi Merkezi Hekim Randevu Sistemi; vatandaşların Sağlık Bakanlığı'na bağlı 2.
ve 3. basamak hastaneler ile ağız ve diş sağlığı merkezleri için Alo182 hattından Merkezi Hekim Randevu Sistemi'ni arayarak canlı operatörlerden veya web üzerinden kendilerine istedikleri hastane ve hekimden randevu alabilecekleri bir uygulamadır.
3.3 Kamu Kurumlarının Büyük Veri Uygulamaları 3.3.1 Kamu Kurumlarında Gerçekleştirilen Uygulamalar Kamu kurumlarına uygulanan anket sonucunda kurumlarda geliştirilen veya geliştirilmesi
planlanan
Büyük
Veri
(Big
Data)
uygulamaları
bu
bölümde
anlatılmaktadır.
14
Elektronik Kamu Bilgi Yönetim Sistemi (KAYSİS) Elektronik Kamu Bilgi Yönetim Sistemi (KAYSİS), T.C. Başbakanlık İdareyi
Geliştirme Başkanlığı tarafından hazırlanan, kamu kurumlarının teşkilat yapısından, sunulan hizmetlere, hizmetlerde kullanılan belgelerden, belgelerde bulunan bilgilere kadar kamu yönetiminde yer alan unsurların mevzuat dayanaklarıyla birlikte tespit edilerek elektronik ortamda tanımlandığı, geliştirilen e-Devlet uygulamalarının birbirine tek merkezden entegre edilerek a-Devlete (Akıllı Devlet) geçilmesini sağlayacak temel bir bilgi sistemidir.
KAYSİS projesi kapsamında şu an veri işçiliği yürütülmektedir. Proje kapsamında kamu yönetimindeki tüm unsurlar (devlet teşkilatı, sunulan hizmetler, kullanılan/üretilen belgeler, kullanılan üretilen verilere ilişkin metaveriler vb.)
18
tanımlanmaktadır. Yapılan tanımlamalar üzerinden Ulusal Süreç Haritaları ve Kamu Veri Akış Şemaları oluşturulmaktadır. Harita ve şemaların tamamlanmasıyla tüm kamusal
uygulamaların
merkezi
olarak
bütünleştirmenin
(entegrasyonunun)
sağlanacağı Ulusal Veri Santrali hayata geçirilecektir. Ulusal Veri Santrali, yapay zekâya dayalı olarak tüm kamusal verilerin işleneceği ve transferinin sağlanacağı bir yapıda olacaktır.
15
Enerji Tahmin Projesi Türkiye kıyıları için rüzgar ve dalga enerji tahmininin yapılabilmesi için bir
Türkiye Rüzgar ve Dalga Atlası projesi geliştirilmiştir. Bu proje ile bağımsız olarak T.C. Enerji ve Tabii Kaynaklar Bakanlığı Yenilenebilir Enerji Genel Müdürlüğü tarafından 2014 Aralık ayında “Türkiye Ulusal Yenilenebilir
Enerji
Eylem
Planı”
yayınlanmıştır
(http://www.eie.gov.tr/duyurular_haberler/document/Turkiye_Ulusal_Yenilenebilir_En erji_Eylem_Plani.PDF). Bu eylem planında 2023 hedefleri kapsamında yenilenebilir enerji için yapılması planlanan yurtiçi ve yurtdışı projeler, teşvik planları anlatılmıştır.
3.3.2 Kamu Kurumlarında Gerçekleştirilebilecek Projeler Ülkemizde
kamu
kurumlarında
gerçekleştirilen
ve
gerçekleştirilmesi
planlanan big data projeleri ile birlikte gerçekleştirilebilecek uygulamalar da olacaktır. Tüm kamu kurumlarının kendi iş süreçleri kapsamında elde ettikleri verileri kullanarak planlayacakları projelere örnek olması açısından birkaç örnek proje uygulaması bu başlık altında belirtilmiştir.
16
Çalışma ve Sosyal Güvenlik Bakanlığı – Türkiye İş Kurumu Çalışma ve Sosyal Güvenlik Bakanlığı Türkiye İş Kurumu (İŞKUR)’da
yapılabilecek Big Data uygulamaları ile kişilerin eğitim seviyesi, yaş aralığı, cinsiyet gibi kıstasları göz önüne alınarak iş arayanlar için birçok proje geliştirilebilir. İŞKUR için Big Data projeleri, İŞKUR, SGK ve sosyal medya verilerinin işlenmesi sonucu elde edilecek veriler ile İş Veri Bankası oluşturularak hayata geçirilebilir. Bu kapsamda “Sosyal Medya Aracılığı ile İş Öneri Sistemi” ve “Sosyal Medya Aracılığı ile Profil Yapılandırma Sistemi” projeleri örnek projeler olarak düşünülebilir. Projelerle ilgili bilgiler alt başlıklar halinde rapora eklenmiştir.
17
Sosyal Medya Aracılığı ile İş Öneri Sistemi Sosyal medya üzerinden işsizlik ile ilgili paylaşımda bulunanlara SMS – E-
posta ile ilgi alanlarına uygun iş imkânı sunulabilir. İş arayanın İŞKUR hesabına
19
sosyal medya hesaplarını (Facebook, Twitter, Instagram vb.) ilişkilendirmesi ile sosyal medyada yaptığı paylaşımlardan ve profilinden kişinin iş arama durumunda değişiklik var ise SGK hizmet dökümünden bu durum teyit edilebilir ve kişinin iş arama profiline, sosyal medyadaki ilgi alanlarına ve sosyal medyada paylaştığı iş ilanlarına uygun ilanlar İŞKUR tarafından iş arayana önerilebilir.
18
Sosyal Medya Aracılığı ile Profil Yapılandırma Sistemi Kişilerin sosyal medya hareketlerinin (profil, paylaşımlar, beğeniler vb.)
kişilerin izni ile takibe alınabilir. Kişi mesai saatlerinde ortalama paylaşım adedinden fazla paylaşım yapmaya başladıysa veya farklı kontroller yapılarak kişinin işten ayrılma sürecine girmiş olabileceği anlaşıldı ise kişinin profiline ve paylaşımlarına uygun işler kişiye önerilebilir. Bu projede kişinin işten ayrılmadan iş arama sürecine girdiğinin tespiti ve kişi işten ayrıldıktan sonra daha kısa sürede yeni bir işe başvurmasının sağlanmasıdır. Paylaşımlarına uygun işler: Kişinin sosyal medyada paylaştığı resimleri, videoları, yazılı metinleri analiz ederek kişinin ilgi alanına uygun işler bulunabilir. Örnek olarak bir kişi Kimya bölümünden mezundur ama sürekli bilişim konularında paylaşım yapıyor, o konuda sayfaları ve grupları beğeniyor ve profilinde çalışma bilgilerinde bilişim sektöründe çalıştığını belirtiyor ise o kişiye Kimya ile ilgili işlerin değil, bilişim sektöründe çalıştığı pozisyonlara benzer pozisyonlarda iş önerileri sunulabilir. Bu bilgiler hem iş önerilerinde hem de profilindeki “bana uygun işler” bölümüne çalışacak bir sistem olarak tasarlanabilir.
19
Sağlık Bakanlığı Teknolojik ilerlemelerin ivme kazanması ile birlikte veri üreten ve paylaşan
nesne sayısında ciddi bir artış yaşanmaktadır. Bununla birlikte internetin hızlanması ve herkes tarafından erişilebilir hale gelmesi sonucunda çok büyük miktarda veri üretilmektedir. Devletler ve şirketler büyük veriyi gerçek zamanlı analiz ederek anlık, uzun vadeli ve anlamlı bilgilere ulaşmayı hedeflemektedir. Ancak bu büyüklükteki veriler
geleneksel
yöntemler
ve
bu
yöntemlere
uygun
üretilmiş
araçlarla
yönetilememekte; bu nedenle araştırmacılar daha verimli model ve algoritmalar kullanarak uygun araçlar geliştirmektedir.
Teknolojik imkânların gelişmesi ve artan yaşam kalitesine bağlı olarak uzun dönemde sağlıkta sürekli daha iyiye giden bir eğilim beklenmektedir. Bu durumda büyük veri kavramı, mevcut durumda var olan ve büyüyen sağlık verisi kullanılarak
20
elde edilecek faydalar açısından büyük önem taşımaktadır. Yapılandırılmış ve yapılandırılmamış sağlık verilerinin toplanarak analiz edilmesi ile hastalıkların tanı ve tedavi süreçleri geliştirilebilmekte ve kronik hastalıklar gibi ciddi sağlık sorunlarına sahip risk altında olan bireyler tespit edilebilmektedir. Sağlık hizmetlerinin sunumunda parçalanmış ve kayıt edilmeyen bilgi, hem maliyeti yükseltir hem de sağlık bakım kalitesini olumsuz etkiler. Bu bağlamda hasta odaklı, bilgisayara dayalı, gerek duyulduğunda kolaylıkla ulaşılabilecek ve bakımın devamlılığının sağlanması için ilişkilendirilebilecek kayıtlar olarak tanımlanan Elektronik Sağlık Kayıtları halk sağlığına yönelik raporlamaların yerini alarak uzak hasta takibine olanak sağlaması açısından sağlık alanında büyük veri kullanımına bir örnek oluşturmaktadır. Google Grip Trendleri ve Google Dang Humması Trendleri sağlık alanında büyük veri uygulamalarına örnek oluşturan diğer uygulamalardır. Bu uygulamalar ile Google arama sorgusuna dayanarak grip ve dang humması hakkında yapılan arama faaliyetleri sonucunda oluşan veriler bölgeler arasında karşılaştırılabilir ve analiz edilebilir
hale
gelmektedir.
belirlenebilmektedir.
Bunlara
Böylece ek
hangi
olarak
bölgelerde
Stanford
salgın
Üniversitesinde
olduğu tıp
ve
biyomühendislik alanlarında profesör olan Dr. Russ Altman ve ekibi çok büyük veri setleri içinden istatistik, analiz ve veri madenciliği tekniklerini kullanarak Paxil ve Pravachol ilaçlarının birlikte kullanıldıkları zaman hastalar üzerinde ürkütücü bir yan etki meydana getirdiğini ortaya çıkarmışlardır. Analizler, karşıt vaka raporlama sistemi (AERS) ve Amerika Gıda ve İlaç Yönetimi Kuruluşu FDA tarafından klinikler, hastalar ve ilaç şirketlerinin 30 yıldan fazla bir süredir bilgilerinin toplandığı veritabanı kullanılarak yapılmıştır. Başka bir araştırmada da Kanada merkezli bir şirket olan Kaiser Permanente ve FDA’nın gerçekleştirdiği bir araştırma sonucunda COX-2 inhibitörü Vioxx isimli ilacı yüksek dozlarda kullanan kardiyovasküler rahatsızlıkları olan hastalarda yüksek risk faktörü olduğunu ortaya koymuştur. Bunun üzerine ilaç piyasadan geri çekilmiştir. Türkiye’de sağlık alanında yapılan büyük veri çalışmalarına bakıldığında Sağlık Bakanlığı’nın özellikle Sağlık.NET Online ve e-Nabız uygulamaları dikkat çekmektedir. Sağlık Bakanlığı büyük veri çalışmalarını altyapı, kurumsal uygulama ve vatandaş boyutu olarak ele almaktadır. Çalışmaların sağlam temeller üzerine oturtulması için en önemli ayak olan altyapı boyutu, sağlık kurumlarında elektronik ortamda üretilen verileri, doğrudan
21
üretildikleri yerden, standartlara uygun şekilde toplamayı, toplanan verilerden tüm paydaşlar için uygun bilgiler üreterek birinci, ikinci ve üçüncü basamak sağlık hizmetlerinde verim ve kaliteyi arttırmayı hedefleyen, bütünleşik , güvenli, hızlı ve genişleyebilen bir
bilgi ve
iletişim
platformu
olan
Sağlık.NET Online
ile
geliştirilmektedir. Sağlık Yönetim Sistemi (Karar Destek Sistemleri, Coğrafi Bilgi Sistemleri) kullanılarak Sağlık.NET Online ile toplanan veriler anlamlı bilgiye dönüştürülerek hizmet sunumuna ve projelere bütünleştirilmekte ve yöneticilere sağlık politikaları için karar desteği sunulmaktadır. Büyük veri çalışmalarının vatandaş boyutu olan e-Nabız Sistemi ile büyük veri, toplum sağlığını korumaya yönelik olarak vatandaşların hizmetine ve yönetimine sunulmakta ve böylece vatandaşlara tüm sağlık geçmişlerine her platformdan erişme ve sağlığını yönetme imkanı tanınmaktadır. Sağlık.Net Online, sağlık hizmeti sunan tüm tesislerden çevrimiçi (online) olarak alınan ve anonimleştirilerek korunan sağlık verilerini kullanarak karar destek uygulamaları ve büyük veri analizleri sonucunda elde edilen bilgilerle sağlık politikaları oluşturulması ve sağlık hizmet kalitesinin, alınan raporlar doğrultusunda artırılması amacıyla geliştirilmiş bir sistemdir. Sağlık.Net Online ile ortak bir veri tabanı üzerinde, kimlik bilgilerinden arındırılmış olarak toplanan veriler ile hazırlanan Karar Destek Sistemi (KDS) raporları, Sağlık Bakanlığı’nın sağlık politikaları oluşturmasında önemli bir rol oynamakla birlikte, hastane, hekim ve hizmet bazlı değerlendirme yapılmasına imkan sağlamaktadır. Sağlık.NET Online sağlık sektöründe sorunların ve önceliklerin belirlenmesinde, önlemlerin alınmasında, sektör kaynaklarının, çalışma ve yatırımların planlanmasında, sunulan sağlık hizmetlerinin kalitesinin değerlendirilmesinde aldığı rolün yanı sıra bilimsel araştırma ve çalışmalarda kullanılmak üzere yeterli düzeyde veri toplayacak ve işleyecek bir fonksiyon üstlenmiştir. Ayrıca, e-Nabız uygulamasının alt yapısını oluşturan sistem sayesinde vatandaşa kendi sağlık verilerine ulaşabilme imkânı sağlanmıştır. Büyük veriyi vatandaşın hizmetine ve yönetimine sunan e-Nabız Kişisel Sağlık Sistemi sağlığı kişiselleştirmek, kişilerin kendi sağlıklarının yönetimini bizzat kendilerine teslim etmek ve zaman/mekandan bağımsız olarak sağlık verilerine erişimlerini sağlamak için hayata geçirilmiştir. Dünyada trend haline gelen kişisel sağlık kaydı sistemlerinden biri olan e-Nabız ile tüm vatandaşlar laboratuvar tahlilleri, radyolojik görüntüleri, kullandığı reçete ve ilaç bilgileri, acil durum bilgileri, konulmuş teşhis, verilmiş her türlü rapor, kısaca muayenelerine ait her tür detay bilgileri
içeren
sağlık
kayıtlarına
cep
telefonlarından,
tabletlerinden,
bilgisayarlarından 7 gün 24 saat erişebilmekte, dilerse belirlediği kurallar
22
çerçevesinde tümünü ya da bir kısmını istediği süre kadar hekimleri ya da yakınlarıyla paylaşabilmektedir. Vatandaşın sağlığını kesintisiz olarak kontrol altında tutmasını sağlayan, ilacını içme zamanı geldiğinde ilacını hatırlatan e-Nabız, kapsamının genişliği itibariyle dünyadaki en gelişmiş kişisel sağlık kaydı uygulamalarından bir tanesidir. e-Nabız bu özellikleri ile tüm dünyadaki en iyi mobil sağlık uygulamalarının seçildiği yarışmada (Global Mobile Awards 2016) finale kalarak başarısını uluslararası alanda göstermiştir. Ayrıca TÜSİAD tarafından e-TR ödülleri kapsamında, “Kamudan Vatandaşa En iyi Uygulama” seçilmiş ve Sağlık Bakanlığına “En İyi Dijitalleşen Kurum” ödülünü getirmiştir. Sağlık Bakanlığı 2016-2017 planları içerisinde de büyük veri uygulamaları ile ilgili çalışmalar bulunmaktadır. Öncelikle kullanıcı sayısı 3 milyon 480 bini bulan eNabız’a her geçen gün yeni özellikler eklenmekte ve sistem geliştirilmektedir. Sporcu Sağlığı Bilgi Sistemi ile sporcuların ilaç-gıda etkileşimleri ve doping etkisine yol açacak çapraz etkileşim bilgilerine erişmeleri sağlanarak bilinçsiz ilaç kullanımı ve doping vakalarının öngörülmesi sağlanacaktır. Diyanet İşleri Başkanlığına bağlı sağlık ekipleri hac ve umreye giden vatandaşların sağlık bilgilerine kullanıcıların izni ile erişebilecek ve orada yapılan işlemler e-Nabız’a gönderilebilecektir. Milli Eğitim Bakanlığı ile koordinasyon sağlanarak bulaşıcı hastalığa yakalanmış öğrenciler tespit edilebilecektir. Bunların yanında, Milli Savunma Bakanlığı ile birlikte askeri raporların elektronik ortamda gönderilmesini,
askerlik hizmeti öncesi kişilerin e-
Devlet üzerinden girdikleri bilgilerin aile hekimleri tarafından görülmesini ve kişilerin Askerlik Olur Raporlarının ASAL ile paylaşılmasını sağlayan Asker Alma Sistemi ile ASAL Sağlık Entegrasyonu kurulacaktır. Ayrıca, e-Nabız ile gebelik takibi, hekim randevuları, aşı takip bilgileri ve büyüme eğrilerine ilişkin bilgilendirme mesajları gibi özelliklerin geliştirilmesi planlanmaktadır. e-Nabız ile geliştirilmesi planlanan özelliklerin yanı sıra evrensel olarak artış gösteren kronik hastalıkların mobil ortamda takibine yönelik Kronik Hasta Yönetim Sistemi ve doktor-hasta sürecini takip edebilecek yapay zeka tabanlı RoboDoktor sistemlerinin geliştirilmesi planlanmaktadır. Avrupa Birliği’nin önem verdiği konuların başında gelen kronik hastalıklara ilişkin etkin yönetim araçlarının araştırılması konusunda geliştirilmesi planlanan Kronik Hasta Yönetim Sistemi ile kronik hastalıklara sahip bireylerin hastane ziyaretleri minimize edilecek, gereksiz hastane ziyaretlerine ilişkin doğrudan ve dolaylı maliyetlerin önüne geçilecek, sistemin kullanıcılara
göndereceği
okuryazarlığının
günlük
geliştirilmesine
ve
bilgilendirme kronik
23
mesajları
hastalıklara
sayesinde yönelik
sağlık
izleme
ve
değerlendirme çalışmalarının daha hızlı ve efektif bir şekilde yapılmasına katkı sağlanacaktır.
20
Adalet Bakanlığı Adalet Bakanlığı için gündemde olan ve çalışmalarına başlanan Büyük Veri
(Big Data) uygulamaları veri ambarı ve veri madenciliği çalışmaları, Adli Veri Bankası oluşturularak hayata geçirilebilir. Adli Veri Bankası’nı kullanacak akıllı sistemler
sayesinde
birçok
hastalığın
tespiti
kolaylaşacak,
tedavi
süreci
hızlanabilecektir.
21
Suç Takip Sistemi Adli Veri Bankası projesinin hayata geçirilmesi sayesinde adli davalarda elde
edilen sonuçların analizi ile aynı dava türleri için farklı cezaların verilmesi engellenecektir. Ayrıca suçların yaş grubu ve bölgesel olarak analizi ile suçlar daha işlenmeden alınacak tedbirleri hakkında gerek bölgesel gerek de bireysel olarak çalışmalar değerlendirilebilecektir. Ayrıca bu bilgilerin analizi sonucu Türk ceza kanununda yapılacak değişikliklerde bu analizler incelenerek cezalardaki caydırıcılık oranları belirlenebilecektir.
22
İçişleri Bakanlığı İçişleri Bakanlığı, bünyesinde bulunan müdürlükler ile beraber çok büyük
miktarda işlenebilir veriye sahiptir. Bu verilerin işlenerek oluşturulacak projeler, özellikle güvenlik ve göç idaresi konularında ülkemize çok büyük katkı sağlayacaktır.
23
Aranan-Şüpheli Araç ve Kişi Tespit Sistemi Emniyet Genel Müdürlüğü (EGM) tarafından gerçekleştirilebilecek Şüpheli
Araç ve Kişi Takip Sistemi, trafikteki tüm araçların aktif paydaş olacağı bir projedir. Projenin amacı, araç içi kameralar ile plaka sorgulama ve anlık olarak emniyet birimlerine iletmek, böylelikle aranan araçların bulunmasını kolaylaştırmaktır. Otoyollara yerleştirilecek sürekli EGM kablosuz ağları ile uyumlu çalışan araç içi kameraların kullanımının zorunlu hale getirilmesi ile aranan araçların bulunması büyük ölçüde kolaylaştırılabilir. Kameralarda kaydedilen görüntülerin kameranın EGM kablosuz ağına bağlandığı andan itibaren sürekli olarak alınması, işlenmesi ve kameranın çektiği yollardaki araçların plakalarının tespiti yapılabilir. Araçların hangi saatte hangi yönde ilerlediğinin anlık olarak bulunabileceği bu sistem sayesinde kayıp ve farklı suçlara karışmış / karışabilecek araçlar kolaylıkla yakalanabilir. Bu projedeki görüntü işleme sisteminin sonraki aşamaları: 24
1. Trafikte tehlikeli araç kullanan kişilerin anlık olarak EGM’ye şikayeti ve kamera kayıtlarının şikayetle ilişkili senkron aktarımı (big data değil ama bu sisteme entegre çalışabilecek bir otomasyon sistemi), 2. Trafik cezalarının kameralardan tespit edilerek otomatik olarak kesilmesi, 3. Suçlu / aranan kişilerin kameralardan yüz tanıma sistemi ile otomatik olarak tespiti ve yerinin bulunması işlemleri gerçekleştirilebilir.
24
Gıda Tarım ve Hayvancılık Bakanlığı Gıda Tarım ve Hayvancılık Bakanlığı bünyesinde oluşturulacak Büyük Veri
(Big Data) işleme süreçleri kullanılarak elde edilecek veriler sayesinde gıda ve tarım sektörlerinde üretim ve kalitenin artması sağlanabilecektir. Üretim ve kalitenin artması dolaylı yoldan insan sağlığını da olumlu etkileyecek bir sonuç ortaya çıkartacaktır.
25
Yetiştiricilik ve Ürün Denetim Sistemi Gıda Tarım ve Hayvancılık Bakanlığı bünyesinde oluşturulacak Büyük Veri
(Big Data) işleme süreçleri sonucunda elde edilecek veriler sayesinde; gıda sektöründeki ürünlerin içeriklerinin kıyaslanması sonucu ürünlerin hem kalite hem de sağlık açısından uygunluklarının denetlenmesi sağlanabilecekken, tarım sektöründe Türkiye’nin günümüzdeki en önemli sorunlarının başında gelen genetiği ile oynanmış ürünlerin sayısında azalma yaşanacağı gibi bu üretim sektöründe çalışan çiftçilerin ürün yetiştirme döneminde faydalanacakları metot ve yan ürünler sayesinde hem sağlıklı hem kaliteli ürünleri üreterek piyasaya sunmalarına zemin hazırlayacaktır. Hayvancılık sektöründe ise ilaçlı tarımın azaltılması, genetiği ile oynanmış tohumların kullanımının engellenmesi
gibi
çalışmalar
sonucunda
hayvanlara verilen besin kalitesinin artması ile birlikte yapılacak bölgesel ve zamansal analizler sonucu hayvanların sağlığı ve onlardan elde edilen ürünlerde de kalite artmış olacaktır.
3.4 Mevzuat ve Strateji Açık Veri ve Veri Güvenliği Açık veri konusunda mevzuat değişiklikleri ile verilerin güvenliği ve bu verilerin kullanımının daha güvenilir hale getirilmesi ile ilgili mevzuat değişiklikleri Bilgi teknolojilerinin yaygınlaşması ile beraber bilgi üretimi de ciddi boyutlarda artış göstermiştir. Bilgi teknolojileri yaygınlaşmadan önce, bilginin büyük
25
bir çoğunluğu basılı dokümanlarda iken, günümüzde bilgi teknolojileri tarafından işlenir duruma gelmiştir. Bu nedenle günümüzde bilgiye erişme imkânları geçmiş ile karşılaştırılamayacak seviyede artmıştır. Bu durum, birçok dezavantajı beraberinde getirmektedir. Bilgi teknolojileri üzerinde bilinçli veya bilinçsiz yapılan hataların çok ciddi sonuçlar doğurması olasıdır. Bilgi teknolojilerindeki açıklıklar ve dikkatsiz yapılandırmalar bilgiye yetkisiz erişime yol açabilir. Geçmişte sadece fiziksel güvenliğin tesis edilmesi ile sağlanan bilgi güvenliği, günümüzde kurumların en çok zorlandıkları ihtiyaçların başında gelmektedir. Birçok akademik kaynakta, bilgi güvenliğinin teknik ve teknolojik bir kavram olmadığı vurgulanmakta, bilgi güvenliğinin sağlanması için kurum kültürünün değiştirilmesi, kurum üst yöneticilerinin bilgi güvenliği ile ilgili süreçlerde rol alması gibi sosyal çalışmalara değinilmektedir. 5651 sayılı Internet ortamında yapılan yayınların düzenlenmesi ve bu yayınlar yoluyla işlenen suçlarla mücadele edilmesi hakkında kanun ile içerik sağlayıcı, yer sağlayıcı, erişim sağlayıcı ve toplu kullanım sağlayıcıların yükümlülük ve sorumlulukları ile internet ortamında işlenen belirli suçlarla içerik, yer ve erişim sağlayıcıları üzerinden mücadeleye ilişkin esas ve usulleri düzenlenmiştir. Ülkemizde,
daha
önce
düzenleyici
mevzuat
konusunda
çalışmalar
yapılmaktaydı ancak genel kapsamlı bir çalışma olmamakla beraber kurumların kendi bünyesinde uyguladıkları yönetmelikler düzeyindeydi. Kullanılan genel mevzuat ise 5651 sayılı Internet ortamında yapılan yayınların düzenlenmesi ve bu yayınlar yoluyla işlenen suçlarla mücadele edilmesi hakkında kanundu ancak bu kanun işlenen verilerden ziyade internet ortamındaki içerik sağlayıcı, yer sağlayıcı, erişim sağlayıcı ve toplu kullanım sağlayıcıların yükümlülük ve sorumlulukları ile internet ortamında işlenen belirli suçlarla içerik, yer ve erişim sağlayıcıları üzerinden mücadeleye ilişkin esas ve usulleri düzenlenmiştir. Ancak 24.03.2016 tarihinde yasalaşan ve 07.04.2016 tarihinde resmi gazetede yayımlanan kişisel verilerin korunması kanunu ile işlenen verilerin ne gibi şartlarda işlenebileceği ve kimlerle hangi şartlarda paylaşılacağı konularını genel olarak ele almaktadır.
Kişisel verilerin kullanımı yasasına büyük veri süreçlerinin dâhil edilmesi Kişisel verilerin kullanımı yasasında özellikle büyük verilere ve büyük veri tabanlarına sahip olan firma ya da kurumların bu verileri işlerken uyulması gereken esaslardan bahsedildiği için bu yasa kapsamında büyük veri süreçlerinden bahsedilmemektedir. Bu süreçlerin yasaya dâhil edilmemesinin sebebi bilgi
26
miktarının büyüklüğü ya da küçüklüğünden ziyade bilgilerin kişisel veri kapsamına girip girmemesidir. Kişisel verilerin işlenmesi ile ilgili kişi onaylarının zorunlu tutulması hatta ıslak imza ya da e-imza ile onaylanmasının zorunlu tutulması faydalı olacaktır. Ancak kişisel verileri işleyen büyük firmalar arasında bankalar gibi bir müşterisinden hesap açmak için bile yaklaşık 15 sayfalık bir şartnameyi imzalamasını talep eden firmalar bulunmaktadır. Bu nedenle özellikle bu gibi durumların önüne geçebilmek için bu onayın ayrı bir metin olarak kişilere onaylatılması zorunlu tutulursa hem insanlar açısından bu verilerin işlenmesinin ve saklı tutulmasının önemi daha iyi anlaşılır hem de firmalar bu verileri işlemek için onay almanın önemi daha iyi anlaşılabilir. Bununla beraber kişilerin imzaladığı metinlere kurumların kişisel verileri izinsiz kullandıkları takdirde karşılaşacakları yasal müeyyidenin bir özetinin konulmasının zorunlu tutulması da yine bu verilerin öneminin hem firmalar hem de kişiler tarafından anlaşılmasında pozitif bir etki yapabilir. Yürürlükte bulunan kişisel verilerin korunması kanunu için ülke çapında kamu spotu şeklindeki reklamlar yayınlanarak, ilan panolarına bilgilendirme notları asılarak ve önemli noktalara mobil standartlar kurularak tüm vatandaşların bu kanun hakkında daha fazla bilgi sahibi olması, kişisel verilerin korunmasındaki önemin vatandaşın daha iyi kavraması noktasında yine pozitif bir etki yaratacaktır.
Yasal Dayanaklar ve Strateji Kamu kurumlarının bünyesinde geliştirilen ve geliştirilmesine devam edilen büyük veri odaklı çözümler, yasaların kendisine verdiği yetkiler çerçevesinde geliştirilmesi gerekmektedir. 17 Mart 2016 tarih ve 29656 sayılı Resmi Gazete'de yayımlanan “Kişisel Verilerin Otomatik İşleme Tabi Tutulması Karşısında Bireylerin Korunması Sözleşmesi (108 sayılı Sözleşme)”ne göre: - Otomatik işleme konu olan kişisel veriler; belli ve meşru amaçlar için kaydedilir ve bu amaçlara aykırı şekilde kullanılamaz, kaydedilme amaçlarına göre uygun ve yerinde olur ve aşırı olmaz (m. 5). - Yukarıdaki madde de dâhil olmak üzere Sözleşme’nin bazı maddelerine (5, 6 ve 8), Sözleşme’de yer verilen hâllerde istisna getirilebilir (m. 9/2). Bu hâller arasında, “devlet güvenliğinin korunması, kamu güvenliği, devletin mâli menfaatleri veya suçların önlenmesi” hususları da yer almaktadır.
27
Ayrıca, Anayasa’da, kişisel verilerin korunmasına ilişkin esas ve usullerin kanunla düzenleneceği hükmü yer almaktadır (Anayasa, m. 20). 7 Nisan 2016 tarih ve 29677 sayılı Resmî Gazete’de yayımlanan “Kişisel Verilerin Korunması Kanunu (KVKK)”na göre: ●
●
● ●
●
●
Kişisel verilerin işlenmesi uyulması gereken genel ilkeler arasında, “işlendikleri amaçla bağlantılı, sınırlı ve ölçülü olma” ilkesi bulunmaktadır (KVKK m.4/2/ç). İşlenmesini gerektiren sebepler ortadan kalktıktan sonra kişisel veriler, resen veya ilgili kişinin talebi üzerine veri sorumlusu tarafından silinir, yok edilir veya anonim hâle getirilir (KVKK, m. 7/1). Bu sorumluluğu yerine getirilmeyenler hakkında, KVKK m. 17/2’de de belirtildiği üzere ilgili cezâi hükümler uygulanacaktır (TCK, m. 138). Kişisel veriler, kural olarak ilgilisinin açık rızası olmaksızın aktarılamaz. Bu kuralın bazı istisnaları bulunmaktadır (KVKK, m. 8/2). Veri sorumlusunun görevleri (KVKK, m. 10), veri sorumlusunun veri güvenliğine ilişkin yükümlülükleri (KVKK, m. 12) ve verileri işlenen ilgili kişinin hakları (KVKK, m. 11) Kanun’da düzenlenmiştir. Buna göre ilgili kişi; verilerinin işlenip işlenmediğini, ne amaçla işlendiğini, amaca uygun işlenip işlenmediğini, yurtiçi/yurtdışına aktarılıp aktarılmadığını öğrenme hakkına sahiptir. Bunların dışında ilgili kişinin, “işlenen verilerin münhasıran otomatik sistemler vasıtasıyla analiz edilmesi suretiyle kişinin kendisi aleyhine bir sonucun ortaya çıkmasına itiraz etme” hakkı da bulunmaktadır. Kanun’da, Veri Sorumluları Sicili öngörülmüştür (KVKK, m. 16). Buna göre kişisel veri işleyen gerçek ve tüzel kişiler, bu sicile detaylı bilgi göndermek zorundadır (m. 16/3). Kurul tarafından bu Sicile kayıt zorunluluğuna; işlenen kişisel verinin niteliği, sayısı, veri işlemenin kanundan kaynaklanması vb. hâllerde istisna getirilebilecektir (m. 16/2). KVKK’da yer alan hükümlerin uygulanmayacağı istisnâi hâller düzenlenmiştir (KVKK, m. 28). Bu maddenin her iki fıkrasında yer alan hükümler, kamu açısından önemlidir. Nitekim, “Kişisel verilerin millî savunmayı, millî güvenliği, kamu güvenliğini, kamu düzenini veya ekonomik güvenliği sağlamaya yönelik olarak kanunla görev ve yetki verilmiş kamu kurum ve kuruluşları tarafından yürütülen önleyici, koruyucu ve istihbari faaliyetler kapsamında işlenmesi” hâli, kapsam dışında bırakılmıştır.
Yukarıdaki değinilenler haricinde konuya ilişkin hükümlere; başta Anayasa (m. 20), Türk Medeni Kanunu (m. 24) ve Türk Ceza Kanunu (m. 135 vd.) olmak üzere farklı mevzuatlarda yer verilmiştir. Kişisel verilerin silinmesi, yok edilmesi ve anonim hâle getirilmesi konusu, bir (1) yıl içerisinde çıkarılacak (KVKK, gm. 1/4) bir yönetmelikle düzenlenecektir (KVKK, m. 7/3).
28
3.5 Kamu Kurumlarında Büyük Veri Kullanımı ve Büyük Veri Algısı Bu çalışma kapsamında büyük veri konusunda “Kamu Kurumlarında Büyük Veri Anketi” hazırlandı ve birçok kamu kurumları ankete katkı sağladılar. Yapılan anketin sonuçlarına göre büyük veri konusunda oluşan sayısal veriler ile sonuçların değerlendirilmesi bu bölümde yapılacaktır.
Soru 1. Kurumunuzun çalışma alanı nedir? Ankete katılan kurumların dağılımı aşağıdaki şekilde gösterilmiştir. Ankete, Ulaştırma, Belediye, Eğitim, Ekonomi ve Sağlık kurumları başta olmak üzere 18 kamu kurumu katılmıştır.
Soru 2. Verilerinizi nerede tutuyorsunuz? Kamu kurumlarında uygulama verilerinin nerede tutulduğu ve çoktan seçmeli çok seçimli soruna alınan cevaplarda, kamu kurumlarının ● ● ●
%86,8’i rack sunucularında, %24,1’inin tekil sunucularda, %24,1’inin ise bulut sunucularında
barındırıldığı sonucu ortaya çıkmıştır.
29
Soru 3. Kurum olarak “büyük veri” konusuna ilginiz var mı? Kamu kurumlarının büyük verilerin işlenmesi ve büyük veri projelerinin gereksinim oluşturması noktasında kurumlardan aldığımız geri dönüşler sonucunda kurumların: ● ● ● ● ●
%13.8’inin büyük veri konusuna ilgi duymadıkları, %10.3’ünün araştırma seviyesinde ilgi duydukları, %27,6’sının araştırma seviyesinin ilerisine gidip proje fikirlerini değerlendirme seviyesinde ilgi duydukları, %31’inin büyük veri konusunda proje planlaması yapacak seviyede ilgi duydukları, %17,2’sinin proje gerçekleştirme veya büyük veri yatırımı yapacak seviyede ilgi duydukları
sonucu ortaya çıkmıştır.
Soru 4. Kurum olarak “büyük veri” stratejiniz var mı? Kamu kurumlarının büyük verilerin işlenmesi ve büyük veri projelerinin kurum iş süreçlerine etkisini ölçerek uzun vadeli bir strateji oluşturması noktasında kurumlardan aldığımız geri dönüşler sonucunda kurumların; ● ● ●
%24.1’inin büyük veri konusunda stratejik bir çalışma yapmadığı, %34,5’inin büyük veri konusunda stratejik çalışma yapılmasının gerekliliği üzerinde durduğu, %20,7’sinin büyük veri konusunda stratejik çalışma yapılmasını uzun vadede planladığı,
30
● ●
%17,2’sinin büyük veri konusunda stratejik çalışma yapılmasını kısa vadede planladığı, %3,4’ünün büyük veri konusunda stratejik çalışmasının bulunduğu
sonucu ortaya çıkmıştır.
Soru 5. Kurumunuzdaki verinin büyüklüğü nedir? Kamu kurum uygulamalarında oluşan ve her geçen gün büyüyen verilerin anketin yapıldığı tarihi itibariyle büyüklüğünün tanımlanması istenmiştir. Kurumlardan alınan cevaplara göre kamu kurumların; ● ● ● ● ●
%44,8’inin verileri 10 TB’ın üzerinde, %24,1’inin verileri 1 TB ile 10 TB arasında, %13,4’ünün verileri 100 GB ile 1 TB arasında, %17,2’sinin verileri 10 ile 100 GB arasında, %0’ının verileri 10 GB’ın altında
olduğu sonucu ortaya çıkmıştır. Kurumların verilerinin her geçen gün katlanarak büyümesi ve veri kaynaklarının çeşitlenmesi ile büyük veri projelerine ihtiyacı artacaktır.
31
Soru 6. Kurumunuzda yapısal ve yapısal olmayan veri büyüklüğü oranları nedir? Kamu kurumlarında veri büyüklüğünün yanı sıra verilerin yapısal olup olmadığı da büyük veri uygulamaları için önemli bir faktördür. Yapısal verilerin işlenmesi noktasında birçok kolaylık var iken yapısal veriler ile yapısal olmayan verilerin birlikte işlenmesinin gerektiği durumlarda devreye giren büyük veri uygulamalarının verileri anlık ve daha az maliyetle daha hızlı işleyebilme noktasındaki avantajları göz önünde bulundurulduğunda, kurumlar için daha fazla işlevsel uygulamaların geliştirilmesine olanak sağlayabilir. Kamu kurumlarından alınan cevaplara göre; ● ● ● ● ● ●
%3.4’ünün verilerinin tamamının yapısal olduğu, %34,5’inin verilerinin %80 yapısal olduğu, %17,2’sinin verilerinin %60 yapısal olduğu, %27,6’sının verilerinin %40 yapısal olduğu %17,2’sinin %20 yapısal olduğu, %0’ının %0 yapısal olduğu
sonucu ortaya çıkmıştır. Kurum verilerinin yapısallık oranları incelendiğinde kamu kurum verilerinin büyük bir yüzdesinin yapısal olmadığı ve işlenmesinde zorluklar yaşandığı tespit edilmiştir. Yapısal ve yapısal olmayan verilerin uzun vadeli planlamalar ile büyük veri yapıları ile kullanılması, kurumların işleyişlerini daha etkin hale getirecektir.
Soru 7. Kurumunuzda veri işlemede aşağıdaki hangi yaklaşımı uyguluyorsunuz? Kamu kurumlarının verileri işleme yaklaşımların araştırılırken tüm proje verilerin ortak (merkezi) bir sistemde mi barındırdıklarını yoksa bulundukları sistemlerden gerektiğinde bütünleştirme ile mi alınarak işlem yapıldığı sorusundan alınan cevaplara göre kurumların; ● ●
%69’u verileri ortak bir sistemde (warehouse, veritabanı gibi) toplayıp işliyor %51,7’si verileri bulundukları sistemlerde işleyip gerektiğinde bütünleştirme (entegrasyon) yapıyor
32
sonuçları ortaya çıkmıştır.
Soru 8. Büyük ölçekli veri işlemede hangi yöntemleri kullanıyorsunuz? Kamu kurumlarının büyük miktardaki verilerini işleme yöntemlerine bakıldığında her ne kadar iş zekası çözümlerinin oranı artmış olsa da klasik yazılım geliştirme yöntemleri ile işleme en sık kullanılan yöntem olmaya devam etmektedir. Kurumlardan alınan cevaplara göre kurumların; ● ● ● ● ●
%55,2’si klasik yazılım geliştirme yöntemleri ile %31’i iş zekası çözümleri ile %6,9’u büyük veri çözümleri ile %6,9’u bu üç yöntemin dışında farklı çözümler ile verilerin işler iken %31’i henüz büyük ölçekli veri işlemediğini
belirtmiştir. Bu istatistik incelendiğinde büyük veri kullanan kurum sayısının çok düşük bir oranda kaldığı, klasik yazılım geliştirme yöntemlerine olan alışkanlığın bir süre daha devam edeceği gözlemlenebilir.
33
Soru 9. Büyük veri konusunda kurumunuzda hangi yatırımlar yapıldı? Kamu kurumlarının büyük veri konusundaki yatırımları gelecek planlamaları için önemli bir yer tutmaktadır. Kurumların bu konudaki yatırımlarının sorulduğu soruya gelen cevaplara göre kurumların; ● ● ● ● ●
%37,9’u yazılım yatırımı, %34,5’i donanım yatırımı, %20,7’si eğitim yatırımı, %13,8’i insan kaynağı yatırımı yaparken %29,9’u henüz hiçbir yatırım yapmadığını
belirtmiştir.
Soru 10. Büyük veri yatırımlarınızın yaklaşık değeri nedir? Büyük veri konusunda yapılan yatırımların değeri sorulduğunda gelen cevaplara göre kurumların; ● ● ● ● ●
%41.4’ü 500.000’in üzerinde, %13,8’i 100.000 ile 500.000 arasında, %3.4’ü 50.000 ile 99.000 arasında %6,9’u 50.000’den az yatırım yaparken %34.5’u hiç yatırım yapmadığını
belirtmiştir.
34
Soru 10. Büyük veri projeniz var mı? Kamu kurumlarının büyük veri projelerinin sayılarını sorduğumuz soruya gelen cevaplara göre kurumların; ● ● ● ●
%6,9’unun 5’in üzerinde, %17,2’sinin 2-5 arasında, %10,3’ünün 1 projesi var iken Kalan %65,5’inin ise hiç projesinin olmadığı
belirtilmiştir. Bu sorunun cevapları önceki sorularla karşılaştırıldığında kamu kurumlarının veri madenciliği, iş zekası, yüksek boyuttaki yapısal verilerden alınan raporların büyük veri projeleri kapsamın alındığı sonucu ortaya çıkabilir. Bu noktada büyük veri tanımının net bir şekilde yapılması ihtiyacı oluşabilir.
Soru 11. Büyük veri projeniz yoksa kurumun büyük veri konusunda gelecek planları nelerdir? Büyük veri projesi bulunmayan %69 oranındaki kamu kurumlarının kısa ve uzun vadede büyük veri planları sorulduğunda alınan cevaplara göre kurumların; ● ● ●
%18,2’si önümüzdeki 2 yıl içinde en az bir büyük veri projesine başlayacağını, %36,4’ü gelecekte geliştirmeyi planladığı ama zamanı belirsiz olan en az bir büyük veri projesinin olduğunu belirtirken Kalan % 45,4’lük dilimin hiçbiri büyük veri konusunda proje geliştirmeyi düşünmediklerini belirtmiştir.
Genel oranı aldığımızda kurumların %29,7’si büyük veri konusunda proje planlaması yapmaz iken önümüzdeki 2 yıl içinde büyük veri projesine başlamayı planlayan kurumların oranı %11,9, süre belirtmeksizin gelecekte bir büyük veri projesine başlamayı planlayan kurumların oranı ise 23,8’dir.
35
Soru 12. Büyük veri projelerinde çalışan sayınız kaçtır? Büyük veri konusuna yapılan insan kaynağı yatırımının ölçüldüğü bu soruya verilen cevaplara göre kurumların büyük veri projeleri için gerçekleştirdiği istihdam sayıları: ● ● ● ●
%10,3’ü 10’un üzerinde çalışan ile, %6,9’u 6-10 arası çalışan ile, %34,5’i 1-5 arası çalışan ile büyük veri projelerini geliştirirken %48,3’ü büyük veri konusunda henüz personel istihdamı yapmamıştır.
Soru 13. Büyük veri işlemede hangi teknolojileri kullanıyorsunuz ya da inceliyorsunuz?
36
Soru 14. Kurumunuzda “Büyük Veri Analitiği” konusunda aşağıdaki konularda yetkin çalışan sayısını belirtiniz.
Ankete katılan kurumlarında yarısında veya biraz daha fazlasında büyük veri analitiği konusunda yetkin çalışan olmadığı görülmektedir (mavi çubuklar - 0 çalışan). Ancak önemli bir kısmında (%40-50) en az 1 analitik konusunda çalışan bulunabilmektedir. Belirgin teknolojilerde, örneğin Hadoop’ta, 31 kurum içinde 9’unda bilen en az bir kişi bulunmaktadır (%33). Bu da büyük veri teknolojilerinden tamamen uzak olmadığımızı göstermektedir.
37
38
BÖLÜM 4 Dünya’da Kamuda Büyük Veri Uygulamaları 4.1 ABD’de Kamuda Büyük Veri Amerika Birleşik Devletleri’nde (ABD) 11 Eylül saldırılarından sonra çıkartılan Vatanseverlik Yasası (PATRIOT Act),
Elektronik İletişim Mahremiyeti Yasası
(Electronic Communication Privacy Act) ve tasarı halinde bekleyen Siber İstihbarat Paylaşımı ve Korunması Yasası (Cyber Intelligence Sharing and Protection ActCISPA) gibi yasalar, farklı biçimlerdeki (yapısal veya yapısal olmayan) büyük boyutlu verilerin devlet tarafından işlenmesine ve herhangi bir izne tabii tutulmadan e-posta hesaplarına erişimine izin vermektedir. Buna karşın mevzu hukuk, finans ve sağlık hizmetleri gibi kanunlar tarafından detaylıca belirlenmiş bazı sektörler için, kamuyla ilgili büyük veri uygulamalarının veriye erişiminde engel oluşturabiliyor. ABD’de sağlıkla verileriyle büyük veri çalışması yapmak için bu çalışmaların sağlık hizmetleriyle ilgili mevzuata dayandırılarak yapılması gerekiyor. Sağlık hizmetleri ile ilgili en önemli iki yasa Sağlık Sigortası Taşınabilirlik ve Hesap Sorulabilirlik Yasası (Health Insurance Portability and Accountability Act-HIPAA) ve 2009 yılında bu yasanın kapsamını genişleterek çıkarılan Ekonomik ve Klinik Sağlık için Sağlık Bilgi Teknolojileri yasasıdır (Health Information Technology for Economic and Clinical Health Act-HITECH). Bu iki yasa, kişinin sağlık verilerindeki kimlik bilgilerinin gizliliğinin korunmasını sağlamak için kurallar koymakta, kişisel sağlık verilerinin büyük veri analizlerinde kullanımına miktar ve tipi bakımından sınır çizmektedir. 2014 yılı şubat ayında yapılan bir büyük veri çalışması için sağlık hizmeti bilgileri ancak kendi verilerini paylaşmaya gönüllülerin verilerinden toplanabilmiştir (G.-H. Kim et al, 2014). Yüksek hacimli veri akışının analizini yönetmek amaçlı ölçeklenebilir ve kümelenmiş bir altyapı oluşturmak için 2002 yılında ABD ile IBM arasında bir iş birliği başladı ve bu işbirliğinin sonucunda devlet kurumları ve iş dünyası tarafından yaygın olarak kullanılan IBM Infosphere Stream ve IBM Big Data adında iki platform ortaya çıktı. Binlerce kaynaktan, gerçek zamanlı olarak gelen verinin gösterimi ve işlenmesini sağlayan bu platformlar Hadoop kullanılarak geliştirilmiştir (Jain P et al, 2013).
39
2009 yılında, şeffaf ve hesap verebilir bir devlet için bir adım olan ve günümüzde ulaştırma, ekonomi, sağlık hizmetleri, eğitim, çevre,
tarım, kamu
güvenliği ve yerel yönetimler vb. alanlarda 199,792 veri kümesini yayınlayan data.gov internet sitesini kullanıma sunmuştur (“About Data.gov”, 2013). 2010 yılında Bilim ve Teknoloji Başkan Danışmanları Konseyi (Devletin ağ ve bilgi teknolojileri hakkındaki araştırmalara yapacağı yatırımların koordine edilmesini sağlayan ana mekanizma), Designing a Digital Future: Federally Funded Research and Development in Networking and Information Technology isimli raporunda bir büyük veri stratejisini ayrıntılarıyla belirtti. 2012 yılında Obama Yönetimi, bilim, sağlık, enerji ve savunma ile alakalı birden çok kuruma 200 milyon dolarlık bir yatırımı öngören Büyük Veri Arge Girişimi’ni (Big Data Research and Development Initiative) duyurdu. 2014 Şubat ayında Milli Sağlık Enstitüsü (National Intitute of Health-NIH) yüzlerce terabaytlık genetik veriyi kendi süper bilgisayar geliştirme gereksinimini ortadan kaldırarak, Amazon’un bulut ortamına yükledi. 2012 yılında Milli Bilim Vakfı (National Science Foundation-NSF) Milli Sağlık Enstitüsü’nü büyük veriyle ilgili bilimsel ve teknolojik gelişimi amaçlayan programına dâhil etti (Core Techniques and Technologies for Advancing Big Data Science & Engineering Program). Birçok devlet kurumu kendi büyük veri programını başlattı. ABD’nin vergileri toplamaktan sorumlu kurumu Devlet Gelirleri Dairesi (The Internal Revenue Service) vergi kaçırma ve dolandırıcılıkla başa çıkmak için büyük veri analiz yetenekleri kazandı. ABD Savunma Bakanlığı (Department of Defense-DOD), hedeflerinden
biri
olarak
büyük
veriyi
kullanarak
makine
öğrenimi
gerçekleştirebilmek için milyonlarca dolar harcıyor. ABD’de yerel yönetimler de büyük veri projeleri başlattı. Örneğin 2011 yılında New York eyaletinin Syracuse şehri yönetimi terkedilmiş konutların önüne geçebilmek için IBM ile bir akıllı şehir projesi yaptı. (IBM, 2011) Michigan Bilgi Teknolojileri Departmanı diğer devlet kurumları ve organizasyonlara tek kaynaktan hizmet sağlayabilmek için Michigan vatandaşlarının bilgilerini veri ambarında tutuyor. ABD Gelişmiş Savunma Araştırma Projeleri Kuruluşu (DARPA), Nexus 7 adlı program kapsamında veri bilimcilerini Afganistan’da taktiksel kararlara yardımcı olması amacıyla cephede kullanmıştır. Uydulardan elde edilen yolların kullanım durumu verileri işleyerek patlayıcı tuzakların yerinin daha kolay tespit edilmesi sağlanmıştır. DARPA’nın bir diğer büyük veri uygulaması olan Memex isimli
40
programı, internet sitelerinin taranarak, insan kaçakçılığı ağlarının saptanmasına katkıda bulunmuştur. 2014 yılında Obama’ya sunulan Büyük Veri: Fırsatları Yakalamak, Değerleri Korumak adlı raporda büyük veri uygulamalarının ekonomi ve diğer alanlarda olumlu yönlendirici etkisinin yanında bireyle devlet arasındaki güç dengesini bozması açısından, büyük veri uygulamalarının özgürlüklere olan potansiyel tehdidine dikkat çekilmiştir. Raporda öngörücü tıp uygulamalarının büyük verinin sağlık hizmetleri konusunda geldiği en ileri nokta olduğu belirtilmiştir. Hayat standardı ve sağlık arasındaki güçlü ilişkinin diğer kişisel verilerle sağlık verisi arasındaki ayrımı gittikçe zorlaştırdığından, mevcut düzenlemelerde değişiklikler yapılması ve veriye kontrollü erişim için evrensel standartların ve altyapının oluşturulması gerektiği yorumu yapılmıştır (Podesta, J. et al, 2014). ABD’de eğitimle alakalı veriler ve çocuklara ait kişisel veriler kanun ile korunmaktadır. Çevrimiçi eğitim platformlarının yaygınlaşması ve bu platformlardan elde edilebilecek verilerin kritik olması bu tür tedbirleri gerektirmektedir. Çocukların Çevrimiçi Mahremiyetini Koruma Yasası (Children’s Online Privacy Protection Act), internet sitesi operatörleri veya uygulama geliştiricilerini 13 yaş altı çocukların kişisel verilerini toplamadan önce velinin iznini almaya zorunlu kılmıştır. Eğer bir okul, başka kurumdan çevrimiçi eğitim hizmeti almak isterse, mevzuatta belirtilen şartlar sağlanmalı, öğrenci verileri sadece eğitim amaçlı ve doğrudan kontrol edebilecek şekilde paylaşılmalıdır. ABD Yurt Güvenliği Departmanı (Department of Homeland Security), 2012 yılında, 22 alt kurumunun verilerinin tek bir noktada toplanması için büyük veri işleme kabiliyetine sahip Neptune ve Cerberus isimli iki pilot projeyi başlatmıştır. Bu projeler kapsamında kişisel veriler sınıflandırılmış, kullanıcıların özelliklerine göre veri sınıflarına erişiminin kontrolü sağlanmıştır.
4.2 AB’de Kamuda Büyük Veri Avrupa Birliği Komisyonu 2010 yılında hızlı ve ultra hızlı çalışabilen internet uygulamaları ile tek bir dijital pazardan AB vatandaşlarına sürdürülebilir ekonomik ve sosyal faydalar sağlamak için neler yapılması gerektiğini belirten bir doküman olan Avrupa için Dijital Gündem’i yayınladı (European Commission,2010).
2012 yılında yayınlanan benzer bir gündem dökümanında (Digital Agenda for Europe and Challenges for 2012) verinin korunması, IoT’nin geliştirilmesi, makineler
41
arası iletişim, internet güvenliğinin sağlanması gibi konuların önemi ve elde bulunan kamu verilerinin potansiyel ekonomik değeri vurgulandı (European Commission, 2012). Birleşik Krallık, 2004 yılında birden çok akademik disiplini ilgilendiren problemler hakkında devletin yeteneğini geliştirebilmek amacıyla HSC’yi (UK Horizon Scanning Center) kurarak AB’de büyük veri uygulamaları konusunda ilk adım atan ülkelerden biri oldu. 2011 yılında bu merkezin iklim değişikliğiyle ilgili birçok
kanaldan
gelen
verileri
işleyerek
gerçekleştirdiği
çalışmaları,
iklim
değişikliğinin, besin ve suya olan erişime, bölgesel gerilimler ve uluslararası istikrara olan etkisine işaret etti. 2009 yılında, günümüzde 30.000 üzeri veri kümesi barındıran data.gov.uk sitesi açıldı (Habegger B, 2009). 20 ülkenin işbirliği ve IBM ile gerçekleştirilen DOME projesi kapsamında, SKA radyo teleskoplarının günlük ürettiği boyut olarak 1 exabyte’ı geçen veriyi işleyebilen bir süper bilgisayar geliştirilmektedir ve evrenle alakalı birçok bilimsel soruya cevap bulabilmeyi amaçlamaktadır (DOME project, 2012) .
4.3 Asya Ülkelerinde Kamuda Büyük Veri Birleşmiş Milletler 2012 e-devlet araştırması, başta Güney Kore, Singapur ve Japonya olmak üzere birçok Asya ülkesine yüksek not verdi. Bu ülkeler büyük veri konusunda çeşitli girişimlerde bulundular ve pek çok proje gerçekleştirdiler:
Güney Kore Güney Kore’de 2011 yılında, başkana bağlı Bilgi ve İletişim Teknolojileri konseyi tarafından, bilgiyi tahlil ederek yönetimsel kararlar alabilmek amacıyla bir büyük veri programı başlatıldı. Bu girişim
kapsamında gerekli altyapının
sağlanmasına liderlik etmek için bir büyük veri çalışma kolu (Big Data Task Force) oluşturuldu. Bu girişim, kamu ve özel sektör arasındaki veri paylaşımını iyileştirmeyi, kamusal bir veri tahlil sistemi kurmayı, yetenekli ve profesyonel topluluk oluşturmayı ve eğitmeyi, kişisel verilerin gizliliği ve güvenliğini garanti etmeyi ve ilgili mevzuatı geliştirmeyi, büyük veri altyapı teknolojileri geliştirmeyi ve böylece bütün devleti kapsayan bir büyük veri ağı ve analiz sistemi kurmayı amaçlıyor. Sağlık ve Refah Bakanlığı (Ministry of Health and Welfare) 35 kurumdan 385 kamusal veri kümesini analiz etmek, merkezi ve yerel yönetimlerin yaptığı çalışmaları kapsamlı bir şekilde yönetebilmek için Sosyal Refah Birleşik Yönetim Ağını (Social Welfare Integrated Management Network) başlattı.
42
Gıda Tarım Orman ve Balıkçılık Bakanlığı (MOPAS) el ayak ağız sendromu ile savaşta, yurt dışındaki hayvansal hastalıklar, gümrük ve mülteci bilgileri, besi hayvancılığı sektöründeki hayvanlar ve bu sektörde çalışan işçilerle alakalı büyük veri kümelerininden faydalanan bir büyük veri sistemi kullanmayı planlıyor. Bakanlığın planları arasında eski hasar kayıtlarına ve anlık hava durumu verileri ve anlık sismik verilere dayanan, doğal felaket önleme sistemi de bulunuyor. Ayrıca Güney Kore Biyoinformatik Merkezinin, genetik ve sağlık verilerini birleştirecek ve kişiye özel teşhis ve ilaç tedavisi sunulmasına imkan sağlayacak bir Milli DNA Yönetim Sistemi üzerinde çalışmaları bulunmaktadır.
Singapur 2004 yılında Singapur, bulaşıcı hastalıklar ve milli güvenlik gibi konularda çalışmak için Milli Güvenlik Koordinasyon Merkezi aracılığıyla Risk Değerlendirme ve Ufuk Taraması (Risk Assessment and Horizon Scanning Program-RAHS) isimli programı başlattı. Bu programla, geniş kapsamlı bir büyük veri kümesi oluşturulup çözümlemesi yapılarak, terörist saldırılar, bulaşıcı hastalıklar ve ekonomik krizler gibi tehditlerin yönetilmesinde pro aktif bir çözüm sunulmuştur. 2007 yılında, bu program kapsamında kararlar almak, programı iyileştirerek sürdürmek amacıyla bir merkez (RAHS Experimentaion Center-REC) açılmıştır. Bu merkez, programın büyük veri altyapısının sistematik olarak geliştirilmesini sağlamaktadır ve
gerçekleştirdiği
dikkate değer bir uygulama da kuş gribinin ülkeye tehdidinin ve olası senaryoları değerlendirmesidir. Ayrıca büyük veri araştırmaları analizi ve uygulamaları ile değer yaratabilmek amacıyla 50 kurumdan 5000 ve üzeri veri kümesinin yayınlandığı http://data.gov.sg adlı internet sitesini açmıştır.
Japonya Japonya devleti, büyük çaplı verileri incelemek için çeşitli programlar başlatmıştır. 2005-2011 yılları arasında Eğitim Kültür Spor Bilim ve Teknoloji Bakanlığı (MEXT), üniversiteler ve araştırma enstitüleri işbirliğiyle Bilgi Patlaması Devri için Yeni Bilgi Teknolojileri Altyapısı projesini yürütmüştür. 2011 yılından beri Fukuşima depremi, tsunami ve nükleer santral faciasının ve bu faciadan etkilenmiş alanların iyileşltirilmesi, facianın ekonomik ve sosyal sonuçları öncelikli konulardan biri olmuştur. Eğitim Kültür Spor Bilim ve Teknoloji Bakanlığı, Milli Bilim Vakfı ile beraber doğal felaketlerden korunma amaçlı araştırmaları büyütmek ve büyük veri teknolojilerinden sağlanan faydaları arttırmak için çalışmalar yapmaktadır.
43
İçişleri Bakanlığının altındaki Bilgi ve İletişim Konseyi ve Bilgi ve İletişim Stratejisi Komitesi büyük veri uygulamalarının 2020 hedefleri için önemini vurgulamıştır. Teknik çözümler sağlaması ve büyük veri uygulamalarının yayılmasında kurumsal kararlar vermek amaçlı ve bir büyük veri uzman grubu kurulmuştur.
Çin Halk Cumhuriyeti Çin Halk Cumhuriyeti’nin uzun vadeli plan ve açık veri kaynaklarının eksikliğine ek olarak büyük veri konusundaki özel sektör temellerinin zayıf olmasından dolayı kamu sektöründeki büyük veri uygulamalarında geri kaldığı söylenebilir fakat yeni bir yönetim anlayışı benimsenerek 2017 sonu itibariyle verilerin ilgili kurumlar tarafından paylaşmaya başlaması planlanmaktadır. 2018 yılı sonlarına doğru da ulaşım, sağlık hizmetleri, iş bulma gibi konulara öncelik verilen bir açık platform oluşturulması hedeflenmektedir (The State Council, The People’s Republic of China, 2015). Devletin siyasi danışma organı olan CPPCC’nin (Chinese People's Political Consultative Conference) 2014 yılında Beijing’te gerçekleştirdiği ve kamuda büyük veri çalışmalarında yetenek kazandırılması için neler yapılması gerektiğinin tartışıldığı toplantı ve yerel yönetimlerin de büyük veri uygulamaları için altyapı çalışmalarına başlaması, Çin’in büyük veri uygulamaları konusunda gelişmeye istekli olduğunun göstergeleridir (UNDP, 2014).
4.4 Avustralya'da Kamuda Büyük Veri Avusturalya'da kamu kurumlarının büyük veri uygulamaları, kurumların ellerinde bulunan verileri, mevzuat izin verdiğince, başka kurumlardaki verilerle ilişkilendirip açık veri olarak sunulması şeklindedir. İstihbarat kurumları, güvenlik kurumlarıyla, diğer sosyal hizmet kurumları da kendi aralarında düzenlemeler ve veri paylaşımları yaparak daha zengin analizler yapmayı hedeflemektedir (Australian Government Department of the Prime Minister and Cabinet , 2015). Avustralya Devleti Bilgi Yönetimi Ofisi (AGIMO) Devlet 2.0 programı kapsamında, kamu verisine erişimi sağlamak amaçlı http://data.gov.au internet sitesini açmıştır (“About Data.gov.au”, 2013).
44
BÖLÜM 5 Kamu için öneriler Sonuç olarak kamu kurumları özel sektöre göre yola sonra çıkmakla birlikte, “büyük veri” konusunda daha büyük problemlerle karşı karşıyadır ve burada hem fırsatlar hem de tehditler mevcuttur. Bu bölümde Türkiye’de kamu sektörü için “büyük
veri”
konusunda
yapılması
gerekenler
konusunda
belli
noktalara
değinilecektir. Bu önerilerin bir kısmı (1) çalışmasından alınmıştır ve ülkemize de uymaktadır.
5.1 Ulusal öncelikler Önde gelen ülkelerin büyük veri projelerine bakıldığında ortak hedefler görülmektedir. Bunlar, (1) kamu hizmetlerine kolay ve eşit erişim, (2) kamu işlerinde vatandaşların daha kolay katılımının sağlanması, ve (3) şeffaflık olarak sıralanabilir. Kamuda büyük veri uygulamaları alanında ise özellikle güvenlik, hız, birlikte çalışırlılık, analitik kapasitesi, ve yeterli uzman bulma problemleri konusunda endişeler olduğu görülmektedir. Her devletin kendi öncelikleri, fırsatları, ve tehditleri bulunmaktadır, ve bunlar ülkelerin bulundukları çevreye, jeopolitik ortama göre değişmektedir. Kimi ülkelerde güvenlik (Avrupa), bazılarında savunma (Türkiye), bazılarında sağlık (ABD), ve diğer bazılarında çevre (Japonya) öne çıkmaktadır (Kim et al 2014). Dolayısıyla ülkeler önceliklerini belirlemeli ve kamuda büyük veri stratejilerini buna göre oluşturmalıdırlar. Türkiye konumu ve durumu itibariyle pek çok alanda “büyük veri”den faydalanmak ve etkin kamu politikaları oluşturmak zorundadır. Aşağıdaki alanların ülkemiz açısından öncelikli olduğunu düşünüyoruz:
Savunma ve güvenlik Türkiye son yıllarda çevresinde oluşan savaş ve güvenlik tehditleri, ayrıca jeopolitik konumu itibariyle bu alanda büyük veriyi etkin yönetmek zorundadır. Savaşlardan ve çatışmalardan kaçan milyonlarca mülteci bir kaç yıl için ülkenin her yerine dağılmış bulunmaktadır. Bu hem ülke için fırsat hem de ciddi tehditler içermektedir. Bu insanlarla ilgili veri toplamak ilgili pek çok kurumun (AFAD, Emniyet, İçişleri Bakanlığı, Dışişleri Bakanlığı, Sağlık Bakanlığı, Gümrük Bakanlığı
45
gibi) etkin stratejiler geliştirmesine ve bu verileri koordineli bir şekilde kullanarak gerekli politikaların üretilmesine yardımcı olmasına bağlıdır.
Ekomomi, Üretim, Büyüme, ve İstihdam Türkiye son yıllarda ekonomik olarak yüksek büyüme göstermiş bir ülkedir. Ancak son birkaç yılda oluşan ülke içi ve küresel problemlere bağlı olarak ekonomik olarak durağanlığa kayma tehlikesi göstermektedir. Kişi başı milli gelir 10 bin dolar sınırında kalmış ve yukarı çıkarmak için daha teknolojik ve katma değerli üretime geçmek zorundadır. Bu ise sanayide, üretimde, tarımda daha yenilikçi yaklaşımların benimsenmesine ve atılım yapmaya bağlıdır. Endüstri 4.0 gelişmesi bu anlamda ülkemiz için fırsatlar sunmaktadır. Üretimin (sanayi ve tarım) daha otomatik ve verimli yapılması bu alanda yapılacak yatırımlara bağlıdır. İlgili kamu kurumları acil eylem planları ile ileri ülkelerden geri kalmamak ve üretimini daha verimli yapabilmek için bu alanda stratejiler geliştirmek zorundadır. Bu alanda pek çok veri halen toplanmaktadır (Tarım Bakanlı, Bilim, Sanayi ve Teknoloji Bakanlığı, TOBB, vb.). Bu “büyük veri”nin stratejik kullanımı oldukça önemlidir ve ilgili kurumlar koordineli bir şekilde bu veriyi etkin politikalar geliştirmek için kullanmaya başlamalıdır. Üretim ve sanayide veriye ve otomasyona bağlı değişikliklerin istihdama etkisi iyi incelenmeli (yine İŞKUR, Çalışma Bakanlığı gibi ilgili kurumların büyük verileri ile) ve etkin istihdam, iş eğitimi vb. programlar geliştirilmelidir.
Eğitim ve Sağlık Ülkemiz genç nüfusu ile önemli bir potansiyele sahiptir. Fakat aynı zamanda eğitim politikalarındaki sık değişiklikler sebebiyle ileri ülkelerle istenen seviyede yarışamamaktadır (Pisa 2012). Eğitim konusunda ilgili kurumlar (MEB, YÖK, ÖSYM, vb.) pek çok kapsamlı büyük veriye sahiptir. Yine bu verilerin etkin kullanımı ve analizi ile etkin eğitim politikaları geliştirilmeli ve genç nüfusun iyi eğitilmesi için acil önlemler alınmalıdır. Genç ve yaşlı nüfusun sağlığının korunması ve ülke kaynaklarının etkin kullanımı ve israf edilmemesi, sağlık alanında yapılan iyileştirmelere, bunun için de ilgili kurumlarda (Sağlık Bakanlığı, SGK, vb.) toplanan “büyük veri”nin etkin kullanımı ve analizine bağlıdır.
Şeffaflık Büyük verinin kamuda en önemli kullanım alanlarından birisi şeffaflık, hesap verilebilirlik, ve ülke bütçelerinin israf edilmeden etkin kullanımıdır. Vergi gelirlerinin, bütçe harcamalarının, yatırımların ve bütün kamu harcamalarının “büyük veri” analizi ile incelenmesi ve “açık veri” olarak yayınlanması ve denetime açılması ile birlikte
46
ülke bütçesinin çok daha az kayıpla ve çok daha etkin harcanması mümkün olacak, ülke refahında iyileşme sağlanacak, gelir adaletinin sağlanmasında pek çok iyileştirmeler yapılabilecektir. Burada Maliye Bakanlığı, Gelir İdaresi, Kamu İhalesi Kurumu gibi kamu kuruluşlarının verilerinin etkin kullanımı oldukça önemlidir.
5.2 Analitik kurumu Kim et al 2014 çalışmasında kamuda bir analitik kurumu kurulması önerilmiştir. Bu kurumun amacı kamudaki verileri yukarıdan aşağıya toplu bir şekilde bütünleştirecek, ilişkilendirecek ve değerlendirecek, analiz edecek bir kurum olarak yapılandırılması önerilmiştir. Mevcut durumda genelde kamuda veriler kurumların kendi veri silolarında bulunmakta, paylaşmada problemler bulunmakta ve toplu değerlendirilmesi çok zor olmaktadır. Analitik kurumu bu engelleri aşabilecek ve verileri merkezi bir şekilde değerlendirebilecek ve kurumlar üstü daha etkin çözümler sunabilecektir. Ülkemizde de kamu kurumları arasında veri paylaşımının genelde çok zor olduğu ve veri siloları probleminin büyük veri uygulamaları önünde en önemli engellerden biri olduğu bilinmektedir. Bu alanda merkezi ve kurumlar üstü bir üst kurumun bu görevi üstlenmesi veya yeni bir kurum oluşturulması uygun olacaktır.
5.3 Gerçek-zamanlı analiz Pek çok büyük veri uygulaması genelde durağan (statik) veri üzerinde analiz yapmayı öngörmektedir. Gelecekte daha fazla ağ bağlantısı, nesnelerin interneti uygulamalarının devreye girmesi ile birlikte akan veri (streaming data) ve gerçek zamanlı analiz giderek daha fazla önem kazanacak ve bu konuda kamu kurumlarının da gelecek öngörüsüne dayalı stratejiler geliştirmesi gerekmektedir. Örneğin sağlık alanında, salgın hastalıkların anlık verilerle takip edilmesi ve acil önlemlerin alınması, felaketlerin (deprem) gibi veri analizi ile tahmin edilmesi, çevre ve doğa olaylarının izlenmesi, finansal krizlerin, borsa hareketlerinin anlık takibi gibi pek çok konu kamu kurumlarının gündeminde olması gerekmektedir.
5.4 Küresel işbirliği Son yıllarda hızlanan hemen her alanda küreselleşme ile birlikte ülkelerin ve ülkemizin de birbirinden tamamen ayrı politikalar geliştirmesi artık imkansızdır. Alından her karar diğer ülkeleri etkilemekte, diğer ülkelerde alınan kararlar ve politika değişiklikleri de anında bizleri etkilemektedir. Bu sebeple büyük veri
47
uygulamaları
küresel
kurumlarla
bütünleştirilebilir,
birlikte
çalışabilir
olarak
tasarlanmalı ve geliştirilmelidir. Ülkeye özel olarak geliştirilecek büyük veri uygulamaları kısa vadeli çözümler sunsa da ilerde küresel çerçevede uygulamada zorluklara sebep olabilecektir. Bu sebeple bu tür uygulamalar geliştirirken kamu kurumlarının küresel çerçevede gelişmeleri iyi okumaları ve uygulamaları dünyadan kopuk olarak geliştirmemeleri gerekmektedir.
5.5 Özel sektör işbirliği Büyük veri uygulamaları alanında yukarıda da belirtildiği gibi özel sektör çalışmalara kamu kurumlarından çok daha önce başlamış ve bu alanda pek çok uygulama ve çerçeve geliştirmiş bulunmaktadır. Bu sebeple kamu kurumlarının yeni baştan dünyayı keşfetmek yerine özel sektör kurumları ile işbirliği içinde ve edinilen tecrübelerden faydalanarak gelecek stratejilerini geliştirmeleri oldukça önemlidir.
48
KAYNAKÇA 1. About Data.gov. (2013). Retrieved from https://www.data.gov/about 2. About Data.gov.au. (2013). Retrieved from http://data.gov.au/about 3. Aslı Ayşe Bilir (2003), “Devlet İstatistik Enstitüsünde elektronik veri güvenliği”, TÜİK Uzmanlık Tezi. 4. Australian Government Department of the Prime Minister and Cabinet. (2015). Public Sector Data Management 5. Big-Data Applications in the Government Sector By Gang-Hoon Kim, Silvana Trimi, Ji-Hyong Chung 6. CSI/FBI Computer Crime and Security Survey,. 7. Data Portals, http://dataportals.org 8. Demet Kabasakal, Şeref Sağıroğlu, Mustafa Alkan (2007), “Mobil Elektronik İmza: Senaryolar, Uygulamalar, Standartlar ve Ülkeler”, Uluslararası Katılımlı Bilgi Güvenliği ve Kriptoloji Konferansı. 9. DOME project. (2012). Retrieved from https://www.research.ibm.com/labs/zurich/sto/bigdata_dome.html 10. Emrah Tomur (2004), “Kablosuz yerel alan ağlarının BDDK’da kullanımı için bir uygulama önerisi”, BDDK Uzmanlık tezi. 11. European Commission. (2010). Communication From The Commission To The European Parliament, The Council, The European Economic And Social Committee And The Commıttee Of The Regions A Digital Agenda for Europe 12. European Commission. (2012). Digital Agenda for Europe and Challenges for 2012. https://ec.europa.eu/digital-single-market/en/digital-agendaassembly-2012 13. G.-H. Kim, S. Trimi, and J.-H. Chung. (2014). Big-Data Applications in the Government Sector. Commun. ACM 57,3 (Mar.2014), 78-85. DOI=http://doi.acm.org/10.1145/2500873 14. Habegger B. (2009) Horizon Scanning in Government: Concept, Country Experiences, and Models for Switzerland 15. IBM. (2011). IBM’Ss Smarter Cities Challenge: Syracuse 16. IEEE 802.11, http://en.wikipedia.org/wiki/IEEE_802.11. Son erişim: 27 Aralık 2009. 17. Jain P., Tate S. (2013). Big Data and Network Storage For Hadoop 18. Mark van Rijmenam Think Bigger - Developing a Successful Big Data Strategy for Your Business.
49
19. Monica Paolini (2007), “The Emerging WIMAX Ecosystem”. WIMAX Business and Technology Strategies, p. 14-16. 20. Morabito, V. (2015) Big Data and Analytics Strategic and Organizational Impacts, 16, 23-44 21. Open Data, https://en.wikipedia.org/wiki/Open_data 22. Open Government Partnership, http://www.opengovpartnership.org 23. Pisa Results (2012), Country Note for Turkey, Problem Soving. 24. Podesta, J., Pritzer, P., Moniz, E.J., Holdren, J., Zients, J. (2014). Big data: Seizing Opportunities, Preserving Values. Executive Office of the President 25. TCG Mobile Phone Working Group (2005), “Use Case Senarios, v 2.7”. 26. The State Council, The People’s Republic of China. (2015). http://english.gov.cn/policies/latest_releases/2015/09/05/content_281475183 253390.htm 27. The Trusted Computing Group (2006), “Mobile Specification: Securing Mobile Devices on Converged Networks”, White paper. 28. Trusted Computing Group (2007), “TPM Main Part 1 Design Principles, Specification version 1.2 Revision 103”
29. Trusted Computing Group (2007), “TPM Main Part 2 TPM Structures, Specification Version 1.2 Revision 103”. 30. Unibusiness Dergisi 31. United Nations Development Programme. (2014). Big Data Development in China 32. Wayne Jansen and Karen Scarfone (2008), “Guidelines on Cell Phonand PDA Security, Recommendations of NIST”. NIST Special Publication 800124.
50