Big Data Nedir?
Big Data, bu araştırmalardan, gözlemlerden, arama motorlarından, forumlardan, bloglardan ve birçok kaynaktan elde edilen verinin anlamlı ve işlenebilir hale getirilmiş biçimidir. Veri yığınlarını işleyerek anlamlı ve düzenli verilere dönüştürmek için ar-ge faaliyetleri sürdüren yazılım şirketleri tarafından ortaya atılmıştır.
Kullanıcılar internet ortamında gezinirken yaptıkları her işlemde arkada iz bırakırlar. Banka hesap işlemleri, bloglar, mailler ve arama motorundaki her arama gibi etkileşimler bir araya gelince devasa boyutlarda veri yığını oluşur. Big Data’nın yani büyük verinin kaynağı bu verilerdir.
Big Data Nasıl Çalışır?
Big Data’nın ilkesi, elde edilen verilerin en kullanışlı hale getirerek işletmelerin müşterileri hakkında bir görüş veya yeni bakış açısı getirmektir. Basitçe büyük veriler, işletmelere müşterilerini tanımakta, isteklerini belirlemekte büyük yardımcıdır. Bu nedenle en faydalı bilgilere ulaşmak için Big Data prensiplerine sadık kalarak verinin işlenebilir ve en sade halini ortaya koymak gerekmektedir.
Genel olarak veri noktaları karşılaştırılır, verilerin birbiriyle olan ilişkileri ortaya çıkartılır ve bu ilişkilerin öğrenilmesi sağlanır. Bu işlem, araştırmacılar tarafından toplanan verilere dayanan yapı modelleri içeren bir işlemle yapılır ve simule edilir. Her simülasyonda veri noktalarının yerleri değiştirilerek sonuçların nasıl etkilendiği gözlenir.
İnternet çağının ilk ve orta dönemlerinde veriler, veritabanları ve elektronik tablolar ile sınırlıydı. İşin bu kısmında veriler gayet düzenliydi. Ancak günümüzde veri kavramı çok karmaşık bir hal aldı. Günümüzde artık videolar, fotoğraflar, ses kayıtları hatta sensör hareketlerine kadar her şey veri olarak kabul edilir. Teknolojiyi yakından takip eden akıllı işletmeler, bu karışıklığı çözebilmek adına Big Data teknolojisine yatırım yapmaktadırlar. Bunu yaparken veriyi belirli segmentlere ayırarak müşterilerinin pofil analizlerine göre işletme stratejisini belirlerler.
Big Data Hangi Alanlarda Kullanılır?
Big Data günümüzde her sektör için kullanılabilir bir hal almıştır. Sonuçta her sektörün birikmiş bir data yani verisi vardır. Ancak müşteri davranışlarının büyük önem taşıdığı ve takip edilmesinin neredeyse zorunlu olan sektörlerde, çok daha ön plandadır büyük veri. Büyük verinin öneminin anlaşılmasıyla birlikte devletler, bünyesinde bulunan kurumlar için kullanmaya başlamışlardır.
Bunlara örnek vermek gerekirse; Sağlık alanında, hakkında daha önceden veri toplanmış hastaların erken teşhisi veya hastalara göre ilaç geliştirilmesi konusunda büyük veri kullanılıyor. Bunun yanında eğitim sisteminde ya da suçları önlemek amacıyla devletlerin kullandığını söylemek mümkün.
Kullanıldığı bir diğer alan ise insan ve doğal kaynaklı afetleri tahmin etme konusunda yardımcı olmasıdır. Deprem verileri, bir sonraki depremler hakkında bizlere bilgi veriyor. Çok uzun yıllardan beri tutulan deprem verilerini düzenlemek ve işlemek için Big Data kullanılıyor.
Big Data’yı Oluşturan 5 Ana Bileşen
Gartner analizine göre büyük veriyi nitelendiren 3 ana bileşen bulunuyor. Bunlar; hacim, hız ve çeşitliliktir. Ancak Big Data her gün gelişen bir alan olduğu için 2 bileşen daha eklenmiştir. Hadi gelin hep beraber bunlara bir göz atalım.
Çeşitlilik (Variety)
Veriler tek tip halinde değildir. Veri formatları değişkenlik gösterir. Verilerin büyük kısmı birbirlerinden farklı formata sahiptir. Bunun nedeni gelen verilerin bilgisayarlardan, tabletlerden, telefonlardan veya farklı işletim sistemlerinden gelmesidir. Bu veri formatları 3 grupta incelenir. Yapısal, yarı yapısal ve yapısal olmayan verileri şeklinde gruplanırlar. Genel olarak verileri yapısal olmayan veriler oluşturur. Big Data için tüm verilerin bütünleşik ve birbirlerine dönüştürülebilir olması gerekir.
Hız (Velocity)
Big data üretimi her geçen gün hızla artmaktadır. Bu veriler inanılmaz boyutlara ulaşmaktadır. Dolayısı ile işlem çeşitliliği ve sayısı da aynı oranda artar. Hem donanımsal hem de yazılımsal olarak bu yoğunluk karşılanabilir olması gerekir.
Hacim (Volume)
Big Data’nın en temel özelliklerinden biri yüksek miktarda verilerle işlem yapmasıdır. Teknolojinin gelişmesi ile daha önceleri analiz edilemeyen büyük veriler günümüzde analiz edilebiliyor. Günümüzde verileri sadece insanlar üretmiyor aynı zamanda aygıtlar kendi kendine de üretebiliyor. Geri kalan 10 yıl içerisinde veri miktarı 40 kattan fazla artmıştır. Fiziksel veri depolama için yapılan harcamalar ise sadece 1,5 kat artmıştır. Bu durum verilerin verimli ve doğru bir şekilde depolanması gerektiğini gösterir.
Doğrulama (Verification)
Son zamanlarda önemi daha iyi anlaşılan bir diğer konu ise veri güvenliği ve doğruluğudur. Tutulan verilerin kimler tarafından görüntülenmesi gerektiği, hangi verilerin gizli kalması gerektiği gibi unsurlar Doğrulama bileşenini oluştururlar.
Değer (Value)
Anlattığım bileşenler arasında en önemli bileşen, değerdir. Toplanan ve işlenen bu veriler kurumlara değer kattığı sürece değerlidir. Bu sebeple, big data’nın analiz ve simülasyon çalışmaları doğru şekilde yapılması büyük önem arz ediyor. Büyük verinin öncelikli amacı kuruma fayda sağlamasıdır.