Bir toplantı Notu, “Yedekleme İhtiyacını Ortadan Kaldıran Çözüm!”
Bu başlık, katıldığım toplantılarda kendime sıkça aldığım notlardan biridir. İlk zamanlar bu ilişkinin nasıl kurulduğuna anlam verememiştim. Ancak zaman içerisinde katıldığım toplantılarda, etkinliklerde bu konunun ön plana çıkarıldığına sık sık tanık oldum. Duyduğum ilk günden beri bu konuyla mücadele halindeyim ve uzun bir zamandır bu konunun yazılması gerektiğini düşünmüştüm. Tembellikten kurtulduğum ilk anda aklımdakileri yazıya döküverdim.
Bir satıcının veya tekniğin şimdiye kadar yaptığı en tehlikeli iddialardan biri “yedekleme ihtiyacını ortadan kaldırdık” demesidir. Genelde yeni bir ürün veya teknoloji pazarlayanlar bu iddiayı gündeme getirmekten kaçınmıyor. Yedekleme pazarının her geçen gün büyümesine ve yeni özellikler ile kullanıcıların karşısına çıkmasına rağmen bu sloganı son kullanıcılardan da duyuyoruz. “Ta ki kötü bir deneyim yaşayana kadar.”
Bu yazımda HCI sistemler üzerinde duracağım. Hyper-Converged yapıların, veri esnekliği sağlaması veri koruması sağladığı anlamına gelmez. Ürünü bu şekilde pazarlayanların bu iddiaları üreticilerin gerçekleştirmek istedikleri başarıya zarar vermektedir. Veri Esnekliği (Data Resiliency) ile veri koruma (Data Protection) arasındaki farkları açıklamaya çalışacağım.
Veri Esnekliği ve Veri Korumasını Karşılaştırma
“Veri esnekliği” ve “veri koruması” arasındaki fark nedir? Her iki terim de doğal afet veya veri merkezi bozulması durumunda verilerin korunmasına ilişkin konulardır. Ancak bunun yapılma yolları farklıdır.
Veri Esnekliği
“Veri esnekliği” terimi, verilerin tehlikeye girdiği durumlarda “verilere ulaşma” yeteneğini ifade eder. HCI ortamında veriler esnektir. Cluster, Erasing Code, Snapshot ve Replication teknolojileri bu esnekliği sağlar. Çünkü HCI ortamının sağladığı birkaç farklı konum ve teknoloji ile korunmaktadır. Hiçbir ortam diğerinden daha iyi olmamakla birlikte, özellikle bir ortamın çökmesi veya verilerin bozulması durumunda verilerin saklandığı disaster bölgesindeki altyapı sayesinde verilerin kullanılabilirliği sağlanır. Kullanıcılar, verilerini depoladıkları yer erişilebilir olduğu ve verilerden ödün vermediği sürece memnundurlar. Bir konum aşağı inerse, kullanıcılar ikinci konuma yönlendirilir. Eğer tüm konumlar aşağı inerse, kullanıcılar ve kuruluş artık verilerine erişemez. Bu maliyete dayanabilecek bir şirketle henüz karşılaşmadım.
Veri Koruma
“Veri koruma”, verilerinizi birden fazla konuma kaydetmenin yanısıra, verilerinizin korunmasını sağlayan daha büyük bir eylemidir. Yedekleme uygulamaları, verilerinizin restore işlemlerine hazır olduğundan, bozulmayacağından ve gerekli tüm uygulamalara uygun olacağından emin olduğunuz bir özellikler bütünüdür. Veri korumayı sağlamanın anahtar metodları arasında yedekleme, restore, replikasyon, arşivleme özellikleri bulunur. Kurumların mutlak belirli bir süre içinde verilerine erişebilmeleri önemlidir. Verilerin saklandığı tüm konumlar tehlikeye girerse esnek veriler kalıcı olarak kaybolabilir. Öte yandan yedek alınan veriler, orijinal kopya artık mevcut olmasa bile geri yüklenebilir ve /veya yeniden oluşturulabilir.
HCI Çözümleri Nasıl Kendini Koruyabilir?
Bir grup sunucu üzerine kurulu olan HCI çözümleri genellikle sunucu kümelerini bir hypervisor aracılığıyla bir araya getirir. Ek bir storage ihtiyacı olmayan bu yapı içinde Yazılım Tanımlı Depolama (Software Defined Storage) çözümü çalıştırılır. Depolama yazılımının sorumluluğunun bir kısmı, esneklik ve mobilite için küme (cluster) genelinde veri dağıtmaktır.
Günümüzde, çoğu HCI çözümü bu esnekliği erasure coding (EC) adı verilen bir teknikle gerçekleştirmektedir. Erasure coding verileri yazarken ve cluster üzerindeki sunuculara (düğümlere) dağıtırken bölümlere (segments) ayırır. Bölümlemenin bir kısmı, eşlik (parite) bitlerinin oluşturulması ve bunları bir veya daha fazla düğüme (node) yerleştirilmesidir. Eşlik bitlerinin (party bits) sayısı, kabaca HCI çözümünden bir kesinti veya veri kaybıyla karşılaşmadan önce başarısız olabilecek düğümlerin sayısına eşittir.
Hiçbir pazarlamacı bu noktaya kadar , yedekleme ihtiyacını ortadan kaldırdıklarını iddia etmeyecektir. HCI satıcısına “yedeklemeyi ortadan kaldırma” iddiasında bulunma cesareti veren, bundan sonraki adımdır. Çoğu HCI çözümünün arkasındaki depolama teknolojisi, neredeyse sınırsız anlık görüntü (storage snapshot) alabilir durumdadır. Bu yüksek sayıdaki potansiyel anlık görüntü (storage snapshot), kullanıcıya point-in-time restore yeteneği sağlamaktadır. Teoride, müşteri storage üzerinde zaman içerisinde aldığı anlık görüntüler (snapshots) mevcut olduğu sürece, sanal bir sunucusunu herhangi bir zamanda herhangi bir noktaya geri alabilir. Ancak, tüm bu anlık görüntülerde (snapshots) bile, HCI çözüm tüm sistemi etkileyen bir felakete karşı hala risklidir.
HCI için ikinci güven arttırıcı özellik, bu anlık görüntülerin (snapshots) asenkron (asynchronous) olarak replikasyonunun yapılabilmesidir. HCI çözümü anlık görüntülerini (snapshots) toplar ve anlık görüntüler (snapshots) arasındaki deltayı belirli aralıklarla başka bir HCI cluster’a gönderir. Ek olarak, birçok durumda HCI çözüm, toplanan verinin farklı anlık görüntülerini alabilir. Bu noktada, birçok HCI çözümü verileri korumalı olarak değerlendirmekte ve “yedeklemeyi ortadan kaldırma” iddiasını ortaya koymaktadır.
Bazı HCI çözümleri koruma iddiasını bir adım öteye taşıyarak clusters üzerinde aslında sıfır kapasiteli yedekler oluşturabileceklerini iddia edeceklerdir. Son kullanıcı aslında verilerin bir kopyasını çıkarır, ancak cluster içerisinde bu kopya tekilleştirilmeden dolayı neredeyse hiç ek depolama alanı gerektirmez. Bazı açılardan, bu kopya anlık görüntüden (snapshots) daha iyidir. Çünkü yedek kopya, anlık görüntüde (snapshots) olduğu gibi birincil veri hacmine (primary data volume) bağlı değildir. Ancak, tekilleştirilmiş kopya tamamen bozulmamış tekilleştirme meta verilerine bağlıdır, bu nedenle güvenlik açığı hala devam etmektedir.
Bu Teknolojilerin (Cluser, EC, Snapshot, Replikasyon) Hepsi Bir Yedekleme Eder mi?
HCI çözümlerinin çok fazla redundancy ve veri esnekliği sağladığı kesinlikle doğru olsa da, HCI’nın sunduğu bu koruma adımlarının hiçbiri gerçek bir yedekleme sağlamıyor. Gerçek bir yedekleme, tamamen ayrı bir depolama altyapısı, tercihen ayrı bir depolama yazılımı ve farklı türde bir ortam üzerinde çalışan ikincil bir veri kopyasıdır. Yedekleme dünyasındaki 3-2-1 kuralını da bu sağlam mantığa ilave ederseniz yüzdeyüz koruma sağlamış olursunuz.
HCI “Yedekleme” ile İlgili Sorunlar
“HCI Yedeklemesi” ile ilgili ilk sorun, yalnızca HCI ortamı içindeki verileri korumasıdır. Gerçek şu ki, datacenter içerisindeki HCI ortamları sadece belli projeler için kullanılmaktadır.
HCI yedeklemesindeki ikinci sorun, tamamen storage yazılımına bağlı olmasıdır. Yazılımda bir sorun ortaya çıkarsa, veriler korumasız kalacaktır. Buna bir örnek, tekilleştirme işlemidir. Özetlemek gerekirse veri tekilleştirme, gereksiz veri segmentlerini tanımlayıp kaldırarak çalışmaktadır.Veri tekilleştirme oldukça karmaşık bir metadata tablosu gerektirir. Bu tablo bozulursa veya arızalanırsa ve tablonun ayrı bir yedek kopyası yoksa, büyük olasılıkla tüm bu verileri yeniden oluşturmak gerekecektir.
Üçüncü sorun, HCI’ye özgü değil, fakat anlık görüntülere (snapshots) birincil kurtarma noktası (primary point of recovery) olarak sayılacak olan herhangi bir çözüme veya organizasyona özgüdür. Anlık görüntülerin (snapshots) çoğu sisteme bir birimin başka bir kopyası olarak görünür. Anlık görüntüleri (snapshots) alan yazılım, anlık görüntülerin içindeki belirli verileri bulma olanağı sağlamaz. Örneğin, bir yönetici, yüz veya bin anlık görüntüden birinde bulunabilecek belirli bir dosyanın belirli bir versiyonunu arıyorsa, çözümün bu limitleri problemli olabilir.
HCI yedeklemesi ile ilgili son bir sorun, müşterinin hem birincil veri merkezinde (primary datacenter) hem de felaket kurtarma merkezinde (DR) bir HCI ortamını bulundurma zorunluluğudur. Son kullanıcılar yalnızca Felaket Kurtarma Merkezindeki (DR) bir storage üzerine verilerin replikasyonunu yapmak isteyebilir. Ve yalnızca bir felaket sırasında belirli uygulamaları başlatmak isteyebilir. Sadece HCI altyapısı olmayan bir müşteri ortamında, felaket sırasında önce kurtarılma olasılığı yüksek olan uygulamaları çalıştırmak için DR Veri Merkezinde HCI bir ortam oluşturmak gerekecektir. Bu da DR için ayrılan bütçelerde artışa neden olacaktır. Ortam bağımsız yedekleme ve replikasyon uygulamaları bu konuda çok daha avantajlıdır.
Özetlemek Gerekirse;
Sonuçta, kurumsal yedekleme HCI ortamlarının nasıl korunacağı kararı verilirken en mantıklı olanıdır. Kurumların, HCI çözümüne doğrudan destek sağlayan kurumsal çözümler araması gerekir. Son kullanıcılar, tüm veri merkezinlerini korumak için tek bir yedekleme çözümünden yararlanarak, her bir benzersiz ortam için farklı bir veri koruma uygulaması çalıştırma ihtiyacından kurtulacaktır. Bilgi tehdit edildiğinde, kuruluşların veri kaybının kalıcı olmamasını sağlayacak önlemleri almaları önemlidir.
Bu konuyla ilgili sorularınızı alt kısımda bulunan yorumlar alanını kullanarak sorabilirsiniz.
Referanslar
TAGs: archive, arşiv, Backup Yedekleme, hyper-converged, hyper-convergedCeph, replikasyon
Güzel, faydalı bir makale olmuş. Eline emeğine sağlık.