Kategori: IBM

  • IBM Storwize Deduplication & Data Reduction Pools – Derinlemesine İnceleme

    Herkese Merhaba

    Sonunda Storwize’a 8.1 güncellemesi ile birlikte tekilleştirme geldi ve ücretsiz. Hybrid storage serisinden V5030 ve V7000’de bu özellik yer alıyor. Dosbil Bilgisayar test merkezinde yeni gelen özelliği derinlemesine inceledik.

    8.1 versiyonu çıkalı epey oldu fakat Deduplication’ın menüden seçilebilmesi 8.1.3.x ile mümkün olabiliyor. Dolayısıyla 8.1.3.x altında bir sürüm kullanıyorsanız bu özelliği açamamanız olası.

    8.1.3.x kullansanız bile storage ilk yapılandırırken Pool oluşturma kısmında Data Reduction seçeneğini işaretlemediyseniz Deduplication veya Thin Reclaimation özelliğini kullanmak mümkün değil.

    create pool

    IBM tekilleştirmeyi neden bu kadar geç getirdi?

    Yazılan veriler 32KB‘lik block’larla işlediği için standart disk havuzu (pool) tekilleştirme gibi alan kazanımı sağlayan teknolojiler için uygun değildi. Çünkü veri 8KB‘lik block’larla yazıldığında çok daha iyi tekilleşiyor ve kontroller ünitesini çok daha az yoruyor. IBM’in bu kriteri değiştirmesi, petabyte’larca cluster’lara sahip müşterileri için pek mümkün gözükmüyordu. Dolayısıyla standart disk havuzunun yanında “Data Reduction Pool” eklenerek tamamen yeni mimaride bir disk havuzu getirildi. Yazının geri kalanında kısaltma için DRP yazacağım.

    Aradaki büyüklük farkını şöyle belirtebilirim: Storwize’da oluşturulabilecek;
    Max Standart Pool adeti: 1024
    Max DRPool adeti: 4

    Max Standart Raid Array: 4096
    Max DRP Raid Array: 128

    O yüzden DRP tamamen yeni bir disk havuzu mimarisi ve aktif iş yüklerinde tekilleştirme açılamaz. Boş yeri çok olan veya HyperSwap cluster mimariler, diğer site üzerindeki standart pool’u silip DRP oluşturarak ve bolca storage vmotion ile taşıma yaparak bu mimariye online geçebilirler.

    Altta görüldüğü gibi SAS diskler standart, SSD’ler ise DRP.

    pools

    DRP oluşturduktan sonra volume oluştururken Thin Provision seçildiğinde “automatic space reclaimation/SCSI Unmap” özelliği açık geliyor. Eğer siz buna ilave olarak diğer yer kazanımı teknolojilerinden Compression veya Deduplication isterseniz açabiliyorsunuz.

    create volume

    Volume performansını tam olarak test edebilmek için 4 farklı tipte de volume oluşturduk. Bunu yapmaktaki amaç ise volume tipinden bağımsız olarak alabileceğimiz performansı ve tekilleştirmeyi gözlemleyebilmekti.

    DRAID6_SSD_TVOL: Thin
    DRAID6_SSD_TDVOL: Thin + Deduplicated
    DRAID6_SSD_CVOL: Thin + Compressed
    DRAID6_SSD_CDVOL: Thin + Compressed + Deduplicated

    volumes

    Thin Dedup ve Compress Dedup volume’lerine her birine onar adet Windows 2016 Server ISO’su kopyaladık. Bu ISO’ların her biri 5.5 GB.

    isolar
    Burada dikkat etmemiz gereken nokta ise volume tiplerinin birbirinden farklı olması. Volume’lerden birinde sadece dedup açık, diğerinde ise compression+dedup açık. Dolayısıyla storage üzerinde olan ama farklı tip volume’lerde olan bu verinin tekilleştirileceği benim için merak konusuydu.

    Altta görüldüğü üzere toplamda 106 GB yer kaplaması gereken 20 adet ISO dosyası tekilleştirilerek 98 GB yer kazanımı sağlanmış. Yani sadece 8 GB‘lık bir yer kaplıyor volume üzerinde.

    20 iso deduplication

    Performans Testi:

    İşin yer kazanımı konusu sorunsuz fakat performans konusunda da şüphelerim vardı. Bu volume’lerin tamamının IOPS performansını test ettik.

    Test Server: Lenovo SR650, 2 x Xeon Silver 4110 – 48 GB Ram
    Vmware ESX 6.5.0 Update 1 (Build 7388607)
    Test VM: Windows 2016 Server, 1×8 CPU, 24 GB Ram
    Test Storage: IBM V5030 – 9×1.96 TB SSD – Distributed RAID6

    Altta test sonuçlarının parametrelerini ve detaylarını inceleyebilirsiniz.

                              8k yazma / 8k okuma
    Thin Volume: 68.000 / 95.510
    Thin+Dedup: 91.020 / 143.050
    Compressed: 70.820 / 98.500
    Comp+Dedup: 72.820 / 88.780

    Compression + Deduplication’ın ikisinin birden aktif edilmesi doğal olarak okumada IOPS kaybına neden oluyor.
    Thin Dedup’ın da bu kadar yüksek IOPS’lara çıkması gelen verinin henüz daha diske yazılmadan cache’de tekilleştirilmesinden kaynaklanıyor. Controller sıkıştırmayla uğraşmadığı için IOPS epey yükselmiş.

    Kısacası tüm volume tiplerinde 8K IO büyüklüğü ile 68.000 IO üzerinde performans alınabiliyor. Bu da çoğu iş yükü için yeterli bir performans.

    tvol

    tdvol

    cvol

    cdvol