5 minute read
Software Defined Storage
Servers, storage en backup | Bram Dons
Hardware doet er niet meer toe?
Het begrip ‘Software Defined Storage’ (SDS) lokt onder storage-experts veel discussie uit. Logisch, want een universeel geaccepteerde definitie bestaat niet. De Storage Network Industry Association (SNIA) hanteert bijvoorbeeld ‘virtualized storage with a service management interface’ als definitie. Maar wat is het?
Want SDS is sowieso geen storage virtualization. De laatste brengt verschillende fysieke storagedevices onder in een pool. SDS daarentegen is een ecosysteem van producten die de applicatie ontkoppelt van de onderliggende storage network hardware. In essentie scheidt ‘software defined x’ de control plane (hoe we een resource beheren) van de data plane (hoe en wat we gebruiken voor de toegang tot data).
De komst van SDS Storagesystemen zijn altijd al softwaregedefinieerd geweest. Wat veranderd is, is dat de software nu overdraagbaar is. Deze was historisch gekoppeld aan de te beheren hardware met als resultaat dat de architectuur van storagesystemen geïsoleerde verticalen werden. Onder meer de explosieve datagroei, de komst van commodity x86-gebaseerde architectuur, cloudtechnologieën en server-side flashstorage hebben geleid tot de ontwikkeling van SDS.
Verschillende implementaties Elke storageleverancier heeft zo zijn eigen interpretatie van SDS en er bestaat dan ook een grote variëteit aan SDSmarktimplementaties waarbij ieder product zijn eigen voor- en nadelen kent. Er bestaat ook geen vaste set met features waarmee SDS zich kan onderscheiden van de bestaande storagesystemen. Voor sommige leveranciers moet SDSstorage voldoen aan een aantal eisen, zoals automation, standaard interfaces, schaalbaarheid en een gevirtualiseerd data path (zie figuur 1). Het gebrek aan een erkende SDS-standaard heeft geleid tot een wildgroei aan SDS-gebaseerde producten. Ze kunnen hoofdzakelijk in een viertal categorieën worden opgedeeld: hyper-converged, gevirtualiseerde storage, hypervisorgebaseerd, scale-out object en andere file-gebaseerde SDS. Onderling bestaan er zowel belangrijke verschillen alsook overeenkomsten en sommige producten passen in meerdere categorieën.
Het SDS-probleem Net als servervirtualisatie moet SDS de flexibele toepassing van storage binnen het datacenter faciliteren. Helaas is SDS voor een belangrijk deel niet meer geworden dan storagesoftware die onafhankelijk is van de toegepaste dedicated hardware en beperkt tot specifieke storagecontainers. De meeste SDS-oplossingen kunnen als gevolg van de verschillende dataformats (file, block of object) of -protocollen hun systemen niet uitbreiden met oplossingen van andere leveranciers. De meeste volumes bezitten een mix van datasets met elk verschillende prestatie-eisen. Bij SDS ontbreekt tot nu toe de mogelijkheid om fijnmazig en op sub-volume-niveau data te verplaatsen. In theorie moeten storagevirtualisatie, en later SDS, dit campatibiliteitsprobleem oplossen via implementatie van gemeenschappelijke storagehardware en dataservices. Maar in de praktijk verandert SDS de huidige storage investeringen in domme RAID-arrays, of zijn deze vervangen door een die bestaat uit geïntegreerde server, storage en netwerk. Leveranciers zijn dit ‘hyper-converged’ infrastructuur gaan noemen.
Figuur 2: Toekomstige Software Defined Datacenter (bron IDG)
Ook hyper-converged gebaseerde systemen lossen het SDS-probleem niet op. Daarin worden namelijk alle enterprisedata in nog grotere, proprietary systemen op de serverlaag ondergebracht. Het creëert nog steeds een proprietary storagearchitectuur die geen directe koppeling heeft met de bestaande shared storage. Een belangrijke beperking is ook het gebrek bij het opschalen van alleen de computing power, onafhankelijk van de benodigde storagecapaciteit. Slechts enkele SDS-oplossingen staan het toe om data tussen verschillende types storagehardware te verhuizen. Wanneer dat mogelijk is, dan betreft het slechts complete volumes. Sommige NAS-oplossingen ondersteunen wel het fijnmazig verhuizen van data, maar alleen maar op handmatige basis.
De toekomst van SDS De groei van de SDS-markt is hoofdzakelijk te danken aan de komst van de appliance voor hyper-converged infrastructure. Het irriteert bijna alle storageleveranciers dat ze voortdurend worden bestempeld als leverancier van ‘commodity’ en ‘traditional’ storagehardware. Daarom hebben ze de samenwerking opgezocht met softwareleveranciers van SDS stacks om deze te bundelen met hun bestaande hardware in een kant-en-klare hyperconverged kit. In de storagewereld zijn vragen gerezen over het ontwerp en de werkzaamheid van het SDS/hyper-converged infrastructuurmodel. Volgens sommige storagestartups staat de volgende generatie SDS (of SDS 2.0) al voor de deur.
Herdefinitie SDS stack of computing disaggregatie? Volgens deze startups zou het SDS stack zich niet alleen moeten beperken tot de porting van alle value-added software die zich op array controllers en serverside stack bevinden. Volgens hen ontbreekt het aan monitoring en beheer van de hardware en het file- of object system. Misschien zou het SDS stack ook de virtualisatie van de onderliggende storageomgeving voor zijn rekening moeten nemen.
Een veel gehoord bezwaar bij hyperconvergence is het ontbreken van de mogelijkheid om computing power los te koppelen van de storage en vice versa. Het idee daarbij is om niet terug te gaan naar afzonderlijke verticalen met storage en servers, maar de creatie van pools met verschillende functies die zijn gekoppeld via nodes.
Een andere stroming in de storagewereld stapt dan ook af van het idee van storage-aggregatie en ziet een toekomstige ontwikkeling die de richting uitgaat van disaggregatie van de computingomgeving. Volgens analist Arun Taneja spreken we van “alweer een nieuw datacenterparadigma: disaggregatie”. Aan het oppervlak lijken hyper-convergence en disaggregatie haaks op elkaar te staan, maar volgens Arun is disaggregatie eenvoudigweg een evolutie van het concept van hyper-convergence.
SDS heeft voor het beheer van de storageresources in de verschillende pools nog een gestandaardiseerde interface voor storagemanagement (zoals SMI-S) nodig. Legacy-interfaces worden echter nog steeds het meest gebruikt, en het is prematuur om hun verdwijning te voorspellen. Hoopvol is de komst van open source APIs die tot een de facto standaard voor storagemanagement kunnen uitgroeien. Een goede kandidaat daarvoor is OpenStack Cinder.
In essentie is SDS, net zoals Software Defined Networking (SDN), een resource die we willen beheren. Gezamenlijk vormen ze de elementen van de toekomstige Software Defined Data Datacenter (SDDC). Maar zover is het nog lang niet. Zowel SDS als SDN maken nog een evolutie door. Voorlopig staat het gebrek van breed geaccepteerde standaarden een unified virtuele storageomgeving op basis van verschillende storagesystemen in de weg.