Változatok adattárolásra

Piackutatók egymással versengve mondják, írják, hogy az adatok hatalmas tömegét kell elérhetően elhelyezni az elektronikus gazdaság adatbankjaiban. Az évente eladott tárolási kapacitás valóban meredeken emelkedik, s a merevlemez- és CD-gyártók örülhetnek a folyamatos keresletnövekedésnek, az informatikai vezetők már kevésbé. A megszokott eszközökkel, merevlemezzel, rendszeres mentéssel, de még az önjavító, az adatokat redundáns módon, többszörözve tároló RAID-tömbökkel is csak ideig-óráig és csak bizonyos nagyság alatt tudnak operálni. Szervezés tekintetében eltérő, technikailag közös megoldás kínálkozik a kisebb és a nagyobb cégek számára. Kettő is, a network-attached storage (NAS) és a Storage Area Network (SAN), amiket e cikkben röviden hálózati adattárnak mondunk. A legnagyobbaknál, nagyszámítógépes környezetben már évekkel ezelőtt is építettek például automata mágnesszalag-kezelő berendezéseket: szoba nagyságú wurlitzereket, ahol a polcokon ezrével vannak a mágnesszalagok, és sürög-forog az automata, hogy etesse a szoba egyik oldalán a mágnesszalag-olvasókat. Azóta megsokszorozódott az egy négyzetmilliméteren elhelyezhető bitek száma, a mágnesszalag is összement, minikazettás változatain tíz-húsz gigabájt információ is elfér, a wurlitzer mégis kimegy a divatból. Nincs idő cserélni, minden adat azonnal kell. A hálózati adattárban már tízesével-húszasával pörögnek az ötven-száz, vagy ki tudja, hány milliárd bájtos merevlemezek. Ami a szervezést illeti, ha egy cég elég nagy ahhoz, hogy megtöltsön egy SAN-szekrényt, akkor belül megoldja a dolgot. Ha viszont kisebb, szolgáltatóhoz kell fordulnia, a gyors és biztonságos elérhetőség érdekében fontos adatait is kénytelen lesz máshol, egy adatközpontban tartani. A SAN-okról szóló összeállításunk egyik érdekessége az IBM Shark - cápa -, aminek európai gyártása Magyarországon történik, az osztrák Zollner váci gyárában.

Világkönyvtár. A nyilvános könyvtárban jelentkezik a leglátványosabban az, ami az internetes gazdaságnak is egyik sarokpontja, az adattárolás. A gyors eléréshez, kiolvasáshoz, a digitális hálózaton rendelésre szállított könyvhöz, filmhez, dokumentumhoz szükség van sok százezer kérést is egyszerre kiszolgálni képes adatbázisokra, digitális könyvtárakra. Maga a fogalom nem új, az IBM terméklistáján évek óta ott vannak a "digital library"-k, és ez az elnevezése a magyar országos kulturális dokumentumtárnak is. Vannak nyilvánosan hozzáférhető adattárak világszerte, de ezek nem alkotnak világkönyvtárat, amíg meg nem oldódik az írott, hangzó és mozgóképes anyagok egységes, nyelvfüggetlen keresésének problémája, a kompatibilis adattárolás, meg nem születnek a szükséges szabványok. De gát az idejétmúlt, a multinacionális kiadók érdekeit szolgáló szerzői jogi szabályozás is. Arról nem is beszélve, hogy még nem tisztázódott, ki viseli a világkönyvtár létrehozásának költségeit: az államok, az egyetemek, a múzeumok, esetleg külön erre a célra létrehozott alapítványok.

Ezen kérdések tisztázására szervező munka indult el Amerikában az Amerikai Egyesült Államok Nemzeti Tudományos Alapjának koordinálásával, Digital Libraries Initiative (digitáliskönyvtár-kezdeményezés) címmel. A cél erőforrás-teremtés, pénzgyűjtés arra, hogy az egyetemeken megoldják a digitális könyvtárazás még meglévő technikai problémáit.

Adatállomány-kiszolgáló vagy hálózati adattár? A nagy cégösszeolvadások, az internetezés, az üzletközi virtuális közösségek kialakulása megváltoztatja a vállalatok gazdálkodásának módját. Az új vívmányok mindegyike egyre több és pontosabb információt, gyorsabb tájékozódást követel az üzleti élet minden aspektusáról. Gyorsan pörögnek a termékek, nagyon oda kell figyelni a versenytársakra, és pillanatról pillanatra elemezni kell a folyamatokat. A nyerő stratégiához egyre inkább hozzá tartozik például a vásárlói kapcsolatkezelés, hiszen legalább olyan kifizetődő a meglévő vevő megtartása és ösztökélése arra, hogy vásároljon, mint az újak megnyerése. A vásárlófogásra, a kifinomult, egyénre szabott ajánlat készítésére és a vásárló megtartására szolgáló programok kialakítása előkelő helyen van minden cég prioritási listáján. Különféle eladási, piacteremtési és vevőszolgálati eszközökre, vevőértékelésre, adatbányászatra, tömeges testreszabásra, alapos piacelemzésre van szüksége annak, aki versenyben akar maradni.

De ezek egyike sem működik adat, pontos és időben beérkező, rendelkezésre álló adat nélkül. Adat kell a piacról, a vevőről, az eladások alakulásáról, a költségekről, a versenytársakról. Most jött el az ideje annak, hogy az informatikusok teljesíteni tudják, amit évtizedek óta ígérnek: gyors és pontos információ az üzleti döntésekhez. De a sokasodó adatok egyre gyorsabb és alaposabb elemzése, feldolgozása hatalmas követelményeket támaszt az adatkezelő infrastruktúrával szemben.

Ma még általában ahány adatbázis, ahány program egy vállalatnál, annyi kiszolgáló, annyi adattároló berendezés, egység. Van egy külön gépe az integrált vállalatirányítási rendszernek, egy külön a levelezéshez, a gyártásszervezéshez, az ügyviteli dolgozók, vezetők adatállományainak tárolásához és így tovább. A szigetrendszereknek köszönhetően sokszor még arról is gondoskodni kell, hogy az egyik adatbázisban gyűlő adat rendszeresen átkerüljön egy másikba, ahol egy másik alkalmazás fog vele dolgozni. Minél nagyobb egy cég, annál nagyobb munka a sok kiszolgáló adatait rendszeresen menteni, a soha senki által nem használt adatállományokat rendszeresen törölni, a kapacitást figyelni, és időben gondoskodni a bővítéséről.

Az amerikai Storage Research Center kutatásai szerint a folyamatos működés legnagyobb gátja, hogy a szétaprózott kiszolgálós adattárolás miatt azokhoz nem lehet folyamatosan hozzáférni.

A megoldás a központi adatállomány-kezelés megvalósítása, egyetlen, minden felhasználó és minden program számára elérhető, adattárolásra tervezett, mindent befogadni képes eszköz beállítása. Olyané, amely rendkívül gyorsan képes adatot befogadni és kiadni, csatolófelületei szabványosak, képtelen az adatvesztésre, és rugalmasan bővíthető.

Azt gondolhatná valaki, hogy nincs ennél egyszerűbb feladat. Fogunk egy dobozt, beteszünk tápegységet, hálózati kártyát, néhány merevlemezt, és már van is egy központi adattárunk. Nincs. A SAN-t ugyanis a szervezés, az adatkezelés teszi. Okosan kell gazdálkodni a hellyel, gyorsan el kell tudni helyezni a bejövő adatot és kiadni a kértet, s mindezt párhuzamosan, a kéréseknek akár a százait is teljesítve. Leállás nélkül, maximális teljesítménnyel.

A hálózati adattár önálló egységként jelenik meg a hálózatban, és általánosan elérhető minden program számára, függetlenül attól, hogy az milyen gépen fut. Abban közös a hagyományos tárolással, hogy mind kapacitásban, mind teljesítményben méretezhető, lépésről lépésre bővíthető az átviteli sávszélessége is, ahogy azt a megnövekvő adatforgalom megköveteli. Azáltal, hogy az adattárolás lekerül a kiszolgálóról, ott felszabadul erőforrás, gyorsabban futhatnak az alkalmazások. Ha egy adatra szükség van, nem kell keresgélni a kiszolgálók között, egy helyen minden megtalálható. Könnyebb az adminisztráció, csökken a működési költség.

Miben különbözik a NAS a SAN-tól? A NAS rendszer kulcseleme egy szerkezet, ami az adatforgalmat vezényli a helyi, valamint a távolsági hálózatban. Kiszolgálóként közvetlenül csatlakozik a hálózatra, és egy merevlemeztömböt vezérel. Miután a szabványos hálózati átviteli eszközöket és protokollokat használja, a kiszolgálók széles választékával képes együttműködni, tőlük adatot elfogadni és tárolni. Átjáróval nagyszámítógépes kapcsolata is megoldható.

A SAN viszont egy különálló, központilag felügyelt nagy sebességű tárolási hálózat, amelyben a több szállítótól származó egységeket egy általános tárolásfelügyelő szoftver vezérli. A tárolási hálózat elemeit üvegszálak kötik össze, az adatforgalmat hubok, kapcsológépek, átjárók irányítják úgy, hogy mindenki mindenkivel képes adatot, üzenetet cserélni. Az alkalmazási és tranzakciós kiszolgálók kapcsolódhatnak közvetlenül a SAN-hoz, de elérhetik helyi vagy távolsági hálózaton keresztül is. Így egy SAN a földrajzilag egymástól távol elhelyezett kiszolgálók százainak adatait képes tárolni. De a SAN-ok egymással is összeköthetők, ami lehetővé teszi a gyors és biztonságos tükrözést, háttértárként való igénybevételt vagy akár az archiválást. Ez a tároláscentrikus üvegszálas hálózati architektúra további előnyökkel bír:

vaz adatmentést leválasztja a kiszolgálóról, lehetővé téve annak folyamatos működését;

vnöveli a teljesítményt azáltal, hogy hálózati kapacitást enged át a felhasználónak;

va katasztrófa esetére fenntartott távoli adattár közel valós idejű frissítését teszi lehetővé;

A hálózati adattár beállítását alapos előkészítő munkának kell megelőznie. A szükséges szervezettség és megfontoltság tekintetében ez a feladat semmiben sem különbözik egy új, központi kiszolgáló beállításától. Amiben annál több, az az újdonsága, az, hogy sok részfeladat esetében nem lehet a meglévő rutinra támaszkodni. Miután a cél az adattárolás teljes konszolidációja, a hálózati adattár beállítása legalább olyan nagy feladat, mint egy óriás kiszolgáló beállítása a meglévő kicsik helyett. Ezért a tervezés a meglévő helyzetből indul ki, a kezelendő adatok és a meglévő tárolóeszközök felmérésével, a célok világos megfogalmazásával és a jövőbeni tárolási igények becslésével kezdődik.

A következő lépés a vállalati tárolóhasználat, az adatforgalom elemzése és a bevezetés lépéseinek, a meglévő eszközökkel való együttműködés megtervezése. Maga az adattár önálló egységként működik, s ennek megfelelően ki kell alakítani a felügyeletét, gondoskodni kell a hibavédelemről, a hardver, a szoftver és a vezérlő rendszer karbantartásáról. Korántsem egyedül a hardver teljesítménye az, amit érdemes figyelembe vennie annak, aki kiválasztja a beszerzendő hálózati adattár szállítóját. Arra ajánlott figyelemmel lenni, hogy az egész doboz, a hardver és a vezérlőszoftver együtt mennyire képes kiszolgálni a folyamatos üzemet, mekkora az áteresztőképessége, mennyi adatot tud egyszerre fogadni és kiadni magából, és mennyire tud felülemelkedni a kiszolgálók, alkalmazások heterogenitásán.

Érdemes felkutatni a kutatóintézetek összehasonlító tesztjeit, érdeklődni olyan szervezeteknél, amelyek már döntöttek, vajon elégedettek-e azzal, amit kaptak. Ez azonban csak a jéghegy csúcsa, hiszen egy újságcikk alkalmatlan arra, hogy részletes útmutatót adjon az üzembe helyezéshez. A feladat komplexitását azonban érzékelteti. Egy átálláshoz ott, ahol tíz-húsz önálló kiszolgáló működik, és sok alkalmazásnál alapkövetelmény a folyamatos működés, kivételesen sokirányú tapasztalattal bíró szakértőkre van szükség. Nem is biztos, hogy belső erőkkel megoldható. A SAN, habár sokat eladnak belőle a világon, még csak az első generációnál tart.

Vargha Márton

IBM vállalati adattár

A mellékelt ábra alapján röviden bemutatjuk az IBM hálózati adattár termékét, a SAN-ként is beállítható Enterprise Storage Servert. A külső adatkapcsolat az ábra tetején látható csatolókon, Host Adaptereken keresztül valósul meg. Ezek lehetnek két- - SCSI vagy ESCON - csatlakozósak, de van egy üvegszálas bemenetet tartalmazó változatuk is. Az ESS-ben két, egymástól függetlenül, párhuzamosan működő adatkezelő egység, úgynevezett Cluster Processor Complex van, mindkettő adatkapcsolatban van mindegyik adapterrel. Az adatkezelő egység egy szimmetrikus felépítésű, négy RISC processzoros számítógép, nyolc gigabájtig bővíthető gyorsmemóriával, az adatokat az áramellátás kimaradása esetén is megőrző, saját elemes tápellátással bíró gyorstárral és négy, a fizikai tárolókkal - elsősorban mágneslemezekkel - való kapcsolatot kiszolgáló Device Adapterrel, eszközvezérlővel. A gyorsítótárakba minden adat a körülményekhez igazodó, adaptív algoritmus szerint kerül, rekord, sáv vagy félsávnyi terjedelemben, és a kiolvasásuk is így történik. Az adattartalom biztonsága érdekében minden adat egy időben két gyorsítótárban is ott van. Íráskor az adatok a gyorsítótárba és a másik adatkezelő egység tartós memóriájába kerülnek, ezért nagyon kicsiny az elveszésük valószínűsége. Az elv az, hogy ami egyszer belekerült az ESS-be, az tökéletes biztonságban legyen. Az eszközvezérlők a RAID-be szervezhető mágneslemeztömbökkel százhatvan megabit/másodperc sebességű összeköttetésben vannak.

EMC-koncepció

Az adattároló tömbök legnagyobb szállítóinak egyike az amerikai EMC, korábban EMC2. Az ő terminológiájukban az elektronikus gazdaságot kiszolgáló e-infostruktúra tárolóközpontja a Symmetrix Enterprise Storage átfogó tároló megoldás, valamint ennek újabb keletű kiterjesztése, a vállalati hálózati adattár (Enterprise Storage Network). A tárolómegoldások hálózatba foglalását a szolgáltatások széles köre és az összetett szoftverkörnyezet és teszi teljessé. Fő jellemzői közé tartozik a nyíltság, vagyis az, hogy az összes főbb kiszolgáló platformhoz illeszthető, beleértve a nagyszámítógépeket is, és össze lehet kapcsolni a helyi és távolsági adathálózatokkal, világháló állomásokkal. Az EMC szerint az Enterprise Storage Network jól szolgálja az üzletmenet folyamatosságát, védelmet nyújt a tervezett és nem tervezett, véletlenszerű üzemszünetek esetére. Erre eszközként a különféle RAID-megoldásokat, a fizikailag távoli adattükrözést és az elemek teljes megkétszerezését ajánlják. A beépített szoftveres intelligencia a felhasználó elől elrejti az egyes adatformátumokból adódó különbségeket, lebontja ezzel a nagyszámítógép és a nyílt rendszer közötti falat, átjárhatóvá teszi az adatbázisokat és kiszolgálókat. Vezérlőeszközével egyszerű az üzemeltetés, és a biztonsági feladatok elvégzése - például a mentéseké - nem zavarja a működést. A teljesítmény- és eseményadatok gyűjtésével segíti a rendszer működésének finomhangolását, mindezt egy központi vezérlőállomásról.