db.dobo.sk

Avamar – kapacita a storage

bez komentára

Vzhľadom k tomu, k čomu avamar slůži, tak asi najdoležitejšie téma. Cieľom je mať avamar v “steady state”, t.j. postupom času ho nakonfignúť tak, aby bol prítok (zálohy) a odtok (vypršanie retencií a GC) stabilný a avamr zaplnený “tak akurát”. Problém je, že keď sa avamar preplní, tak okamžité mazanie nič nevyrieši, dokonca ešte zhorší, t.j. je nutné čakať na vyexpirovanie záloh.

Dedupe

Je to, čo EMC predáva :). Na rozdiel od NW, dedupe 1. úrovne prebieha už na klientoch, takže po sieti menej dát (preto len GB porty) a ďalšie dedupe potom na samotnom avamare.

Ako avamar storuje data

1. RAID, RAIN a replikácia – pre ochranu a redundanciu

2. Dáta v podobe stripov sú uložené na datových nodoch na partíciách /data

2. Stripes -

OS kapacita a GSAN kapacita

OS kapacita je súčet veškerého diskového priestoru na všetkých nodoch. Je jasné, že efektívna GSAN kapacita je menšia – je tam nejaký overhead zapríčinený redundanciou dát a maintenance tasky vyžadujú nejaký voľný priestor. T.j. keď GC vyhlási MSG_ERR_DISKFULL error, tak avamar ešte nie je plný, ale je za hranicou voľného priestoru pre maintenance operácie. V prípade, že k tomuto dojde, tak nemá význam mazať bekapy a klientov (snažiť sa znížiť GSAN kapacitu), pretože GC neprebehne a je to stejne v loji. Je nutné niekde naškriabať OS kapacitu (pripojiť disk?) a tým poskytnúť priestor pre beh GC. Inými slovami – ak sa vyskytne kapacitný problém, primárne sa musí riešiť OS kapacita, aby nasledovné GC vyčistilo data.

  • Jak sa pozná vyčerpanie OS kapacity? Nepobežia maintenance tasky.
  • Jak s apozná vyčerpanie GSAN kapacity? Nepobežia bekapy a replikácie.
avamar_capacity01

Data pertition capacity = OS kapacita; User capacity = GSAN kapacita (tiež Utilization capacity).

 

avmaint nodelist | grep  ‘fs-percent’ – zaplnenosť OS kapacity po nodoch

df nemá význam, pretože stripy sú prealokované, ale nemusia mať data

 

Kapacity aktuálnych záloh (GSAN kapacita)

/usr/local/avamar/bin/capacity.sh – utilita od vývojárov EMC, ktorá tabuľkovo podáva prehľad o toku dát za posledné dni a vyšvihne niekoľko najzmenovejších serverov

Ak kapacitný problém, tak vo všeobecnosti postupovať následovne:

  •  uistitť sa, že GC beží aspoň 1x denne (dumpmaintlogs –types=gc)
  • nepridávať klientov
  • obmedziť retenciu klientov
  • odmigrovať klientov
  • rozšíriť kapacitu (DD)

píše: ďobo

Február 20th, 2017 o 5:45 pm

chlievik: avamar gen4

okomentuj