Chubascos Blog

Chubascos tecnológicos para quitarnos la neblina de las tecnologías de la nube! Viva la lluvia!

Yet Another VCAP-DCA post – Sección 1 – Objetivo 1.1 / Parte 1

Hola,

Empieza mi aventura para obtener el VCAP-DCA…a ver si llego! Puesto que normalmente tomo notas de lo que estudio y la mejor forma de aprender para mi es “hacerlo con cabeza de luego tener que explicarlo”, intentaré en la medida de lo posible, ir agregando posts con los distintos objetivos del blueprint. Como mi amigo @pipoe2h me recomendó por twitter: “blueprint y ármate un laboratorio con 2 hosts y vCenter y a seguir el blueprint” 🙂 Ya que sabe de lo que habla y además lo hace desde la experiencia puesto que tiene el VCAP-DCA y el VCAP-DCD…habrá que hacerle caso 🙂

No entraré en detalle de las distintas certificaciones que VMware tiene disponibles ni dónde entra el VCAP-DCA de vSphere. Si alguien quiere info al respecto, este es el link

http://mylearn.vmware.com/portals/certification/

Al lío pues y a ver qué sale.

Intentaré ir haciendo entradas en el blog según los objetivos del blueprint del examen. Para obtener el blueprint hay que registrarse (gratuito) y descargarlo desde el link correspondiente en la “Página oficial de VCAP-DCA”.

Nota: Esto es parte de mi estudio personal en el cual me valgo de recursos oficiales y de la ayuda que ponen a disposición en la web otros profesionales. Referenciaré cada uno de los recursos utilizados por mi o bien en “links de interés” o dentro del mismo cuerpo de esta guía. No invento nada y posiblemente no aporte nada nuevo salvo mi forma de entender y explicar algunas cosas. De todas formas, espero que este material de estudio le sea de utilidad a alguien más 🙂

Sección 1 – Objetivo 1.1 – Implementar y gestionar soluciones complejas de almacenamiento

Conocimiento:
*Identificar tipos de RAID.*
Identificar tipos de HBA soportadas.
Identificar formatos de discos virtuales.

Capacidad y habilidades para:
Determinar los casos de uso y configurar VMware DirectPath I/O.
Determinar los requerimientos y configurar NPIV.
Determinar el nivel de RAID apropiado para distintos tipos de cargas en las VMs.
Aplicar las best practices de VMware para almacenamiento.
Entender los casos de uso para RAWs (Raw Device Mapping).
Configurar los filtros de almacenamiento de vCenter.
Entender y aplicar la VMFS re-signaturing (traducir esto como “re-firma” me suena raro).
Entender y aplicar masking de LUNs utilizando comandos del tipo PSA.
Analizar los I/O de las cargas de trabajo para determinar los requerimientos de I/O del almancenamiento.
Identificar y etiquetar dispositivos SSD.
Administrar la aceleración por hardware para VAAI.
Configurar y administrar almacenamiento “profil-driven”.
Preparar el almacenamiento para mantenimiento.
Upgradear la infraestructura de almacenamiento de VMware.

Herramientas:
vSphere Installation and Setup 5.5 – http://goo.gl/nUXi7i
vSphere Storage 5.5 – http://goo.gl/bO5VlT
vSphere Command-Line Interface Concepts and Examples – http://goo.gl/T3X6DV

Cliente de vSphere/Cliente Web de vSphere
vscsiStats
vSphere CLI:
esxcli
vifs
vmkfstools
esxtop/resxtop

Contenido:

Identificar tipos de RAID
Un RAID o redundant array of independent disks es una tecnología que permite agrupar 2 o más discos duros para obtener distintos niveles de rendimiento y/o redundancia (RAID 0 no ofrece redundancia). Escoger correctamente el tipo de RAID es imprescindible en el momento de diseñar una infraestructura ya que no solo afectará al rendimiento de la misma sino que también tiene una repercusión directa en los costes. Muy simplificado, esto sería: “Más rendimiento y más redundancia implican más o MUCHOS más discos”.

Hay varios tipos de niveles de RAID y como es el objetivo en este punto, la idea es poder identificarlos.
Digamos que existen niveles de RAID que no merece la pena estudiar puesto que a efectos prácticos no se utilizan: RAID 2 y RAID 3 (obsoletos), RAID 4 muy raro de ver salvo en NetApp donde es más normal ver “RAID DP” (hace mucha gracia en los concursos públicos donde “no se pueden mencionar fabricantes” que describan una cabina con “RAID DP”…vamos, que no se nota! 😛 ) RAID DP así como otros tipos de RAID específicos de fabricantes (Hadoop, SHR, etc) tampoco los estudiaremos. RAIDs que sí son estandard pero que es difícil encontrar como los que mezclan un tipo de RAID con el RAID 0, también conocidos como “nested”, tampoco los veremos a excepción de RAID 10 (RAID 0 y RAID 1). Lo importante de este último tipo de RAID es que combina lo mejor y peor de 2 tipos de RAID en cuanto a rendimiento, capacidad y redundancia.
También es importante entender que RAID se puede hacer tanto por hardware como por software. Como nota personal, ojo a las descripciones de los fabricantes de servidores ya que muchas veces las controladoras que soportan RAIDs y que vienen integradas en placa, soportan RAIDs pero por software, algo que para un host con vSphere no vale si es donde se quiere instalar ESXi. Asimismo, muchos tipos de RAID, necesitarán que se añadan componentes como baterías para las caché de las controladoras, etc.

Para todos los RAIDs veremos:
Penalización escritura: Cantidad de IOPS que son necesarias por cada operación de escritura. Menos es mejor.
Tolerancia a fallos: Cantidad de discos que el RAID se puede permitir perder. Más es mejor.
Nº mín. de discos: Cantidad mínima de discos necesarios para formar el RAID.
Nº de discos de redundancia: Cantidad de discos que utilizan su capacidad para mantener información redundante. La capacidad de estos discos, no suman a la capacidad “utilizable” por el usuario del volumen.
Aplicaciones típicas: Casos en los que se suele ver el tipo de RAID en cuestión.

Vale la pena destacar aquí para no tener que hacerlo en cada tipo de RAID, que si uno mezcla distintos tipos de HDD en un mismo RAID, cuando se tenga que leer/escribir información en el disco lento, el rendimiento será peor. Por tanto, un RAID puede llegar a ser tan bueno como su disco más malo.

Como último punto antes de ir a la descripción de cada tipo de RAID, creo importante entender que en términos de almacenamiento: latencia, buffers, interfaces, tipo de IOPS (lectura o escritura), tipos y cantidad de discos, procesadores de almacenamiento y una lista interminable de elementos más, determinan un funcionamiento óptimo o poco óptimo de nuestro almacenamiento…no todo se reduce en tipos de RAID.

RAID 0
Es un tipo de RAID que no ofrece redundancia. La forma más fácil de explicarlo es que se trata de una forma de hacer que varios discos sean visibles a nivel de S.O. como si fueran un único disco. Lo que hace es distribuir la información en 2 o más discos (todos los que formen el RAID). Si se agregan a un mismo RAID 0 discos de distintas capacidades, sumarán al RAID 0 la capacidad igual a la del disco más pequeño. Por esto, si hiciéramos un RAID 0 con 1 disco de 73GB y otro disco de 600GB, tendríamos un RAID 0 con 146GB.
En principio es un tipo de RAID que se utiliza o bien para disponer de un “disco” grande donde se suma de la capacidad de los discos que forman el, o para aumentar la performance de nuestro almacenamiento. Aunque según el tipo de información y la forma en que es accedida, esta mejora en la performance no siempre es perceptible ni real. El handicap más importante en este RAID es que basta que falle un (1) disco del RAID para que perdamos la información de todos los discos (existen herramientas que permiten recuperar parte de la información).

P. escritura: 1
Tolerancia a fallos: 0
Nº mín. de discos: 2
Nº de discos de redundancia: 0
Aplicaciones típicas: Workstations de diseñadores gráficos/Autocad, logging, equipos dedicados a la edición de video…también a los gamers les suele gustar este tipo de RAID 🙂

RAID 1
También conocido como “mirroring”, este tipo de RAID “replica” la información de un disco o conjunto de discos (según lo que la controladora permita hacer) en todos los discos que forman el RAID. Como buena práctica general, lo ideal sería tener un disco o dataset en controladoras diferentes y que estas soporten hacer lecturas en paralelo para obtener mayor rendimiento en las lecturas.

P. escritura: 2
Tolerancia a fallos: n-1 o dicho de otra forma, “un dataset tiene que quedar en pie”. Para el caso de un RAID 1 con 2 HDD, tolera que falle un disco. Si hay un RAID 1 con 3 HDD, tolera que fallen 2 discos y así.
Nº mín. de discos: 2
Nº de discos de redundancia: Al menos 50% del RAID.
Aplicaciones típicas: Bases de datos transaccionales, discos de sistema.

RAID 5
Este tipo de RAID es el más extendido ya que ofrece tolerancia a fallos a un bajo coste. También conocido como “distribuido con paridad” (sólo los muy frikis utilizan este término), este RAID distribuye la información de paridad (la que utiliza para reconstruir información en caso de pérdida de algún disco) entre todos los discos del RAID. Para generar esta información de paridad, RAID 5 debe realizar cálculos que son los que hacen que al escribir, haya una penalización tan alta. Es más, si se somete a un RAID 5 a operaciones de escrituras múltiples y pequeñas (más pequeñas que su tamaño de stripe), se sufrirá mucho más de esta penalización puesto que aumentará considerablemente el número de cálculos que se deban realizar.
A tener especial cuidado con este tipo de RAID en caso de cortes de luz, cuelgues en el sistema que está accediendo al RAID, etc. Si bien existen medidas que nos protegen de errores como los SAIs de las cabinas que permiten que lo que está en caché se escriba a disco, etc. existe el riesgo de que se pierda la consistencia en la paridad…de esta pérdida de consistencia no seremos conscientes hasta que se pierda un disco y se tenga que reconstruir la información. Por eso es importante monitorizar las alarmas de la cabina y reparar cualquier error que aparezca.

P. escritura: 4
Tolerancia a fallos: 1
Nº mín. de discos: 3
Nº de discos de redundancia: “0” La redundancia se distribuye entre todos los discos del RAID.
Aplicaciones típicas: Backup a disco, archiving, discos con ficheros (file servers)…también es “tipical spanish” utilizarlos para meter toda la infraestructura virtual sobre ellos por tema costes, aunque desde un punto de vista idealista y purista, no es lo recomendado.

RAID 6
Al igual que RAID 5, se utiliza un sistema de paridad distribuido simplemente que en este caso es doble. Digamos que almacena el doble de información de paridad en cada disco que un RAID 5. Esto ofrece ventajas como una mayor tolerancia a fallos (2 discos) inclusive durante operaciones de reconstrucción de un disco dañado aunque la penalización de escritura sea mayor (dije que no iba a hablar pero hay que mencionarlo, RAID DP es una especie de RAID 6 pero que es mucho más rápido gracias a una tecnología patentada denominada WAFL).

P. escritura: 6
Tolerancia a fallos: 2
Nº mín. de discos: 4
Nº de discos de redundancia: “0”. La redundancia se distribuye entre todos los discos del RAID.
Aplicaciones típicas: Aplicaciones críticas, presentación de storage “grande” a servidores.

RAID 10
También conocido como RAID 1+0, es uno de los RAIDs tipo “nested” más utilizados, sino el que más. Básicamente combina el RAID 1 con RAID 0 de la siguiente forma conocida como “división de espejos”:
Exisitirá un único RAID 0 formado por RAIDs 1 en lugar de discos “sueltos”. Parecido aunque no lo mismo que un RAID 01 del cual no se habla en este documento. No se han de confundir aunque se preste a la confusión.

P. escritura: 2
Tolerancia a fallos: Un disco por RAID 1 tiene que estar en pie.
Nº mín. de discos: 4
Nº de discos de redundancia: Al menos 50% del RAID.
Aplicaciones típicas: Bases de datos con mucha carga, servidores de aplicaciones con mucha carga.

Bueno, como esto está haciendo más largo de lo que me esperaba, “partiré” este objetivo en más de un post.

Aquí os dejo la bibliografía utilizada por mi para escribir lo que escribí y “no morir en el intento” 🙂

Links de interés:
Página oficial de VCAP-DCA – http://goo.gl/SHpUkS
http://wintelguy.com/raidcalc.pl

Guías de estudio:
http://wahlnetwork.com/2012/07/02/the-vcap5-dca-study-sheet/
http://www.vexperienced.co.uk/vcap5-dca/
http://thesaffageek.co.uk/vsphere-5-study-resources/vcap5-dca-objectives/
http://www.virtuallanger.com/vcap-dca-5/
http://www.valcolabs.com/vcap5-dca/
http://thefoglite.com/vcap-dca5-objective/
http://paulgrevink.wordpress.com/the-vcap5-dca-diaries/
http://www.seancrookston.com/blog/vcap-dca/

Bibliografía utilizada para este post (además de las ya mencionadas guías de estudio y links a docs de VMware):
http://en.wikipedia.org/wiki/RAID
http://en.wikipedia.org/wiki/Standard_RAID_levels
http://en.wikipedia.org/wiki/IOPS
http://es.wikipedia.org/wiki/RAID
http://www.yonahruss.com/architecture/raid-10-vs-raid-5-performance-cost-space-and-ha.html
http://shanibasha.blogspot.com.es/2011/02/all-about-iops-and-write-penalty.html
http://www.accs.com/p_and_p/RAID/BasicRAID.html
http://www.enhance-tech.com/press/raid-comparison-and-storage-systems.html
http://www.datarecovery.net/articles/raid-level-comparsion.html
http://www.adaptec.com/en-us/_common/compatibility/_education/raid_level_compar_wp.htm
http://www.netapp.com/us/communities/tech-ontap/tot-back-to-basics-raid-dp-1110.aspx
http://storageioblog.com/raid-and-iops-and-io-observations/
http://theithollow.com/2012/03/understanding-raid-penalty/
http://www.synology.com/en-us/support/tutorials/512
http://wintelguy.com/2013/20130406_disk_perf.html
http://wintelguy.com/raidperf.pl

Hasta la próxima!
Sebastián Greco

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: