miércoles, agosto 9, 2006, 12:52 PM

En todos estos años que llevo dedicándome a administrar sistemas cada vez ha ido entrando con más fuerza la tecnología de Storage Area Network (SAN) en los centros de procesos de datos.
Me ha tocado pelearme con sistemas SAN de todos los colores: Compaq StorageWorks Modular Array 8000, EMC Clariion CX700, IBM TotalStorage DS4300 , HP StorageWorks Modular Smart Array 1000, Sun StorageTek 6130, HP StorageWorks Enterprise Virtual Array 3000 y con una Bull que no me acuerdo como se llamaba
Como casi todo en esta vida, a la hora de construir una SAN hay que buscar un equilibrio entre las siguientes cosas:
* Rendimiento
* Escalabilidad
* Precio
Veamos algunos errores que me he encontrado en todos estos años en estos CPDs tan fríos que tienen los amados clientes:
- En más de una ocasión me he encontrado con instalaciones con sistemas SAN con una inmensa capacidad de escalar y resulta que el cliente se lleva toda la vida con una bandeja de discos (y a medio llenar). Al cabo de los años se les queda vieja la SAN y la cambian por otra. Resultado: el cliente ha pagado por algo (capacidad de escalar) que luego no ha usado, con el sobrecoste que implica.
- Otras veces la gente se gasta un dineral para obtener mucho rendimiento, pero luego "racanea" donde no debe. ¿De qué vale tener HBAs, switches y controladoras a 4 gigabits, 8 gigabytes de caché por controladora, gigabytes de ram en el servidor, PCI-X y todas esas cosas si a la hora de la verdad la gente pone los datos de la base de datos en raid5 de pocos discos o en raid1, y en discos de 10.000rpm ? Que si uno quiere rendimiento necesita (entre otras cosas) muchas cabezas de disco girando para minimizar el tiempo de acceso a los datos. Para eso se inventó el raid 10, el raid 50 y esas cosas...
Yo prefiero tener 12 discos en una simple bandeja de disco externa scsi con conexión Ultra320 que tener 3 discos Fiber Channel en un canal de 4 gigabits... seguro que me cuesta más barato tener la bandeja externa scsi que la tan cacareada SAN con sus caros discos de fibra...
Este último error es muy tipico: se ponen conexiones de fibra a varios gigabits que JAMÁS se llegan a aprovechar más de un 20 o 25%. Tanta pasta en switches, HBAs, controladoras, software de dual path, etc, para que al final se esté esperando los discos. La caché de las controladoras puede paliar este problema, pero la solución es saber dimensionar "por igual". Mejor una controladora de 2 gigabits con muchos discos que una controladora de 4 gigabits con muy pocos.
- Otras veces la gente confunde las jerarquías de almacenamiento, creyendo que lo más caro es siempre lo mejor, sea cual sea la necesidad. Existen sistemas de almacenamiento on-line, near-line, off-line, así como distinas necesidades de rendimiento (latencia y ancho de banda) y disponibilidad. Yo he me encontrado LUNes inmensas sobre discos Fiber Channel para almacenar simples logs que raramente se miraban (vaya desperdicio) y también me he encontrado bases de datos Oracle en producción tirando de NFS (que dolor!!!!). Cada cosa tiene su sitio. Y decidir que es lo más adecuado sólo mirando benchmarks con gráficos Excel hablando de Terabytes, IOP/s es una visión muy estrecha de la problemática de la gestión de almacenamiento.
La raiz de casi todos estor problemas no es tecnológico, sino humano: ese gasta mucho dinero "en chapa", pero poco en asesoramiento y administración. La elección de un sistema SAN es algo que requiere un análisis de las necesidades de almacenamiento de la organización, de como se estructura la información, ver que activos son los que más se emplean, en fin, analizar quién, cómo y cuando se usan los datos. Y muchas veces esta fase inicial es casi inexistente, será que hay clientes que les gusta tener "símbolos fálicos" y poder decir que mi cabina pesa 780 kilogramos y me ha costado no se cuantas centenas de miles de Euros. Vivir para ver.
Otro punto a tener en cuenta es el ciclo de vida la información. Tener almacenado en nuestra carísima SAN ficheros que hace años que no se acceden es un despilfarro. Para el ejemplo anterior, un sistema de almacenamiento óptico resulta mucho más barato. Para eso están las jerarquías de almacenamiento, para decidir donde debe almacenarse una información, de acuerdo a sus necesidades de rendimiento, criticidad, tamaño y validez en el tiempo.
En resumen: antes de gastarnos un dinero en un sistema de almacenamiento (SAN, NAS, DAS) es aconsejable investigar cuáles son nuestras necesidades y entonces elegir la solución que más se ajuste a nuestros requerimientos. Un asesoramiento experto en esta fase puede ahorrarnos muchos miles de Euros, no hay que tener miedo a gastar dinero en planificación, aquí pasa como en la Ingeniería del Software: si la toma de requisitos es correcta, es mucho más fácil diseñar y luego implantar. Pues en la Ingeniería de Sistemas pasa lo mismo.
Que ustedes almacenen bien
[ 6 comentarios ] ( 2104 visualizaciones ) | [ 1 trackbacks ] | enlace permanente |




( 3 / 691 )




