GuilleSQL :: Microsoft SQL Server, SSIS, y más !!

DAS, NAS y SAN. Arquitecturas de Almacenamiento y Evolución histórica

Volver a: [Almacenamiento SAN, NAS, DAS. Conceptos e Historia: NFS, SMB, CIFS, Fiber Channel, HBA, Switch Fabric, iSCSI, IQN, MPIO, LUN, Snapshot, Switch Zoning, LUN Masking, WWN, WWNN, WWPN, FCIP, iFCP]


En este primer capítulo se introducen las Arquitecturas de Almacenamiento DAS (Direct Attached Storage), NAS (Network Attached Storage), y SAN (Storage Area Network), sus ventajas e inconvenientes, diferencias y similitudes, y otros conceptos y tecnologías relacionadas (SCSI, Fiber Channel, RAID, NFS ó Network File System, CIFS ó Common Internet File System, iSCSI, MPIO, SecurePath, LUN Masking, Zoning, etc.). Finalmente, se introduce la arquitectura SSA (Serial Storage Architecture) de IBM.

Creo que la mejor forma de empezar es con la introducción de las Arquitecturas de Almacenamiento DAS, NAS y SAN, por dos motivos: el primero para su conocimiento (fundamental) y el segundo porque al explicar estas tecnologías daremos pie a la introducción de otros conceptos y tecnologías, también de gran importacia. Allá vamos.

  • DAS (Direct Attached Storage), la gran época del Mainframe. Se trata de dispositivos de almacenamiento directamente conectados a las máquinas, como es el caso de discos duros internos, cabinas de disco (en Rack en o cualquier otro formato) conectadas directamente a un servidor, o unidades de cinta para backup. Suele basarse en tecnologías SCSI (Small Computers System Interface), FC (Fiber Channel), e IDE. Esta arquitectura de almacenamiento, se relaciona principalmente con la época de los Mainframe de IBM, y los Miniordenadores UNIX, pues aquellos años se dotaba a estas máquinas de sus propios medios locales de almacenamiento y backup. Sin embargo, hoy en día, los PCs de sobremesa utilizan arquitectura de almacenamiento DAS, mientras que en los servidores de las empresas, empieza a caer en desuso, utilizándose únicamente para el almacenamiento del Sistema de Operativo (en muchos casos ni eso, gracias a las soluciones Boot-on-SAN), y empleando almacenamiento SAN y NAS para el resto.

    La arquitectura de almacenamiento DAS (Direct Attached Storage), presenta muchos inconvenientes, como es la Dispersión del Almacenamiento que implica una Dificultad en la gestión de los Backups, una relativamente baja tolerancia a fallos (sólo posible a través de soluciones RAID), y un alto TCO debido a las dificultades de mantenimiento.

  • NAS (Network Attached Storage), la introducción de las redes. Con la introducción de las redes locales (LAN), se empezarón a utilizar servidores de almacenamiento conectados a la LAN, a los cuales se podía acceder directamente a través de la propia red mediante protocolos específicos como NFS (Network File System) en entornos UNIX y CIFS (Common Internet File System) en entornos Microsoft (antes conocido como SMB, protocolo original de IBM que fue mejorado por Microsoft en CIFS), o incluso mediante FTP, HTTP, etc. Antiguamente, se utilizaban los protocolos de Novell Netware que en ocasiones funcionabas sobre redes SPX, pero Novell Netware quedó en desuso, y actualmente las soluciones NAS se basan en TCP/IP, con protocolos NFS o CIFS por encima. En consecuencia, en la actualidad, un dispositivo NAS será una máquina dedicada con una o varias direcciones IP (sea un dispositivo NAS por hardware tipo frigorífico o un servidor Window/UNIX), y además estará dotado de una conexión de alta velocidad a la red LAN. Por ello, una arquitectura de almacenamiento NAS puede estar formada por múltiples dispositivos NAS geográficamente distribuidos. En cualquier caso, téngase en cuenta que un servidor NAS utilizará almacenamiento DAS o SAN (almacenamiento interno o almacenamiento externo), evidentemente. Claro está, que existen alternativas que integran soluciones NAS dentro de la propia infraestructura SAN.

    Así, los equipos clientes en una arquitectura de almacenamiento NAS, delegan la gestión del sistema de ficheros al propio dispositivo NAS. Se limitan a montar las unidades de red exportadas o compartidas por los dispositivos NAS, de tal modo que usuarios y aplicaciones utilizan estos sistemas de ficheros como si fueran sistemas de ficheros locales, aunque para el sistema operativo se trate claramente de sistemas de ficheros remotos.

    El problema de esta arquitectura de almacenamiento, es que la red LAN puede actuar de cuello de botella. Actualmente, sigue utilizándose masivamente las arquitecturas NAS (ej: típicas Carpetas Compartidas o Shared Folder, que se utilizan en las empresas para el almacenamiento de ficheros), aunque no a todas las aplicaciones le resulte igual de útil (ej: los grandes servidores de base de datos, preferiran almacenamiento SAN).

    Los principales beneficios de las Arquitecturas de Almacenamiento NAS, es que proporcionan un mejor TCO (Total Cost of Ownship), resultando una arquitectura fácilmente escalable, capaz de ofrecer una alta disponibilidad. En definitiva, es quizás la mejor forma de ofrecer compartición e intercambio de ficheros en un entorno heterogéneo.

  • SAN (Storage Area Network). Esta arquitectura implica disponer de una infraestructura de red de alta velocidad dedicada sólo para Almacenamiento y Backup, optimizada para mover grandes cantidades de datos, y consistente en múltiples recursos de almacenamiento geográficamente distribuidos y otros elementos (cables, switches de fibra FC, routers, adaptadores HBA, etc), completamente accesibles desde la red corporativa. Las redes de almacenamiento SAN geográficamente distribuidas, han facilitado enormemente la creación de Centros de Procesos de Datos (CDP) geográficamente distribuidos, Clusters Geográficos o GeoClusters, creación de centros de respaldo (BDC), etc.

    La utilización de una arquitectura de almacenamiento SAN implica la existencia y mantenimiento de al menos dos redes: la red LAN y las red SAN. En la práctica, las redes de almacenamiento SAN suelen basarse en la tecnología FC (Fibre Channel), aunque también pueden basarse en Gigabit Ethernet o GigaEthernet (véase el caso de iSCSI). Cuando se haba de redes conmutadas en Fiber Channel, suele utilizarse el término Switch Fabric. En ambos casos, suele emplearse sobre redes conmutadas, utilizando múltiples switches y múltiples puertos (tanto en los clientes como en los servidores de almacenamiento) para ofrecer Alta Disponibilidad basada en la existencia de múltiples caminos, apoyándose para ello en soluciones y protocolos como MPIO (Multipath Input Output) y SecurePath (solución propietaria de HP), y gracias también a la configuraciones de LUN Masking y Zoning. Evidentemente, además de la Alta Disponibilidad relativa a la redundancia de caminos, también se utilizan soluciones de Alta Disponibilidad del almacenamiento (Espejo o RAID1, RAID5, RAID10, etc.).

    La arquitectura de almacenamiento SAN, lleva experimentando un gran auge en los últimos años, tanto por los beneficios propios de la utilización de redes de almacenamiento SAN, como por la propia evolución de la tecnología, como la incorporación de soluciones de almacenamiento SAN basadas en iSCSI, incluyen soluciones SAN iSCSI por software como Windows Storage Server 2008 y Microsoft iSCSI Target.

    Los beneficios o ventajas de las redes de almacenamiento SAN, son evidentes: mayor velocidad de acceso a datos, menor tiempo de recuperación ante desastres (los tiempos de Backup y Restore se minimizan, y se añaden los clonados y Snapshots de LUN), escalabilidad (siempre es posible añadir más bandejas de discos, o incluso, más Cabinas de Discos y Switches), y sobre todo, una gestión centralizada, compartida y concurrente del almacenamiento (indiferentemente de la plataforma y sistema operativo de los Host). Por ejemplo, si necesitamos un disco de 20GB para un Servidor o Host, ¿para que voy comprar 2 discos de 320GB y montar un RAID1, si podemos crear una LUN de 20GB? Lo que quiero decir, es que hoy en día, no existen discos de 20GB a la venta (por poner un ejemplo), de tal modo, que la centralización del almacenamiento nos va a permitir optimizar nuestros recursos y minimizar costes (esto último es francamente mentira, pues los costes de infraestructura SAN son bastante altos, pero así al menos se consiguen amortiguar). Además, existen otros efectos colaterales, como por ejemplo, que la introducción de una infraestructura de almacenamiento SAN en una empresa, liberará de bastante tráfico de red LAN.

    Por desgracia, las redes de almacenamiento SAN también tienen sus inconvenientes, principalmente su coste (el precio del Gigabyte sale muy caro), y también la existencia de ciertas limitaciones para integrar soluciones y/o dispositivos de diferentes fabricantes. Una de la principales alternativas para la reducción de costes de la redes de almacenamiento SAN es la utilización de soluciones de almacenamiento SAN basadas en iSCSI, que funcionan con tarjetas Ethernet (de las de toda la vida, no hacen falta HBA) y sobre los Switches Ethernet de la LAN (de los de toda la vida, también). El hecho aquí, es que con las actuales redes Ethernet de 10Gbps, el cuello de botella se transfiere de la red al acceso a disco.

La diferencia entre NAS y SAN, principalmente es que un Host o Servidor accede a un disco NAS a través de la red LAN, MAN o WAN (ej: carpeta compartida), siendo el Sistema Operativo consciente de que se está accediendo a un recurso (el disco o mejor dicho, el sistema de ficheros) remoto. Sin embargo, un Host o Servidor accede a un disco SAN como si fuera un disco local (es decir, un disco DAS), de forma transparente para el Sistema Operativo, siendo las tarjetas HBA y sus drivers quienes se preocupen de que dicho acceso a la SAN sea así de transparente.

También se dice, que NAS se encuentra entre el Servidor de Aplicaciones y el Sistema de Ficheros, mientras que SAN se encuentra entre el Sistema de ficheros y el Almacenamiento Físico.

Por último, vamos a introducir la arquitectura SSA de IBM, principalmente por culturilla informática y con fines didácticos. SSA (Serial Storage Architecture) es una Arquitectura de Almacenamiento desarrollada por IBM (posteriormente estandarizada en ANSI X3T10.1), consistente en la conexión serie de múltiples dispositivos de almacenamiento SCSI a un Host, en modo dual-port full-duplex. El fallo de un único cable no evitará el acceso a los datos. Cada puerto transmite a 20MB, consiguiendo un ancho de banda total de 80MB. Es de la época de los discos DASD, de tamaños de 2,2GB, 4,5GB, 9,1GB, etc.

Volver a: [Almacenamiento SAN, NAS, DAS. Conceptos e Historia: NFS, SMB, CIFS, Fiber Channel, HBA, Switch Fabric, iSCSI, IQN, MPIO, LUN, Snapshot, Switch Zoning, LUN Masking, WWN, WWNN, WWPN, FCIP, iFCP]



Comentarios

jmginer - 07/02/2012 (UTC)
¿Qué opinas sobre implementar NFS utilizando tarjetas de red y switches de fibra?

Sobre SAN, dices: consistente en múltiples recursos de almacenamiento geográficamente distribuidos

Pero esto mismo también es NFS no?

No termino de ver la ventaja de NFS :(
Si bien, entiendo que implementar una SAN puede ser bastante complejo... no?

Gracias por la info!


GuilleSQL - 07/02/2012 (UTC)
La tecnología NAS está orientada a acceder a un sistema de archivos remoto a través de la red (ethernet, wifi, etc.), lo que conocemos como una Carpeta Compartida (Shared Folder). NFS es la tecnología que se suele utilizar en el mundo UNIX.

La tecnología SAN te permite que una máquinas vea un DISCO o LUN remoto, como si fuese un disco local.

Esa es la diferencia, hablar de un Sistema de Archivos remoto o de un disco o LUN remoto.

Por ejemplo, para montar un Cluster necesitarás tener discos (LUNs) compartidos, es decir, que todos los Nodos del Cluster los puedan ver como si fuesen discos locales. Para eso, actualmente se utiliza la tecnología SAN.

Es algo abstracto de explicar...

Saludos !
Guille



Miembros de
Miembros de GITCA (Global IT Community Association)

Menu de Usuario
  Iniciar Sesión
  Registrarse
  Restablecer Contraseña
  Ventajas de Registrarse

Acerca de
  Contigo desde Oct 2007
  771 usuarios registrados
  86146 pageloads/mes
  Ranking Alexa 498160

Social Networks
Sigue a Portal GuilleSQL en Linkedin !!
Sigue a Portal GuilleSQL en Twitter !!



Archivo

Marzo de 2019 (1)
Octubre de 2018 (1)
Julio de 2018 (1)
Junio de 2018 (4)
Mayo de 2018 (5)
Abril de 2018 (3)
Marzo de 2018 (2)
Febrero de 2018 (7)
Enero de 2018 (1)
Diciembre de 2017 (15)
Noviembre de 2017 (7)
Junio de 2017 (3)
Mayo de 2017 (1)
Marzo de 2017 (3)
Enero de 2017 (4)
Junio de 2016 (1)
Mayo de 2016 (2)
Abril de 2016 (2)
Septiembre de 2015 (2)
Agosto de 2015 (2)
Junio de 2015 (10)
Mayo de 2015 (4)
Abril de 2015 (8)
Marzo de 2015 (11)
Octubre de 2014 (3)
Septiembre de 2014 (7)
Agosto de 2014 (5)
Julio de 2014 (2)
Mayo de 2014 (4)
Abril de 2014 (4)
Marzo de 2014 (4)
Febrero de 2014 (1)
Enero de 2014 (5)
Diciembre de 2013 (8)
Noviembre de 2013 (2)
Octubre de 2013 (7)
Septiembre de 2013 (6)
Agosto de 2013 (1)
Julio de 2013 (6)
Junio de 2013 (11)
Mayo de 2013 (7)
Abril de 2013 (6)
Febrero de 2013 (5)
Enero de 2013 (7)
Diciembre de 2012 (12)
Noviembre de 2012 (13)
Octubre de 2012 (5)
Septiembre de 2012 (3)
Agosto de 2012 (6)
Julio de 2012 (4)
Junio de 2012 (1)
Mayo de 2012 (2)
Abril de 2012 (7)
Marzo de 2012 (16)
Febrero de 2012 (9)
Enero de 2012 (5)
Diciembre de 2011 (10)
Noviembre de 2011 (10)
Octubre de 2011 (4)
Septiembre de 2011 (5)
Agosto de 2011 (2)
Julio de 2011 (2)
Junio de 2011 (4)
Mayo de 2011 (2)
Abril de 2011 (6)
Marzo de 2011 (4)
Febrero de 2011 (10)
Enero de 2011 (5)
Diciembre de 2010 (6)
Noviembre de 2010 (4)
Octubre de 2010 (8)
Septiembre de 2010 (4)
Agosto de 2010 (1)
Julio de 2010 (3)
Mayo de 2010 (5)
Abril de 2010 (6)
Marzo de 2010 (8)
Febrero de 2010 (3)
Enero de 2010 (1)
Diciembre de 2009 (9)
Noviembre de 2009 (14)
Octubre de 2009 (2)
Septiembre de 2009 (8)
Agosto de 2009 (2)
Julio de 2009 (10)
Junio de 2009 (9)
Mayo de 2009 (10)
Abril de 2009 (9)
Marzo de 2009 (3)
Febrero de 2009 (2)
Enero de 2009 (3)
Noviembre de 2008 (2)
Octubre de 2008 (2)
Septiembre de 2008 (2)
Agosto de 2008 (5)
Julio de 2008 (5)
Junio de 2008 (1)
Mayo de 2008 (3)
Abril de 2008 (2)
Marzo de 2008 (2)
Febrero de 2008 (2)
Enero de 2008 (5)
Noviembre de 2007 (2)
Octubre de 2007 (2)






Copyright © 2007 GuilleSQL, todos los derechos reservados.