GuilleSQL :: Microsoft SQL Server, SSIS, y más !!

Database Mirroring en modo Alta Disponibilidad y Cluster Geográficos


Una funcionalidad bastante atractiva desde SQL Server 2005 es el Database Mirroring, mediante el cual, podemos tener una copia espejo de una base de datos en una instancia separada (por ejemplo, en otro CPD separado geográficamente), pudiendo configurarlo para que funciona de forma Síncrona (modo de Alta Disponibilidad) o Asíncrona, así como garantizar que se intercambien los roles (Principal y Espejo) automáticamente en caso de pérdida del servicio (ej: pérdida de un CPD, Síndrome del Cerebro Partido - Split Brain), gracias a una tercera instancia que actúa como árbitro (Witness). Pero ¿qué ocurre si se pierden las comunicaciones entre CPDs?

Ya hemos hablado anteriormente del Database Mirroring en SQL Server, tanto para SQL Server 2005 como para SQL Server 2008. En esta ocasión, vamos a hacer una reflexión sobre el funcionamiento de Database Mirroring en modo de Alta Disponibilidad, es decir, utilizando un árbitro (Witness), y centrándonos en el caso de una arquitectura formado por dos CPDs geográficamente separados.

El hecho de disponer de CPDs geográficamente separados, nos va a permitir utilizar un Cluster Geográfico, y sobre el mismo montar SQL Server. En este escenario, cada Disco Compartido del Cluster, no se trata de un único Disco, sino que por el contrario, se trata de dos Discos (uno en cada CPD) utilizando algún sistema de replicación síncrona o asíncrona. El hecho de conmutar un Nodo de una Cluster Geográfico, evidentemente, implica cambiar el sentido de las réplicas.

Sin entrar en mayor detalle sobre los Cluster Geográficos, podemos aventurar que se trata de una solución costosa, por los requisitos de almacenamiento que tiene. Pero además, algunos productos que utilizan SQL Server, no soportan que SQL Server se ejecute en Cluster (ej: SMS 2003, si mal no recuerdo), y otros productos no soportan que SQL Server se ejecute en un Cluster Geográfico (ej: MOSS 2007). Esto evidencia, que en ocasiones, es necesario recurrir a alternativas para dotar de Alta Disponibilidad a SQL Server, que no pasen por Microsoft Cluster. Y justo este, es uno de los escenarios, en que Database Mirroring se presenta con un buen candidato a evaluar.

Vale. Nos han convencido, y hemos montando dos máquinas con SQL Server, una en cada CPD, y hemos configurado Database Mirroring para sus bases de datos de usuario. Además, hemos configurado una instancia de SQL Server para actuar como árbitro (Witness). Aquí surge la duda ¿dónde montamos el Witness del Database Mirroring?

Lo primero, tener claro que es suficiente con una instancia SQL Express, o cualquier otra instancia de SQL Server. Pero claro, si tenemos dos CPDs geográficamente separados, el tema está en elegir el CPD que deseamos.

Aquí nos interesa hablar del concepto de Quorum en Database Mirroring. Para que las bases de datos estén levantadas y dando servicio, es necesario que se forme Quorum. Para formar Quorum, cada uno de los dos servidores SQL de cada CPD, cuenta un voto, y el Witness cuenta un tercer voto, de tal modo, que habrá Quorum si más de la mitad de los servidores están levantados. Como el máximo número de votos son 3, el servicio de base de datos se prestará sólo y cuando estén levantados y comunicándose entre sí al menos dos instancias.

Aclaro el tema del Quorum, parece que lo más razonable sea montar el Witness en el CPD en que se ejecute habitualmente el servidor Principal de Mirroring (recordemos que uno actúa como Principal y el otro como Mirror).

Llegados a este punto, una vez que hemos creado nuestro entorno y antes de pasarlo a producción, deberemos realizar nuestras pruebas para validarlo (como siempre hacemos todos, ¿verdad? ;-). Así, planificamos las siguientes pruebas:

Prueba 1: Parar el Witness y el Mirror. Sinceramente, no tiene ningún sentido, desde el punto de vista, de que es francamente complicado que ocurra. Sin embargo, didácticamente es bastante interesante. Así, realizamos la prueba, y obtenemos las siguientes conclusiones:

  • ¿Hay servicio? NO, se quedan las BBDD suspendidas, ya que no se llegar a formar Quorum (falta un voto)
  • ¿Se puede cambiar el Witness para conseguir Quorum? NO, ni se puede cambiar, ni se puede quitar. Si tuviésemos todas las máquinas levantadas, pues sí, pero a toro pasao, no hay donde rascar.
  • ¿Se puede Romper el Mirror y Re-hacerlo sin Backup/Restore? Si se puede. En las pruebas realizadas, puedes romper el Mirror (ALTER DATABASE WSS_GuilleSQL SET WITNESS OFF), y posteriormente cuando se recupere el servicio en el resto de servidores SQL, rehacer el Mirror, sin necesidad de hacer Backup y Restore.

Prueba 2: Parar el Witness y el Principal. Esta prueba es bastante interesante, ya que esta situación se podría producir si se perdiese el CPD en el que está el servidor Principal y el Witness (ej: va el CPD y arde como Roma).

  • ¿Hay servicio? NO, se quedan las BBDD suspendidas en el servidor de Mirror.
  • ¿Se la puede cambiar el Witness? NO, ni se puede cambiar, ni se puede quitar.
  • ¿Se puede Romper el Mirror y Re-hacerlo sin Backup/Restore? => NO se puede. Es posible Romper el Mirror, pero para re-hacerlo, es necesario Backup/Restore, que en función del tamaño y la velocidad de copia del entorno, pues podría ser de varias horas (ojo, que mientras se podría dar servicio).

Claro, esto a priori, puede parecer molesto, pero no, es el funcionamiento lógico y normal, pero es más, se trata del funcionamiento esperado.

Vamos a ver, si se quema el CPD, rompemos el Mirror, que nos da igual, y ya crearemos el Mirror otro día cuando tengamos máquina donde hacerlo, pero mientras, ofrecemos el servicio. ¿OK? Evidentemente, debe actuar un Administrador, ya que en el visor de sucesos del sistema no se registra ningún evento del tipo “The CPD A is like a Barbacoa”. Pues no, no se registra tal evento.

Sin embargo, si no se quema el CPD, lo lógico es que pueda haberse producido un corte en las comunicaciones entre ambos CPDs (difícil, ya que lo lógico es que estén unidos por múltiples fibras o proveedores de comunicaciones, pero no tentemos). En este caso, el funcionamiento aquí descrito, intenta evitar el Síndrome del Cerebro Partido (Split Brain), de la siguiente forma:

  • En el CPD principal, se llega a formar Quorum, por la presencia del servidor Principal y el Witness. En consecuencia, aquí se levantan las bases de datos y se ofrece el servicio.
  • En el CPD espejo, no se llega a formar Quorum.

Así, todos los servidores han conseguido ponerse de acuerdo en cómo actuar, aún sin que puedan comunicarse entre sí.

Una posibilidad, es sacar el Witness a un tercer CPD, para en el caso del apagado de un CPD, conseguir mantener el servicio. Otra posibilidad, es que el Witness sea una Instancia de SQL Server en un Cluster geográfico (no pondría la mano en el fuego de si está o no soportado, aunque imagino que sí.

Y poco más, hasta aquí llegan mis reflexiones de hoy.



Comentarios

wn21 - 06/07/2012 (UTC)
Hola buenas tardes.

Yo tengo un CPD y quiero darle alta disponibilidad en otro CPD separados geograficamente.
Entiendo que un cluster geográfico es la mejor opción si hay dinero y si es compatible (recordemos que sms2003, moss2007 no lo son)
En mi caso, que no tengo dinero, veo que existen alternativas: mirroring, trasvase de registro y duplicación transaccional. Podrías comparar trasvase y mirroring? Si no me equivoco sus principales diferencias son:
En el mirroring hay ir creando a mano los inicios de sesión y permisos en el servidor de reserva, en trasvase no hay que mantener nada a mano.
Durante una recuperación con el modelo trasvase la base de datos de backup es inacesible.
Me estoy liando creo yo.

Mil gracias.


GuilleSQL - 06/07/2012 (UTC)

En resumidas cuentas, la elección es Mirroring.

Básicamente, podemos ver el Mirroring con una "versión más moderna" del Trasvase de Registros, aunque se mantengan ambas funcionalidades en el producto, entre otros motivos, por motivos de compatibilidad hacia atrás.

En ambos casos, se trabaja a nivel de Base de Datos. Hace mucho que no toco nada de Trasvase de Registros, pero supongo que los Logins tendrás que crearlos en ambos servidores, entre otras cosas, porque en el fondo el Trasvase de Registros no es más que automatizar BACKUPS y RESTORES entre instancias.



Miembros de
Miembros de GITCA (Global IT Community Association)

Menu de Usuario
  Iniciar Sesión
  Registrarse
  Restablecer Contraseña
  Ventajas de Registrarse

Acerca de
  Contigo desde Oct 2007
  771 usuarios registrados
  86146 pageloads/mes
  Ranking Alexa 498160

Social Networks
Sigue a Portal GuilleSQL en Linkedin !!
Sigue a Portal GuilleSQL en Twitter !!



Archivo

Marzo de 2019 (1)
Octubre de 2018 (1)
Julio de 2018 (1)
Junio de 2018 (4)
Mayo de 2018 (5)
Abril de 2018 (3)
Marzo de 2018 (2)
Febrero de 2018 (7)
Enero de 2018 (1)
Diciembre de 2017 (15)
Noviembre de 2017 (7)
Junio de 2017 (3)
Mayo de 2017 (1)
Marzo de 2017 (3)
Enero de 2017 (4)
Junio de 2016 (1)
Mayo de 2016 (2)
Abril de 2016 (2)
Septiembre de 2015 (2)
Agosto de 2015 (2)
Junio de 2015 (10)
Mayo de 2015 (4)
Abril de 2015 (8)
Marzo de 2015 (11)
Octubre de 2014 (3)
Septiembre de 2014 (7)
Agosto de 2014 (5)
Julio de 2014 (2)
Mayo de 2014 (4)
Abril de 2014 (4)
Marzo de 2014 (4)
Febrero de 2014 (1)
Enero de 2014 (5)
Diciembre de 2013 (8)
Noviembre de 2013 (2)
Octubre de 2013 (7)
Septiembre de 2013 (6)
Agosto de 2013 (1)
Julio de 2013 (6)
Junio de 2013 (11)
Mayo de 2013 (7)
Abril de 2013 (6)
Febrero de 2013 (5)
Enero de 2013 (7)
Diciembre de 2012 (12)
Noviembre de 2012 (13)
Octubre de 2012 (5)
Septiembre de 2012 (3)
Agosto de 2012 (6)
Julio de 2012 (4)
Junio de 2012 (1)
Mayo de 2012 (2)
Abril de 2012 (7)
Marzo de 2012 (16)
Febrero de 2012 (9)
Enero de 2012 (5)
Diciembre de 2011 (10)
Noviembre de 2011 (10)
Octubre de 2011 (4)
Septiembre de 2011 (5)
Agosto de 2011 (2)
Julio de 2011 (2)
Junio de 2011 (4)
Mayo de 2011 (2)
Abril de 2011 (6)
Marzo de 2011 (4)
Febrero de 2011 (10)
Enero de 2011 (5)
Diciembre de 2010 (6)
Noviembre de 2010 (4)
Octubre de 2010 (8)
Septiembre de 2010 (4)
Agosto de 2010 (1)
Julio de 2010 (3)
Mayo de 2010 (5)
Abril de 2010 (6)
Marzo de 2010 (8)
Febrero de 2010 (3)
Enero de 2010 (1)
Diciembre de 2009 (9)
Noviembre de 2009 (14)
Octubre de 2009 (2)
Septiembre de 2009 (8)
Agosto de 2009 (2)
Julio de 2009 (10)
Junio de 2009 (9)
Mayo de 2009 (10)
Abril de 2009 (9)
Marzo de 2009 (3)
Febrero de 2009 (2)
Enero de 2009 (3)
Noviembre de 2008 (2)
Octubre de 2008 (2)
Septiembre de 2008 (2)
Agosto de 2008 (5)
Julio de 2008 (5)
Junio de 2008 (1)
Mayo de 2008 (3)
Abril de 2008 (2)
Marzo de 2008 (2)
Febrero de 2008 (2)
Enero de 2008 (5)
Noviembre de 2007 (2)
Octubre de 2007 (2)






Copyright © 2007 GuilleSQL, todos los derechos reservados.