GuilleSQL :: Microsoft SQL Server, SSIS, y más !!

SQL Server FAQ: ¿Cómo organizar los Ficheros y Grupos de Ficheros en SQL Server?

Volver a: [SQL Server FAQ :: Preguntas y Respuestas Frecuentes de SQL Server :: Manual SQL Server]


Este capítulo explica las diferencias existentes en SQL Server entre ficheros de datos, ficheros de LOG y grupos de ficheros. Se explica los conceptos de grupo de ficheros por defecto, algunas recomendaciones sobre el número de ficheros y de grupos de ficheros a utilizar (ej: en función del número de CPUs - afinidad de CPU), recomendaciones sobre los niveles RAID a utilizar (¿RAID1 ó RAID5?), etc

Esta es una pregunta que habitualmente no se le dá importancia, principalmente, porque al trabajar con pequeñas bases de datos, no resulta relevante: es suficiente con un Fichero de LOG y un Grupo de Ficheros con un único Fichero de Datos, y tanto el Fichero de LOG con el de Datos configurados para poder crecer automáticamente. De hecho, es suficiente crear los ficheros por defecto, con su tamaño mínimo. Realmente ¿Para qué complicarse más la existencia?

Antes de continuar, es importante aclarar varios conceptos relacionados con el Almacenamiento en SQL Server:

  • Un Grupo de Ficheros es el elemento sobre el cuál se crean las tablas e índices. Siempre existe un Grupo de Fichero por defecto, de tal modo que si al crear una tabla o un índice no especificamos de forma explícita el Grupo de Ficheros deseado, se utilizará el Grupo de Ficheros por Defecto. El concepto de Grupo de Ficheros sólo aplica a los Ficheros de Datos: los Ficheros de LOG no son susceptibles de pertenecer a ningún Grupo de Ficheros.
  • Un Grupo de Ficheros puede estar formado por ninguno, uno o varios ficheros, siendo recomendable que exista un fichero por cada CPU asignada a SQL Server, con el fin de poder paralelizar la actividad de Entrada/Salida. Además, SQL Server utilizan un algoritmo tal que al insertar filas sobre una tabla ubicada sobre un Grupo de Ficheros con múltiples Ficheros, las filas se van repartiendo entre los distintos Ficheros proporcionalmente al espacio libre existente en cada uno de estos. Por ello, es importante que todos los ficheros del Grupo de Ficheros tengan el mismo tamaño, y cuando se aumente el tamaño, se aumente en la misma cantidad y a todos los Ficheros a la vez. Razón, para establecer el crecimiento manual y no automático de los Ficheros!!
  • Tradicionalmente era recomendable utilizar distintos Grupos de Ficheros, con el fin de separar Datos de Indices, o incluso de separar distintos Datos. En la actualidad, este esfuerzo no aporta apenas beneficio, dado que en los actuales entornos de producción se utilizan redes de almacenamiento SAN. En entornos de alto rendimiento, se estudia más la optimización de la red de almacenamiento SAN, tanto de los switches de Fibra (habitualmente compartidos también para acceder a los robots de los BACKUPs) como de la cabina de Almacenamiento (poblarla con discos rápidos, en niveles RAID apropiados).
  • En lo relacionado a los niveles RAID, se puede hablar cantidad... en general, la mejor recomendación a seguir es la de RAID1 (espejo)... insisto, en general. Existen teorías estadísticas que indican que el 90% del acceso a nuestra base de datos es de lectura y el 10% restante es escritura, pretendiendo demostrar de este modo que la utilización de niveles RAID5 no tiene gran impacto y ofrece en contrapartida un ahorro considerable en costes de almacenamiento. También, tenemos a quienes defienden el nivel RAID10... vamos, que para gustos hay colores.

Volviendo a nuestro tema, cuando empezamos a trabajar con bases de datos medianas o grandes, la organización de los Ficheros y Grupos de Ficheros empieza a ser un factor crítico de éxito. Así, debemos considerar varios detalles: ¿Cuántos Grupos de Ficheros? ¿Cuántos Ficheros? ¿Qué tamaño elegir para los Ficheros?

  • Número de Grupos de Ficheros. En general utilizar un único Grupo de Ficheros. Si excepcionalmente queremos utilizar Grupos de Ficheros adicionales para almacenar datos temporales, cargas de datos, etc..., puede ser interesante para limitar la fragmentación. Del mismo modo, podríamos utilizar Grupos de Ficheros adicionales para almacenar la información histórica, etc. En cualquier caso, sería necesario hacer un estudio particular en cada caso, y si no es necesario, lo mejor no complicarse: Un único Grupo de Ficheros.
  • Número de Ficheros de Datos. Un Fichero de Datos por cada CPU.
  • Tamaño de los Ficheros de Datos. Crear los Ficheros de Datos con tamaño suficiente. El tiempo empleado en crear un Fichero o en aumentar su tamaño, es vital. Por ejemplo, crear un Fichero de 200GB (o aunmentar en 200GB un Fichero existente) nos puede costar 30 minutos en un servidor moderno. Si creamos los Ficheros ya con su tamaño, evitaremos "trasladar" este coste de reserva de espacio a aquellos momentos en que nuestra base de datos tenga actividad real de usuarios, y con esto, optimizaremos el funcionamiento. Es importante al decidir el tamaño de nuestros Ficheros de Datos, tener en cuenta el tamaño de datos, de índices, de BLOBs, un espacio adicional de maniobra (ej: para reindexaciones, etc.), y contemplar el crecimiento previsto para los próximos meses o años. También es interesante preveer el espacio ocupado por tablas y objetos del sistema en algunos casos, como por ejemplo, cuando trabajamos con la Replicación, etc.
  • Número de Ficheros de LOG. Un único Fichero de LOG, principalmente porque por muchos que tengamos, se trataran con una única estructura circular y secuencial.
  • Tamaño del Fichero de LOG. Crear los ficheros de LOG con tamaño suficiente. Esto depende del Modo de Recuperación o Modo de Registro de la base de datos (que puede ser Completo, de Registro Masivo, o Simple), de la periodicidad de copias de seguridad (Backups) de LOG (en el caso de los Modos de Recuperación Completo y de Registro Masivo), y de la naturaleza de la actividad de nuestra base de datos (una única transacción larga puede necesitar un gran espacio de LOG).

Por poner un ejemplo, la recomendación de SAP sobre SQL Server 2005 es utilizar un único Grupo de Ficheros con múltiples Ficheros de Datos (uno por cada CPU), creando los ficheros con un tamaño inicial suficiente, sin activar el crecimiento automático de los ficheros. Cuando sea necesario aumentar de tamaño los Ficheros de Datos, aumentarlos de tamaño todos a la vez. Por tomar una idea, actualmente SAP utiliza unas 45.000 tablas y unos 500.000 procedimientos almacenados. Si queremos dejar "colgado" un rato el SQL Server Management Studio, es suficiente con pedirle que nos despliege la lista de procedimientos almacenados de una base de datos de SAP... jeje ;-)

Por cierto.... y recordar que si nos pasamos al estimar el tamaño de nuestros Ficheros, y deseamos reducir su tamaño, no será posible hacerlo mediante DBCC SHRINKDATABASE y será necesario hacerlo con DBCC SHRINKFILE.

Volver a: [SQL Server FAQ :: Preguntas y Respuestas Frecuentes de SQL Server :: Manual SQL Server]




Miembros de
Miembros de GITCA (Global IT Community Association)

Menu de Usuario
  Iniciar Sesión
  Registrarse
  Restablecer Contraseña
  Ventajas de Registrarse

Acerca de
  Contigo desde Oct 2007
  771 usuarios registrados
  86146 pageloads/mes
  Ranking Alexa 498160

Social Networks
Sigue a Portal GuilleSQL en Linkedin !!
Sigue a Portal GuilleSQL en Twitter !!



Archivo

Marzo de 2019 (1)
Octubre de 2018 (1)
Julio de 2018 (1)
Junio de 2018 (4)
Mayo de 2018 (5)
Abril de 2018 (3)
Marzo de 2018 (2)
Febrero de 2018 (7)
Enero de 2018 (1)
Diciembre de 2017 (15)
Noviembre de 2017 (7)
Junio de 2017 (3)
Mayo de 2017 (1)
Marzo de 2017 (3)
Enero de 2017 (4)
Junio de 2016 (1)
Mayo de 2016 (2)
Abril de 2016 (2)
Septiembre de 2015 (2)
Agosto de 2015 (2)
Junio de 2015 (10)
Mayo de 2015 (4)
Abril de 2015 (8)
Marzo de 2015 (11)
Octubre de 2014 (3)
Septiembre de 2014 (7)
Agosto de 2014 (5)
Julio de 2014 (2)
Mayo de 2014 (4)
Abril de 2014 (4)
Marzo de 2014 (4)
Febrero de 2014 (1)
Enero de 2014 (5)
Diciembre de 2013 (8)
Noviembre de 2013 (2)
Octubre de 2013 (7)
Septiembre de 2013 (6)
Agosto de 2013 (1)
Julio de 2013 (6)
Junio de 2013 (11)
Mayo de 2013 (7)
Abril de 2013 (6)
Febrero de 2013 (5)
Enero de 2013 (7)
Diciembre de 2012 (12)
Noviembre de 2012 (13)
Octubre de 2012 (5)
Septiembre de 2012 (3)
Agosto de 2012 (6)
Julio de 2012 (4)
Junio de 2012 (1)
Mayo de 2012 (2)
Abril de 2012 (7)
Marzo de 2012 (16)
Febrero de 2012 (9)
Enero de 2012 (5)
Diciembre de 2011 (10)
Noviembre de 2011 (10)
Octubre de 2011 (4)
Septiembre de 2011 (5)
Agosto de 2011 (2)
Julio de 2011 (2)
Junio de 2011 (4)
Mayo de 2011 (2)
Abril de 2011 (6)
Marzo de 2011 (4)
Febrero de 2011 (10)
Enero de 2011 (5)
Diciembre de 2010 (6)
Noviembre de 2010 (4)
Octubre de 2010 (8)
Septiembre de 2010 (4)
Agosto de 2010 (1)
Julio de 2010 (3)
Mayo de 2010 (5)
Abril de 2010 (6)
Marzo de 2010 (8)
Febrero de 2010 (3)
Enero de 2010 (1)
Diciembre de 2009 (9)
Noviembre de 2009 (14)
Octubre de 2009 (2)
Septiembre de 2009 (8)
Agosto de 2009 (2)
Julio de 2009 (10)
Junio de 2009 (9)
Mayo de 2009 (10)
Abril de 2009 (9)
Marzo de 2009 (3)
Febrero de 2009 (2)
Enero de 2009 (3)
Noviembre de 2008 (2)
Octubre de 2008 (2)
Septiembre de 2008 (2)
Agosto de 2008 (5)
Julio de 2008 (5)
Junio de 2008 (1)
Mayo de 2008 (3)
Abril de 2008 (2)
Marzo de 2008 (2)
Febrero de 2008 (2)
Enero de 2008 (5)
Noviembre de 2007 (2)
Octubre de 2007 (2)






Copyright © 2007 GuilleSQL, todos los derechos reservados.