GuilleSQL :: Microsoft SQL Server, SSIS, y más !!

Azure CosmosDB


Azure CosmosDB es la evolución de DocumentDB, una base de datos NoSQL de Clave-Valor orientada a Documentos (datos no-estructurados), que ha sido diseñada, construida, y optimizada para JSON. Es una base de datos altamente escalable, elástica, segura (cifrada por defecto), consistente y altamente disponible, con un mínimo esfuerzo de mantenimiento y de desarrollo, y con soporte para replicación geográfica entre diferentes regiones Azure. Es la base de datos Mundial, la alternativa a Amazon DynamoDB. Se ofrece en formato DBaaS (Database as a Service) dentro de Azure, en modalidad de pago por uso. Ofrece soporte nativo para JavaScript (en lugar de T-SQL), SQL, transacciones sobre documentos JSON sin esquema, y programación de Procedimientos Almacenados, Triggers, y UDFs (Funciones Definidas por el Usuario). Además soporta múltiples APIs de acceso, como SQL, MongoDB, Cassandra, Azure Table, y Gremlin (Graph), facilitando la migración a Azure de aplicaciones existentes.

Muchas aplicaciones modernas necesitan almacenar grandes cantidades de datos no-estructurados o semi-estructurados, replicados en múltiples zonas geográficas, a los que tienen que acceder posteriormente en bruto y de forma muy rápida. Además estas aplicaciones evolucionan constantemente y no pueden depender de un modelo de datos cerrado (ej: modelo relacional) que frene su ciclo de desarrollo rápido y continuo.

Las tradicionales bases de datos relacionales basadas en los conceptos ACID (atomicity, consistency, isolation and durability) y en datos estructurados (necesitamos definir un esquema rígido de tablas, campos, índices y relaciones), no resultan eficientes en estas situaciones, mientras que las bases de datos NoSQL resultan ideales (sus transacciones son rápidas y resilientes, y el desarrollo con ellas es muy rápido). Por estos motivos, las bases de datos NoSQL están siendo las elegidas por muchos equipos de desarrollo como su solución de base de datos preferida para muchos casos, al tratarse de una solución simple, rápida y escalable.

Evidentemente las bases de datos NoSQL tienen algunos inconvenientes, o quizás mejor dicho, se trabaja de una forma diferente a cómo se trabaja con las bases de datos relacionales tradicionales. Por ejemplo, en algunas bases de datos NoSQL no podemos hacer un JOIN entre dos tablas, en su lugar nuestra aplicación tendrá que realizar dos accesos, uno a cada tabla.

No obstante, hay muchas diferencias entre las diferentes bases de datos NoSQL disponibles actualmente mercado, mientras que algunas no permiten consultas complejas ni procesamiento transaccional, otras son muy completas. Por esto es importante hacer un correcto análisis antes de tomar una decisión que puede impactar en el posterior esfuerzo de desarrollo, rendimiento, mantenimiento y costes.

Dado que vamos a hablar de bases de datos orientadas a Documentos, vamos a introducir este término antes de continuar. Un Documento es una colección de campos y valores, cada uno de los cuales puede ser un simple valor escalar o bien un elemento compuesto (como listas y documentos hijos). Dichos campos están expuestos al motor de base de datos, permitiendo consultar y filtrar los datos en función de estos. Los Documentos pueden almacenarse en diferentes formatos, como XML, YAML, JSON, BSON, o incluso texto plano.

En este sentido, Microsoft liberó dentro de Azure la solución de bases de datos NoSQL denominada Azure DocumentDB, que finalmente ha evolucionado a su nueva versión, Azure CosmosDB, la base de datos Mundial. Para cosas sencillas, podemos utilizar las Tablas de las Cuentas de Almacenamiento de Azure, que ofrecen una solución NoSQL sencilla basada en un modelo de Clave-Valor.

Introducción a Azure DocumentDB

Azure DocumentDB es la base de datos NoSQL de Microsoft diseñada, construida, y optimizada para JSON (más ligero que XML ó SAML), y disponible en Azure en modalidad de pago por uso (paga sólo por el rendimiento y almacenamiento que necesitas), que posteriormente ha evolucionado a Azure CosmosDB (la actual versión). Dado que Azure CosmosDB no deja de ser la nueva versión de Azure DocumentDB, vamos primero a introducir DocumentDB, para realizar una primera toma de contacto.

Con Azure DocumentDB podemos realizar consultas utilizando SQL sobre documentos JSON jerárquicos, altamente concurrente y libre de bloqueos. Podemos programar Triggers, Procedimientos Almacenados, y Funciones (UDF) utilizando JavaScript (en lugar de T-SQL), para ejecutarse dentro de una transacción de la base de datos (al registrarse en la base de datos son pre-compilados y almacenados como byte-code listo para ejecutar). Soporta, entre otras cosas, predicados, arrays (interacciones), sub-consultas, JOINs, y transformaciones JSON. Permite referirse a los Nodos de la Jerarquía a cualquier nivel de profundidad, utilizando el formato Node1.Node2.Node3...NodeM (ej: Node2.Address.County). Además, ofrece indexación automática de documentos JSON, sin requerir esquemas explícitos o creación de índices secundarios.

Azure DocumentDB ofrece cuatro niveles de consistencia, cada uno de los cuales tiene asociado el correspondiente nivel de rendimiento. Así, podemos configurar un nivel de consistencia por defecto en nuestra Cuenta de Base de Datos a uno de los siguientes valores:

  • Strong. Es el nivel más consistente, pero no permite replicación geográfica entre diferentes regiones de Azure. Garantiza que las lecturas ven los datos más recientes de cada elemento. Cada escritura es confirmada (commit) síncronamente por la réplica primeria y la mayoría de las réplicas secundarias, o de lo contrario es abortada. Cada lectura es confirmada (ack) por la mayoría de las réplicas.
  • Bounded staleness. Es el nivel más consistente que se puede utilizar con replicación geográfica entre diferentes regiones de Azure, recomendado en estos escenarios con una disponibilidad del 99,99%  y una baja latencia. Las lecturas pueden ver datos antiguos hasta K versiones o prefijos de un elemento (ítem), o hasta un intervalo de tiempo t, en función de cómo se configure. Permite replicación geográfica con múltiples regiones de Azure.
  • Session. Es el nivel más utilizado, y el que viene por defecto, cuyo alcance es una sesión de cliente. Garantiza que una lectura de una sesión de un cliente, leerá  al menos la última versión de sus propias escrituras. Permite replicación geográfica con múltiples regiones de Azure.
  • Eventual. Es el nivel más débil. Un cliente podría obtener valores más antiguos de los que ha visto anteriormente. Casos de uso típicos serían la cuenta de Re-Tweets o Likes.

Azure DocumentDB siempre ha tenido su propio protocolo y API, que podemos utilizar para interactuar con la base de datos desde diferentes lenguajes, pero además, también permite interactuar con la base de datos utilizando la API y protocolo de MongoDB. Esto resulta de gran utilidad, tanto para poder reutilizar los conocimientos que ya tengan los equipos de desarrollo, como para facilitar la migración de MongoDB a DocumentDB con cambios mínimos en el código de las aplicaciones.

El siguiente diagrama representa el modelo de Recursos de Azure DocumentDB, donde la Cuenta de Base de Datos es el elemento raíz.

A continuación se muestran algunos ejemplos de cómo direccionar algunos de estos objetos.

  • /dbs
  • /dbs/[database id]
  • /dbs/[database id]/colls/
  • /dbs/[database id]colls/[collection id]
  • /dbs/[database id]colls/[collection id]/docs

Azure CosmosDB

Azure CosmosDB es la siguiente versión de Azure DocumentDB. Actualmente, ya no podemos encontrar a DocumentDB en el MarketPlace de Azure, estando sólo disponible CosmosDB, que es la versión actual. Es una Base de Datos diseñada para estar globalmente distribuida, con SLAs de 99,99% y 99,999%.

Azure CosmosDB es ahora una base de datos multi-modelo, en el sentido de que soporta nativamente Documentos, Clave-Valor, y Graph. Así, Azure CosmosDB, además de permitir el acceso a través de su API de SQL (Document), también permite el acceso utilizando diversas APIs como MongoDB (Document), Cassandra, Azure Table (Key-Value), y Gremlin (Graph), facilitando la reutilización de los conocimientos de los equipos de desarrollo, a la vez que se facilita la migración a Azure de las aplicaciones existentes con un esfuerzo mínimo de migración.

También introduce un modelo adicional de consistencia denominado Consistent Preffix, y muchas mejoras internas en el propio motor de base de datos.

Sin duda, Azure CosmosDB es una gran alternativa en el mundo NoSQL, especialmente frente Amazon DynamoDB, aunque también frente a otras soluciones NoSQL On-Premise como MongoDB y Cassandra.

Poco más por hoy. Como siempre, confío que la lectura resulte de interés.


[Fecha del Artículo (UTC): 10/12/2017]
[Autor: GuilleSQL]



Escribir un Comentario

Para poder escribir un comentario, debe Iniciar Sesión con un usuario.

Si no dispone de un usuario, puede Registrarse y hacerse miembro.

Si dispone de un usuario, pero no recuerda sus credenciales de acceso, puede Restablecer su Contraseña.

Miembros de
Miembros de GITCA (Global IT Community Association)

Menu de Usuario
  Iniciar Sesión
  Registrarse
  Restablecer Contraseña
  Ventajas de Registrarse

Acerca de
  Contigo desde Oct 2007
  771 usuarios registrados
  86146 pageloads/mes
  Ranking Alexa 498160

Social Networks
Sigue a Portal GuilleSQL en Linkedin !!
Sigue a Portal GuilleSQL en Twitter !!



Archivo

Mayo de 2018 (3)
Abril de 2018 (3)
Marzo de 2018 (2)
Febrero de 2018 (7)
Enero de 2018 (1)
Diciembre de 2017 (15)
Noviembre de 2017 (7)
Junio de 2017 (3)
Mayo de 2017 (1)
Marzo de 2017 (3)
Enero de 2017 (4)
Junio de 2016 (1)
Mayo de 2016 (2)
Abril de 2016 (2)
Septiembre de 2015 (2)
Agosto de 2015 (2)
Junio de 2015 (10)
Mayo de 2015 (4)
Abril de 2015 (8)
Marzo de 2015 (11)
Octubre de 2014 (3)
Septiembre de 2014 (7)
Agosto de 2014 (5)
Julio de 2014 (2)
Mayo de 2014 (4)
Abril de 2014 (4)
Marzo de 2014 (4)
Febrero de 2014 (1)
Enero de 2014 (5)
Diciembre de 2013 (8)
Noviembre de 2013 (2)
Octubre de 2013 (7)
Septiembre de 2013 (6)
Agosto de 2013 (1)
Julio de 2013 (6)
Junio de 2013 (11)
Mayo de 2013 (7)
Abril de 2013 (6)
Febrero de 2013 (5)
Enero de 2013 (7)
Diciembre de 2012 (12)
Noviembre de 2012 (13)
Octubre de 2012 (5)
Septiembre de 2012 (3)
Agosto de 2012 (6)
Julio de 2012 (4)
Junio de 2012 (1)
Mayo de 2012 (2)
Abril de 2012 (7)
Marzo de 2012 (16)
Febrero de 2012 (9)
Enero de 2012 (5)
Diciembre de 2011 (10)
Noviembre de 2011 (10)
Octubre de 2011 (4)
Septiembre de 2011 (5)
Agosto de 2011 (2)
Julio de 2011 (2)
Junio de 2011 (4)
Mayo de 2011 (2)
Abril de 2011 (6)
Marzo de 2011 (4)
Febrero de 2011 (10)
Enero de 2011 (5)
Diciembre de 2010 (6)
Noviembre de 2010 (4)
Octubre de 2010 (8)
Septiembre de 2010 (4)
Agosto de 2010 (1)
Julio de 2010 (3)
Mayo de 2010 (5)
Abril de 2010 (6)
Marzo de 2010 (8)
Febrero de 2010 (3)
Enero de 2010 (1)
Diciembre de 2009 (9)
Noviembre de 2009 (14)
Octubre de 2009 (2)
Septiembre de 2009 (8)
Agosto de 2009 (2)
Julio de 2009 (10)
Junio de 2009 (9)
Mayo de 2009 (10)
Abril de 2009 (9)
Marzo de 2009 (3)
Febrero de 2009 (2)
Enero de 2009 (3)
Noviembre de 2008 (2)
Octubre de 2008 (2)
Septiembre de 2008 (2)
Agosto de 2008 (5)
Julio de 2008 (5)
Junio de 2008 (1)
Mayo de 2008 (3)
Abril de 2008 (2)
Marzo de 2008 (2)
Febrero de 2008 (2)
Enero de 2008 (5)
Noviembre de 2007 (2)
Octubre de 2007 (2)






Esta información se proporciona "como está" sin garantías de ninguna clase, y no otorga ningún derecho.
This information is provided "AS IS" with no warranties, and confers no rights.

Copyright © 2007 GuilleSQL, todos los derechos reservados.
GuilleSQL.com y GuilleSQL.net son también parte de Portal GuilleSQL.

Visitas recibidas (Page Loads) en GuilleSQL (fuente: StatCounter):

screen resolution stats
Visitas