Archivo de Abril de 2018 Actualmente, las Máquinas Virtuales que podemos crear en Azure tienen que utilizar discos VHD, los cuales pueden ser de tipo Unmanaged Disk (simples ficheros VHD dentro de una Storage Account, que podría ser Estándar HDD ó Premium SSD) o bien de tipo Managed Disk (en este caso, vemos el disco como un Recurso de Azure más, y nos despreocupamos de tener que crear una Storage Account, es decir, más PaaS). Si bien, la tendencia es utilizar Managed Disks, estos tienen algunos inconvenientes (por ahora) como que una vez los hemos creado, no podemos moverlos ni a otro Grupo de Recursos ni a otra Subscripción (por supuesto, de renombrarlos, ni hablamos). Una alternativa, parar la máquina virtual y clonar el disco. Spark se está posicionando como motor de referencia para procesamiento de datos a gran escala (Big Data), capaz de ejecutar programas más rápido que Hadoop, gracias a sus capacidades de procesamiento en memoria (In-Memory), de procesamiento en paralelo, y de su API para programar en Python (PySpark). Con Spark podemos programar en Java, Python, Scala y R, e incorpora librerías para datos estructurados (Spark SQL), gráficos computacionales (GraphX), Machine Learning (MLib), y Streaming (Spark Streaming). Ahora ya sólo queda, poder instalarlo en nuestras Windows con facilidad. Si bien es cierto que podemos utilizar un Service Principal para conectarnos a Azure desde PowerShell a través de una Contraseña, en algunos escenarios nos resultará más fácil y seguro conectarnos a Azure con un Service Principal y un Certificado Digital (en lugar de usar una autenticación basada en contraseña). En el presente artículo se muestra la forma de poder registrar una App en Azure AD asociada a un Certificado Digital y crear un Service Principal para la misma, de tal modo que podamos utilizarlos para conectarnos de forma no interactiva a Azure desde nuestros Scripts o desde nuestras aplicaciones, y ejecutar el código que necesitemos. |