Preparación para la recuperación de desastres
Una vez que haya implementado el producto VMware Cloud Disaster Recovery y el sitio protegido, comenzar a prepararse para recuperarse de posibles desastres es un proceso simple.
En esta publicación, veremos los pasos necesarios para prepararse para DR. Esto incluye implementar y configurar el SDDC, crear un plan básico de recuperación ante desastres, verificar y probar ese plan y estar un paso más cerca de estar listo para enfrentar un desastre real. Estos pasos se documentan con más detalle en el enlace de documentación del producto al final de esta publicación.
Implementar el SDDC
Hay un par de cosas a considerar al implementar el SDDC. Lo primero en lo que debe pensar es en qué tamaño debe tener y cuánto tiempo desea mantener el SDDC en servicio. Este es uno de los aspectos clave de la solución VMware Cloud Disaster Recovery, cuyo objetivo es reducir los costos operativos generales. El SDDC puede ser tan pequeño como una opción temporal de 30 días de 1 host hasta una implementación a gran escala de múltiples hosts y múltiples clústeres.
Con VMware Cloud Disaster Recovery, tiene la capacidad de aprovisionar el SDDC justo a tiempo, como preparación para una prueba o una emergencia real. Si el SDDC se implementa justo a tiempo, puede ahorrar en costos de computación en la nube cuando no se enfrenta a un desastre, pero tendrá un retraso normal de un par de horas en el tiempo de recuperación hasta que el SDDC se construya, implemente y se pueda usar. Además, tenga en cuenta que la verificación de cumplimiento del plan de DR que ocurre cada 30 minutos no podrá rastrear el sitio de recuperación ante desastres si el SDDC no existe.
También tiene la oportunidad de tener su SDDC funcionando en un modo de operación de luz piloto siempre disponible. Esta sería un pequeño entorno de 2-3 hosts de computación en la nube que siempre está disponible. Esto acelerará las operaciones de prueba y recuperación y proporcionará una línea de base en ejecución para la verificación continua del cumplimiento y evitará los riesgos de desviación operativa entre los sitios de producción y DR. La base de luz piloto puede expandir rápidamente los recursos de clúster y host de cómputo basados en la nube al nivel deseado cuando sea necesario escalar el entorno para manejar el evento de DR real.
En cualquier caso, para aprovechar los métodos de recuperación de VMware Cloud DR Live Mount y los tiempos de recuperación bajos, el SDDC debe implementarse desde el servicio VMware Cloud DR como se muestra en la figura anterior.
Configurar el SDDC
Una vez implementado el SDDC desde VMware Cloud Disaster Recovery, es importante realizar las personalizaciones locales necesarias para que coincida con las asignaciones con respecto a los planes de recuperación ante desastres ya definidos, como verá a continuación. Para verificar el cumplimiento, esto incluye grupos de recursos, carpetas, redes y etiquetas. Es posible que deba agregar otros cambios al SDDC, como firewalls, redes externas u otros cambios específicos de VMC. Si bien el SDDC también se puede administrar a través de la consola de VMC, le recomendamos que realice estos cambios a través de la interfaz de usuario de VMware Cloud Disaster Recovery siempre que sea posible, como se muestra en la siguiente figura. Si está administrando o modificando el SDDC desde la consola de VMC, consulte la documentación para conocer las cosas que no debe cambiar.
Es útil realizar un seguimiento de los cambios que realiza en el SDDC una vez implementado. Si hay alguna discrepancia o cambios de deriva operativa de un sitio a otro en las configuraciones, la verificación continua de cumplimiento los detectará y proporcionará alguna orientación en los errores en cuanto a lo que puede ser necesario corregir. Para capturar una conectividad y una configuración más complicadas del SDDC dentro del entorno VMC/AWS, existe una opción de VMware para exportar parte de la configuración de un SDDC, de modo que pueda volver a aplicarse más tarde, lo que podría ser útil para sus tareas de administración de SDDC.
Crear un plan básico de recuperación ante desastres
Ahora que tiene configurado su sitio protegido, los puntos de recuperación programados y en ejecución en Scale-out Cloud File System (SCFS), y el SDDC implementado y configurado, es hora de crear el plan de recuperación ante desastres. Vaya a la opción de planes de recuperación ante desastres en la interfaz de usuario de VMware Cloud Disaster Recovery y cree un nuevo plan. Un par de consideraciones ayudarán a construir un plan DR fácil y preciso.
Primero, si el SDDC aún no se ha implementado, aún puede comenzar a crear el plan de recuperación ante desastres y completar los detalles del mapeo más adelante. Puede ver la opción no seleccionada en la figura anterior.
En segundo lugar, los grupos de protección que elija para orquestar este plan tendrán una o más máquinas virtuales en su inventario. El plan necesitará una acción de mapeo y recuperación definida para cada VM en el plan. Una advertencia para recordar para las asignaciones de sitio a sitio es que deben ser 1: 1: no se comparten las asignaciones de recursos informáticos, carpetas o redes cuando se configuran los detalles del plan de recuperación ante desastres.
La interfaz de usuario lo ayudará a guiarlo a través de algunas de estas configuraciones de instalación con su resaltado incorporado, pero es una buena práctica tener la mayoría de las configuraciones del sitio en su lugar para los pasos de mapeo de la construcción del plan. Esto puede requerir un par de iteraciones para conectar todas las asignaciones de sitio a sitio (por ejemplo, carpetas, redes virtuales, etc.) y los pasos de acción de recuperación para todo el grupo de protección o máquinas virtuales individuales. Hemos descubierto que es más fácil mantener la coherencia operativa entre su vCenter local y el SDDC en VMC en AWS con asignaciones bien definidas para la conmutación por error de sitio a sitio.
A continuación, debe determinar la granularidad y el orden de los pasos de recuperación y capturarlos en el plan de recuperación ante desastres. Se pueden recuperar máquinas virtuales individuales, así como grupos de protección completos. El estado de encendido también se captura en el plan como parte de la documentación del libro de ejecución. Para empezar, puede ser más seguro no encender las máquinas virtuales bajo el control del plan hasta iteraciones posteriores de los detalles del plan. Si las máquinas virtuales no están encendidas, hay pocas posibilidades de que entren en conflicto con otros componentes en ejecución.
Por último, para comenzar, lo mejor es iterar sobre el plan hasta que realice la secuencia correcta de pasos, en el orden y la configuración correctos. Guarde los pasos de personalización más detallados para más adelante, una vez que se hayan resuelto y definido los conceptos básicos. Esto incluye conversiones de IP personalizadas, acciones especiales con secuencias de comandos, separación de la conmutación por error de las asignaciones de ejecución de prueba (por ejemplo, burbujas de prueba), así como cualquier sincronización especial o detalles de sincronización de usuario deseados en el plan final.
Verifique el plan DR
Las verificaciones de cumplimiento se ejecutarán automáticamente cada 30 minutos para cualquier plan activo. También puede ejecutar una verificación de cumplimiento manualmente, revisar y resolver cualquier problema a medida que desarrolla los planes o realiza cambios en los sitios protegidos o de recuperación. Si hay errores de verificación de cumplimiento, puede obtener más información del informe para corregir el plan.
Como ejemplo, suponga que olvida mapear las redes virtuales para las VM en su plan. La verificación de cumplimiento no pasará como se ve en el estado que se muestra a continuación.
Si muestra los resultados de la verificación, puede ver que falta una asignación de red virtual del sitio protegido de origen, como se ve en la figura siguiente.
Pruebe su plan
Una vez que el plan haya pasado las comprobaciones de cumplimiento, estará casi listo para ejecutar una prueba del plan de recuperación ante desastres. Antes de que se pueda ejecutar el plan, al menos un punto de recuperación de cada grupo de protección definido en el plan debe estar presente en el sistema de archivos en la nube escalable (Scale-out Cloud File System). Si la programación de la política del grupo de protección aún no se ha ejecutado o la copia protegida inicial no se ha transferido por completo a la nube, es posible que vea un error como este cuando intente ejecutar una ejecución del plan de prueba.
Puede supervisar el estado del grupo de protección en la vista Supervisar -> Protección o incluso en el área Tareas en ejecución o Tareas finalizadas recientemente del panel de la interfaz de usuario.
Al probar un plan de recuperación ante desastres, generalmente se recomienda evitar el Storage vMotion en segundo plano de las máquinas virtuales al final de la ejecución de prueba y dejarlas ejecutándose en el Live Mount del SCFS. Esto debería estar bien para la mayoría de las actividades de prueba iniciales y la migración completa del almacenamiento se puede probar más adelante, una vez que el plan básico de recuperación ante desastres esté listo. Dejar las máquinas virtuales en SCFS también reduce el tiempo del ciclo de prueba y minimiza el uso de los recursos de la nube. Esta es una de las configuraciones al iniciar la ejecución de la prueba del plan de recuperación ante desastres, como se muestra a continuación.
Supervisar e informar sobre la preparación de DR
Ahora que tienes:
- El SDDC implementado para la configuración inicial y las pruebas
- Replicado al menos el primer punto de recuperación en el sistema VMware Cloud DR
- Construyó el plan DR inicial
- Cumplimiento del plan verificado
- Correr una ejecución de prueba del plan inicial
ahora puede descargar el libro de ejecución que se crea con cada prueba o ejecución del plan real. Consulte la opción del menú Informes en la vista detallada del plan de recuperación ante desastres que le interese. Seleccione el informe de la lista y descargue el PDF para su revisión.
Ahora está listo para las operaciones de recuperación según los detalles del informe del libro de ejecución del plan de recuperación ante desastres. Utilice esto como base para un enfoque iterativo para el refinamiento del plan de recuperación ante desastres, la verificación automatizada y las pruebas frecuentes con su solución VMware Cloud Disaster Recovery.
Enlaces de recursos útiles
- VMware Cloud Disaster Recovery product website
- VMware Cloud Disaster Recovery blogs
- VMware Cloud Disaster Recovery videos
- VMware Cloud Disaster Recovery Hands-on Lab
- VMware Cloud Disaster Recovery online documentation
- VMware Ports and Protocols