DRP o plan de recuperación ante desastres

Definición

La recuperación ante desastres se define, en términos generales, como la capacidad de una organización para responder y recuperarse de eventos catastróficos que afecten negativamente a sus operaciones o infraestructura. Es la base para la identificación, evaluación y mitigación de desastres y las consiguientes estrategias de recuperación.

Después de un ciberataque, los equipos necesitan contar con un plan de recuperación ante desastres para corregir los problemas de la manera más rápida y efectiva posible. Sin esto, cada minuto desperdiciado puede aumentar el coste de los daños y la capacidad de recuperación.

La ciberseguridad es un área cada vez más común, en la que la recuperación ante desastres es fundamental para manejar las amenazas. Este glosario abarca los fundamentos de la recuperación ante desastres y todo lo que hace falta saber para tener preparado un plan concreto.

¿Qué es DRP o plan de recuperación ante desastres?

Un plan de recuperación ante desastres (DRP o disaster recovery plan) es la documentación y procesos estratégicos de una organización para restaurar el acceso a los sistemas e infraestructuras comprometidos después de un ciberataque, error humano, desastre natural u otros eventos catastróficos.

Es la metodología sistemática mediante la cual un equipo asigna sus recursos para retomar eficazmente el control de sistemas clave de datos e información después de un desastre.

¿Cómo funciona un DRP?

La recuperación ante desastres tiene un doble propósito: el mantenimiento y el restablecimiento de sistemas e infraestructuras de TI claves después de una incidencia. El mantenimiento funciona mediante la adecuada replicación y respaldo de datos y activos a puntos de restauración específicos. La recuperación es un esfuerzo reactivo para recuperar funcionalidad y control sobre sistemas y datos que resultan infectados o vulnerados.

Un plan de recuperación ante desastres se puede usar para resolver situaciones tanto leves como graves. Esto puede ser, por ejemplo, problemas como software con fallos. O también pueden ser tragedias devastadoras, como una filtración de datos general o una pandemia. Lo que vuelve eficaz a los planes de recuperación ante desastres es la capacidad de anticiparse a las amenazas antes de que surjan realmente, y probar con diversos escenarios de amenazas para garantizar que el plan esté funcionando bien.

Elementos fundamentales de un plan de recuperación ante desastres

Un plan eficaz de DRP se enfoca en los activos, infraestructura y vulnerabilidades únicas de una organización. Si bien todas las organizaciones deben tener un plan ajustado específicamente a sus necesidades, diversos elementos fundamentales deben considerarse parte de cualquier plan de recuperación ante desastres.

  • Evaluación de riesgos: Los equipos deben evaluar concienzudamente todas las potenciales amenazas y debilidades en la infraestructura de TI de la organización, con especial interés en las áreas que sean más susceptibles ante ciberataques.
  • Continuidad de negocio: Determinación de los procedimientos y recursos a utilizar para mantener activas las operaciones clave del negocio en caso de desastre.
  • Archivado, respaldo y recuperación de datos: Documentación e implementación de los procesos de mantenimiento para respaldar periódicamente los datos y sistemas clave, incluyendo planes para restaurar estos activos si quedan comprometidos debido a un desastre o ataque.
  • Respuesta ante incidencias: Desarrollar un flujo de procedimientos y ejercicios que articulen claramente cómo debe responder un equipo a un ciberataque, filtración o desastre, incluyendo el cómo identificar y contener la amenazas, evaluar los daños y restaurar los sistemas afectados.
  • Comunicación: Un plan de recuperación ante desastres para corporaciones debe incluir instrucciones acerca de cómo comunicar la situación a los interesados clave en caso de ataque. Esto incluye a los empleados, clientes, proveedores, inversores afectados, y a los medios de comunicación.
  • Capacitación y formación: Crear un sistema para capacitar y formar adecuadamente a los empleados en buenas prácticas de ciberseguridad y respuesta a desastres, particularmente en ejercicios clave indicados en el plan de la organización y para qué se debe estar preparado si ocurre un desastre.
  • Pruebas y simulacros: La ejecución y práctica consistente de los planes de recuperación ante desastres son vitales para garantizar su eficacia y que su equipo pueda tener confianza en sus papeles y responsabilidades para manejar las amenazas a medida que vayan surgiendo.

Comprender los componentes de un plan de recuperación ante desastres garantiza que su equipo pueda redactar y probar un plan que se ajuste bien las necesidades y exigencias de su organización o departamento.

Pasos para crear un plan de recuperación ante desastres

Los planes de recuperación ante desastres para TI y ciberseguridad, pueden implicar diversos factores dinámicos, desde la preparación y la planificación previa hasta la asignación de talentos y recursos al ocurrir una incidencia. La combinación de los elementos clave antes mencionados, aquí presentamos algunas de las consideraciones clave a considerar al momento de crear un DRP:

  1. Convocar a su equipo: Determinar los roles y responsabilidades de todos los miembros de su equipo, así como a diversos departamentos dentro de la organización. En resumen, todos deben conocer sus responsabilidades como parte del plan de recuperación ante desastres.
  2. Desarrollo de un plan de gestión de incidencias: Esto debe ser una documentación exhaustiva de los procedimientos a utilizar para identificar y reportar amenazas y ciberataques, incluyendo procedimientos de respuesta a incidencias, investigación y recuperación.
  3. Realización de un análisis de impacto al negocio (BIA, del inglés Business Impact Analysis): Esta clase de análisis de impacto al negocio ayuda a determinar las prioridades y objetivos para la recuperación ante desastres, y se enfoca en identificar los sistemas, activos y procesos fundamentales para la organización y sus operaciones.
  4. Establecimiento de un objetivo de punto de recuperación (RPO, del inglés Recovery Point Objective): Esta métrica define la cantidad aceptable de pérdida de datos medida en función del tiempo. Después de una catástrofe o interrupción, un RPO es el punto en el tiempo o condición a la que los datos o sistemas de la organización deben recuperarse, para regresar a un estado normal y operable.
  5. Determinar un objetivo de tiempo de recuperación objetivo (RTO, del inglés Recovery Time Objective): Esta métrica determina el tiempo máximo aceptable en el cual las operaciones de una organización pueden quedar interrumpidas tras un desastre. El RTO representa el objetivo de tiempo de duración para restaurar sistemas e infraestructuras a un estado operativo.
  6. Definición y documentación del plan: Esta es la “carne” del plan, así que es ideal documentar exhaustivamente los componentes, procesos y recursos del plan de recuperación ante desastres. Algunas cosas a considerar son:
    • - Dependencias: Determinar los sistemas y procesos que son interdependientes y cómo interactúan entre sí. Esto garantiza que los esfuerzos de recuperación no causen problemas adicionales.
    • - Proveedores clave: Identificar todos los proveedores y socios clave para las operaciones de su organización. Determinar un plan para mantener la continuidad con estas partes en caso de desastre.
    • - Lugares y ubicaciones: Si las infraestructuras geográficas y físicas resultan afectadas, su plan debe indicar detalles acerca de las ubicaciones de recuperación, incluyendo alternativas principales y secundarias.
    • - Procedimientos de recuperación: Identificar y documentar los procedimientos y herramientas que se usarán para recuperar los sistemas, aplicaciones y datos comprometidos en función de los tipos específicos de ataques y amenazas de ciberseguridad.
    • - Procedimientos de comunicaciones: Determine qué tecnologías alternativas usará para comunicarse, especialmente si los sistemas de comunicaciones principales no están disponibles. Además, vale la pena tener en cuenta la estrategia de comunicación para transmitir información a clientes, socios y empleados.
    • - Protocolos de prueba: Documente los protocolos de prueba usados para evaluar la eficacia de su plan y los pasos específicos de cada protocolo. Esto también debe incluir la cadencia y ámbito de las pruebas.
  7. Probar consistentemente el plan de recuperación ante desastres: Como parte de la conformación de su equipo y contar con los procedimientos adecuados, es importante programar pruebas regularmente para garantizar que su plan maneje eficazmente todos los potenciales ciberataques, errores y desastres.
  8. Revisar y actualizar regularmente el plan: Evalúe y revise el plan de recuperación ante desastres para asegurarse de que esté actualizado respecto a las cambiantes necesidades de la organización y el dinámico entorno de las amenazas de seguridad informática en las empresas.

¿Cuáles son las responsabilidades de un equipo de recuperación ante desastres?

La eficacia de un DRP será tan buena como el equipo que la ejecuta. Dependiendo del tamaño y complejidad de la organización, ciertos profesionales pueden ser claves para un equipo de recuperación ante desastres. Algunos equipos incluyen roles altamente especializados, como ingenieros de ciberseguridad, analistas de incidencias e intrusiones, analistas de vulnerabilidad, analistas de seguridad y auditores de TI. Pero, en muchas ocasiones, el equipo es una combinación de profesionales dentro del ecosistema general de TI de la organización.

Director de seguridad de la información (CISO)

En grandes entornos corporativos con sofisticados sistemas de TI, el CISO es el responsable de la estrategia general de ciberseguridad de la organización. Ayuda a liderar los esfuerzos de recuperación ante desastres y a supervisar todos los sistemas de información y datos para protegerlos contra ciberataques.

Equipo de seguridad de TI

Con frecuencia se les considera un equipo de soporte técnico especializado bajo el mandato del CISO. El equipo de seguridad de TI monitorea y protege las redes y sistemas de la organización. Normalmente, son la primera línea de defensa para la mitigación de ciberataques y ejecución de procesos de respuesta a incidencias.

Administradores de redes

Estos profesionales pueden tener cargos más diversificados para el mantenimiento y protección de las redes, servidores y otras infraestructuras de la organización. Los administradores de redes desempeñan un papel clave en la ciberseguridad y la recuperación ante desastres para operaciones más pequeñas.

Operaciones y soporte técnico de TI

Si bien no siempre son directamente responsables de la monitorización de seguridad y la respuesta ante incidencias, estos profesionales de la TI colaboran con la operación diaria de los servidores, el almacenamiento de datos y otros sistemas de hardware de la organización. También pueden ser responsables del soporte técnico y de la resolución de problemas, lo que los vuelve parte importante de cualquier equipo de recuperación ante desastres.

Expertos en gestión de riesgos

Estos especialistas evalúan y gestionan los riesgos de la organización relacionados con ciberataques y otras amenazas de TI. Son eficaces en la predicción y simulación de potenciales ataques para identificar vulnerabilidades, y ayudan a sugerir mejoras para evitar ataques reales.

Asuntos legales y conformidad

Estos profesionales trabajan dentro de un equipo de recuperación ante desastres para garantizar que las estrategias de recuperación ante desastres y esfuerzos de recuperación de la organización cumplan con requisitos legales y normativos específicos.

Comunicaciones en situaciones de crisis, medios de comunicación y relaciones públicas.

Con frecuencia es un departamento independiente que permanece integrado con los empeños de recuperación ante desastres. El equipo de medios de comunicación y relaciones públicas de la organización transmite las novedades, hallazgos y actualizaciones a las partes interesadas clave en una incidencia.

Gerente de Plan de Continuidad de Negocio (BCP)

Este cargo en dedicación exclusiva se otorga a un profesional cualificado capaz de desarrollar, mantener e implementar el plan de continuidad de una organización ante un desastre, garantizando que las operaciones continúen según lo previsto. Los gerentes de BCP también son responsables de poner a prueba y actualizar periódicamente el plan según haga falta.

En empresas más pequeñas, una persona puede adoptar las responsabilidades de varios cargos. Sin embargo, estos cargos pueden estar altamente individualizados en organizaciones de mayor tamaño, con talento especializado asignado a responsabilidades particulares.

¿Qué son las pruebas de recuperación ante desastres?

Las pruebas de recuperación ante desastres son un componente fundamental de la continuidad de negocio de una organización y del plan de recuperación ante desastres. Conllevan la simulación de un desastre, como un ciberataque como el ransomware, una vulneración de datos, corte de corriente o desastre natural, para evaluar la capacidad de una organización para recuperar el control sobre sus sistemas de TI.

Las pruebas de recuperación ante desastres pueden ayudar a identificar cualquier debilidad o brechas en plan de una organización y garantizar que los procesos estratégicos restauren eficazmente los sistemas y datos críticos en caso de incidencia. Este tipo de pruebas se pueden implementar mediante varios métodos, incluyendo test de pasos a seguir, test funcionales, ejercicios de mesa y simulaciones de interrupción total.

Tipos de recuperación ante desastres

Los desastres tienen diversas manifestaciones y amenazan la integridad y estabilidad de muchos sistemas y activos diferentes. Algunos de los tipos más comunes de recuperación ante desastres y las iniciativas estratégicas que los respaldan son:

Recuperación ante desastres para centros de datos

Este tipo de recuperación ante desastres se enfoca en la seguridad de la infraestructura física de TI y los respaldos o copias de seguridad de datos. Las estrategias giran alrededor de usar una página de conmutación por error en una ubicación secundaria para mantener la continuidad operativa durante un desastre.

Recuperación ante desastres en la nube

Un componente clave de cualquier plan de recuperación ante desastres basado en la nube, las estrategias aquí indicadas aprovechan las soluciones basadas en la nube para replicar y alojar los servidores físicos y virtuales de una organización. Este enfoque hacia la recuperación ante desastres brinda una conmutación por error automática a la nube pública en caso de desastres, eliminando así la necesidad de una ubicación secundaria.

Recuperación ante desastres en redes

La operabilidad de redes es clave para mantener el intercambio de datos, el acceso a aplicaciones y las comunicaciones en caso de amenazas. Este componente se enfoca en contar con datos y ubicaciones de respaldo y planificar para retomar el control sobre los servicios de redes.

Recuperación ante desastres virtualizada

La recuperación ante desastres virtualizada es un conjunto de estrategias diseñadas para replicar las cargas laborales a una nube o ubicación física alternativas. Este proceso brinda a los equipos de ciberseguridad una mayor flexibilidad, eficiencia y facilidad de implementación.

La recuperación ante desastres como servicio

La DRaaS es un servicio comercial prestado por terceros subcontratados que duplican y alojan los servidores físicos y virtuales de una organización. El proveedor subcontratado asume la titularidad de implementar y gestionar la estrategia y el plan para la recuperación ante desastres más apropiado.

Recuperación ante desastres vs. continuidad de negocio

Aunque están relacionadas y entremezcladas con las operaciones de ciberseguridad de una organización, la recuperación ante desastres y la continuidad de negocio son dos cosas diferentes. La recuperación ante desastres es un conjunto de procedimientos enfocados en la recuperación del acceso a los datos y a la infraestructura de TI después de un desastre. La continuidad de negocio se enfoca en mantener en acción las operaciones de la empresa durante un desastre.

La planificación para recuperación ante desastres coordina al equipo para la restauración eficaz de los sistemas y datos después de un desastre o ataque. La planificación para continuidad de negocio se enfoca en mantener las operaciones funcionando durante la incidencia.

La meta subyacente de la recuperación ante desastres es minimizar los daños de un desastre y ayudar a la organización a regresar a su estándar de operaciones lo más rápido posible. El objetivo de la continuidad de negocio es capacitar a la organización para continuar operando internamente y brindar servicios a los clientes, proveedores y socios, incluso ante un desastre.

Gestión de incidencias vs. recuperación ante desastres

Tanto la recuperación ante desastres y la gestión de incidencias son conceptos similares, pero también tienen diferencias fundamentales. La gestión de incidencias se enfoca en responder y resolver incidencias únicas, mientras que los planes de recuperación ante desastres se enfocan en restaurar las operaciones de la organización entera.

La gestión de incidencias es un subconjunto más granular de la recuperación ante desastres que se enfoca en la respuesta inmediata a una incidencia particular para restaurar la normalidad de las operaciones de la manera más rápida posible.

Soluciones de recuperación ante desastres de Proofpoint

Como líderes en el sector de las soluciones para ciberseguridad empresarial, en Proofpoint nos especializamos en brindar recursos para protección y recuperación de datos y para la continuidad de negocio, para una amplia gama de organizaciones y sectores. Proofpoint puede ayudar a su equipo a trazar un plan de recuperación ante desastres y a procurarse una amplia gama de sistemas de apoyo para corregir cualquier pérdida de datos y restaurar sus sistemas para garantizar la continuidad de la productividad de la empresa y minimizar el tiempo de inactividad.

Más información acerca de las soluciones y posibilidades de Proofpoint.