Bienvenidos a otro episodio de nube podcast, hoy vamos a hablar sobre un tema bastante interesante, diferenciar unas terminologías que son muy usadas, en cuando se está hablando de ese tipo de soluciones en la nube tiene que ver con lo que es Backup qué son las copias de respaldo y poder diferenciar qué es una copia de respaldo, saber qué es una réplica, saber qué es un Snapshot o una toma instantánea.
Dentro de los backup vamos a ver los 3 grupos que se pueden diferenciar o se puede clasificar, una copia de respaldo, ahora porque es importante hablar de la copias de respaldo, para que nosotros podamos tener continuidad del negocio, para que nuestra operatividad del negocio pueda fluir, pueda continuar y pueda sortear dificultades se tiene que evaluar y analizar 2 factores, uno de ellos es la disponibilidad de la información eso lo vamos a ver en otro audio.
El segundo punto qué tiene que ver es con respecto a la seguridad y que tengamos copias contingencias, que tengamos una segunda réplica, copia instancia de la información, que si nuestra fuente principal de la información no podemos acceder a ella indiferente de los motivos más adelante también se va a mirar los motivos por los cuales se puede perder información, es de que tengamos siempre disponibilidad y acceso a ella, siempre son fundamentales qué todas las decisiones que tomen indiferente del proveedor si es del país fuera del país la tecnología que sea tiene que ustedes pensar siempre qué va ir en pro de 2 cosas, 1 como me garantiza y está la accesibilidad de mi información y 2 como respalda y como usted mantiene la seguridad y la integridad de mi información.
En este caso vamos hablar puntualmente de lo que son las copias de seguridad, durante mi vida profesional me he llevado muchísimas sorpresas porque uno da por hecho de que las copias de respaldo es algo supremamente fundamental y básico en cualquier negocio y me llego a dar cuenta de que en empresas de unos tamaños ya considerables con unas facturaciones relevantes tiene unos sistemas de copias de seguridad supremamente pobres, y hasta nulos, uno pues porque ya está metido en todo este proceso, uno sabe pues los riesgos que implica, pero en muchas veces he tenido la sensación de hasta de miedo, que yo llego y digo si llegan a tener una pequeña probabilidad de dificultad de acceso con la información se les complica mucho todo lo qué están haciendo y todo es porque, por no contar con unos planes preventivos de copias de seguridad.
Como va ello vamos a empezar a mirar el primer término de lo que es un backup, vamos a decir qué es un backup ,que no es un backup, backup es un término en inglés que significa copia de seguridad, una copia tal cual su palabra lo escribe es tener una copia de algo, tener una información 2 veces y es exactamente la misma, la característica fundamental de una copia de seguridad es que esa copia se considera copia si está en otro medio diferente al medio original, eso es muy importante, una copia de seguridad es tener la misma información igual y tal cual pero en un medio diferente, me explico una copia de seguridad como tal viene hacer de qué yo copio unos archivos de un servidor A a un servidor B si en un caso dado el servidor A me falla yo tengo una copia de la información de un momento dado, de una fecha, un día, una hora, tengo una copia tal cual de cómo era la información.
En ese momento es muy importante ver el concepto de lo que es una copia de seguridad, listo, eso es el primer término y ya vamos a ahondar un poco más en ello, el segundo término es una réplica, qué es una réplica, la réplica de información uno de los conceptos y de lo que hablan en la jerga a nivel de ingenieros es de qué son, se tienen unas implicaciones a nivel raid es una tecnología, es un equipo físico, que está dentro del servidor en donde uno conecta los discos duros del servidor y es una tarjeta una placa aparte en donde es quien controla y distribuye la información en los discos, uno qué es lo que puede hacer con esas controladoras raid con ese hardware con esa parte física que está dentro de un servidor, uno le puede decir de qué si la información que se escriba en un disco duro me lo replique en la otra, eso es una replicación en modo espejo.
Existen unos 6, 7, tipos de replicaciones pero mirándolo en su concepto básico, es poder dar una redundancia a la información de que este replicada ahora qué diferencia hay entre una replicación y un backup, la replicación permite de qué se escribe la información en un disco duro y se va replicando en otro, es decir los dos discos duros tienen la misma información, qué ventajas hay de qué si el servicio de luz o algo se daño un disco duro uno tiene hasta el segundo antes de que hubiera el daño, uno tiene la información y hay una réplica de la información, pero ojo y hay que tener en cuenta de que esto, el término como habla es replicar la información pero en ese momento de se cuenta que no cumple con la política o el argumento que les doy de lo que es una copia de seguridad, es de qué tiene que estar en un medio diferente al medio original.
Qué pasa, a, si, pero es que está en otro disco duro, si está en otro disco duro entonces se puede conseguir un backup y no lo es y lastimosamente muchos ingenieros hablan y se basan de qué tener una replicación y ya sea con una tecnología raid quiere decir que eso es una copia de seguridad y no lo es porque, por qué si yo estoy escribiendo 3 archivos, 3 carpetas y las carpetas por ejemplo es una carpeta con el número 1, otra carpeta con el número 2, otra carpeta con el número 3, como yo voy guardando esa información en el disco duro eso me lo va replicando en el segundo disco duro si el primer disco duro falla yo tengo todavía la información en el segundo disco duro de la carpeta 1 de la carpeta 2 de la carpeta 3 tengo una replicación en tiempo real.
Pero qué pasa en ese caso, sirve para tenerlo como una redundancia de que si un disco duro falla en otro disco duro tengo la información, pero ojo que esto no cumple con la política de una copia de seguridad, en lo que viene siendo la copia de seguridad es de qué yo tengo copiada la información en otro medio diferente, qué pasa en el mismo ejemplo de que yo tengo los dos discos duros estoy haciendo las réplicas y tengo la carpeta1, la car 2 y la 3 si yo la carpeta 3 la borro se borra de los dos discos duros, si yo la carpeta 2 la borro y me quedo solo con la carpeta 1 se borra en los dos discos duros, es decir lo que se hace en un disco se hace en el otro entonces el va replicando la información pero así como va creando la información también va borrando según uno como va trabajando, en la aplicación o lo que uno tenga y se está manejando el arreglo.
Qué hay con ello la copia de seguridad lo que hace es de qué si tenemos la carpeta 1,2,3 en el disco duro y está replicado en el segundo disco duro eso es una replica, pero un backup es yo coger esas carpetas le doy copiar y le doy pegar por ejemplo en una usb, eso sí ya es una copia de seguridad porque, por qué es un medio diferente es un medio externo, al medio original y qué pasa si yo en ese mismo ejercicio borro la carpeta 2 y borro la carpeta 3 a nivel de replicación en los dos discos duros que tengo en réplica se va a ejecutar la misma acción es decir se borran las carpetas 2 y 3 y me quedo solo con la carpeta 1.
Pero cuando yo tengo una copia de seguridad yo sigo conservando la carpeta 1, sigo conservando la carpeta 2 y sigo conservando la carpeta 3 este es un ejercicio muy groso en el cual ustedes pueden entender la diferencia entre una copia de seguridad y una réplica.
Cuando hablamos a nivel de snapshots, o instancias o sacar una toma instantánea es cuando trabajamos ya con plataformas de virtualización, va a ver un audio un podcast, hablando exclusivamente de lo que es la tecnología de virtualización y qué es virtualizar y qué proveedores hay, qué ventajas tenemos con la virtualización pero simplemente nos vamos a ser la idea de qué tomar una instantánea o tomar un snapshot es coger en un momento dado de qué sea el día por ejemplo 4 de abril a las 4:22 de la tarde y él lo que hace es tomar una copia de como quedo toda la información en ese punto.
Qué pasa uno sigue trabajando, trabajando se sigue llenando la base de datos, se sigue haciendo facturaciones, se sigue toda esa cuestión o por un error uno lo qué puede hacer es hacer un rollback es el término y es devolverse a esa instancia en ese punto en esa fecha en esa línea del tiempo para poder uno continuar trabajando, entonces eso es lo que permite la tecnología de tener las instantáneas, o de tener la replicación, los backups pueden manejarse de diferentes formas de diferentes tecnologías para hacer copias de seguridad hay muchísimas maneras, aplicaciones gratuitas hay muchísimas, muchísima forma de hacerlo y ahoritica no hay cabida qué una empresa tenga pérdida de información, no es responsable, no es ético para mi, porque para mi la disponibilidad y el cuidado de la información es supremamente importante.
Cuando hablamos de las copias de seguridad y por lo menos hablamos de copias de seguridad de muchísima información, de muchísimas, muchísimas teras de información por ejemplo 5 terabytes supongamos que hay que hacer copias de seguridad de 5 terabytes decimos listo, por un lado vamos a decir vamos a tener una copia de esas 5 teras qué quiere decir que tengo que tener otro espacio igual de 5 teras para copiar la información desde el punto 1 al punto 2, qué pasa con ello la disponibilidad y accesibilidad de la información, démonos cuenta que uno como usuario de esta parte de tecnología de información y la parte del almacenamiento uno ve 5 terabytes pero si ya nosotros contamos con unas políticas de copias de seguridad vemos que necesitamos el doble de espacio entonces ya son 10 teras que se necesitan para poder nosotros tener nuestra información segura que en este caso serían 5 terabytes.
Pero qué pasa uno puede decir listo hagamos copia de seguridad cada 8 días no hay ningún problema, pero qué pasa cuando hay sistemas o aplicaciones o plataformas por ejemplo en banca, en cooperativas, en entidades financieras, que no se pueden dar el lujo o con los sistemas de facturación o facturación electronica, decir, a es que tenemos copias de seguridad cada 8 días son periodos supremamente largos, entonces para eso llega uno y dice bueno entonces hagamos una cosa, hagamos las copias de seguridad más seguido hagamoslas cada día perfecto maravilloso, pero qué pasa para hacer copias de seguridad de 5 teras supongamos que se demora 20 horas el servidor, la plataforma, la tecnología haciendo esa copias entonces qué quiere decir que de las 24 horas del día son 20 horas qué se demora copiando la información por el tamaño y el volumen de la información entonces deja de ser viable poder hacer copias de seguridad de tanta información en unos periodos tan cortos.
Y ahora la pregunta es no pero es qué tener copias cada 24 horas es mucho tiempo, yo necesito tener copias cada 6 horas, como las puedo hacer y entonces es cuando uno dice no es posible y en realidad es posible, como se hace entonces las copias de seguridad completas ocupan un espacio similar al espacio original por qué se está haciendo es una copia completa pero existen otras 2 formas de poder hacer copias si nos damos cuenta aquí no estamos hablando de una aplicación específico no estamos hablando de un proveedor específico, estamos hablando simplemente de unas terminologías y de unas buenas prácticas, aquí la información que les estoy brindando es como ustedes deben conceptualizar unas buenas prácticas de copias de seguridad de información de su empresa.
Listo entonces una opción es hacer copias completas, que pueden haber unas dificultades, en qué se demora haciendo uno la copia y que requiere bastante espacio para poder almacenar esa copia perfecto, hay una segunda forma en que se pueden hacer las copias, que se pueden llamar copias incrementales o copias diferenciales, es decir yo voy hacer copias cada 8 días de los 5 terabytes de información qué eso es muchísima información como puedo hacer para entonces el primer fin de semana guarde 5, listo entonces en total hay 10 teras 5 qué están como la parte de producción y las 5 que están de copia.
Para que, si pasa algo con las 5 teras de producción tengo una copia de información de máximo 8 días atrás para tener las copias de seguridad, listo ahora ese término de cuantas copias uno almacena se llaman retenciones, cuantas retenciones de copias de información tengo, cuanto soy capaz de retener información, entonces nosotros vamos a decir no vamos a armar una política de copias de seguridad en donde nosotros vamos hacer una copia completa un backup completo cada 8 días de los 5 terabytes y vamos a tener 4 copias es decir vamos a guardar del último mes una copia tengo 4 instancias de copia del primer fin de semana, del segundo, del tercero y del cuarto qué quiere decir para tener esas 4 copias de seguridad requiere tener 20 teras de espacio en disco más el espacio que está utilizando el entorno real en producción si nos damos cuenta aquí ya se nos está quintuplicando la capacidad o la necesidad de tener copias de seguridad de los discos duros.
Eso ya por un lado tiene un beneficio de que las copias son totalmente independientes una de otra pero ya trae unos costos a nivel de discos duros, de infraestructura, de hardware de poder tener toda esa cantidad de réplicas de información pero son las cosas que se tiene que poder hacer ahora cómo se puede bajar un poco esos costos, lo que se puede hacer es de que se pueda manejar las copias incrementar esos diferenciales, qué quiere decir eso, de que la primera copia va a ocupar el mismo espacio que la copia original todos los 5 teras pero la segunda copia ya no va a guardar todas las 5 teras si no lo que me va a guardar es la diferencia que hubo entre la última copia de seguridad y las modificaciones que hubo en mi plataforma, de los cambios nuevos que hubo a nivel de información.
Entonces la primera copia puede ocupar los mismos 5 terabytes pero la segunda copia puede ocupar solo por ejemplo 0.1, o ,0.2 terabytes 100G, 200G , 20G, 30G ,entonces démonos cuenta que cuando ya empezamos hacer la segunda, la tercera, la cuarta, la quinta copia ya requiere muchísimo menos espacio en el disco duro, vale por qué, porque el 98,97,96% de la información siempre va a ser la misma cuando son copias de seguridad completas lo que estoy haciendo es una redundancia, de la redundancia, de la redundancia, de tener en diferentes medios copias y copias y copias y copias.
Bien pero para reducir un poco esa parte de los costos yo lo que puedo empezar hacer son unas copias diferenciales o puedo empezar hacer unas copias incrementales, cual es la dificultad de las copias diferenciales y las copias incrementales entonces yo puedo tener la copia de primer fin de semana ya la copia del segundo fin de semana lo único que va a tomar es la diferencia entre la primera semana y la información real y la guarda, y guarda solo ese diferencial o información nuevo.
Para la tercera copia hace lo mismo entonces evalúa y dice, revisa el backup anterior la diferencia que hay con respectos a la información original y guarda esa cantidad de información que puede ser 1,2,3,4% de información nueva, entonces de pasar a tener 20,25 teras de almacenamiento perfectamente con 10,8 teras se pueden tener varias copias de seguridad, cual es el problema acá de qué siempre la copia de seguridad de la segunda semana, la copia de seguridad de la tercera semana, de la cuarta semana van a ser dependientes de la copia de seguridad número 1 por qué, por qué a partir de ahí es donde están tomando las copias.
Entonces qué pasa si por X o Y razón se corrompe el sistema de copia de la primera semana ya no va a poder servir ni la segunda ni la tercera ni la cuarta copia lo ven, entonces ahorramos en costos, en discos tenemos unas políticas de replicaciones incrementales y diferenciales pero corremos el riesgo de que si se daña la copia número 1 no pueden funcionar las restauraciones de las otras copias.
qué pasa con las copias completas son totalmente independientes si se me daña la copia de la tercera semana no hay problema tengo la copia de la primera semana, de la segunda y de la cuarta se me daño la primera semana no importa tengo las otras copias entonces esto es sentarse a hacer un sistema un balance, esto no es nada cuadriculado que así tienen que ser, las copias es algo que se evalúa y se estudia y si se dan cuenta ya hay un poco de complejidad en cómo se tiene que evaluar el sistema de copias y de réplicas de información, eso era todo lo que les quería comentar recuerden para qué cuando escojan un proveedor a nivel de tecnología o lo quieran montar en sus propios servidores ustedes tienen que evaluar 2 cosas, 1 cómo puedo garantizar la disponibilidad y el acceso a la información y cómo puedo asegurar de que mi información esté segura, en esa parte tienen mucho que ver las copias de seguridad, eso es todo y nos vemos en un próximo episodio.