21/10/2021

Las tres letras que pararon el mundo durante 6 horas: BGP

De todos los aquí presentes, ninguno puede negar que actualmente vivimos en un mundo en el que las redes sociales, de una manera u otra, forman parte de nuestro día a día. Algunos las usamos únicamente para comunicarnos con nuestro círculo más cercano (o no tan cercano), otros para practicar nuestros mejores movimientos de baile y, algún valiente, incluso, las utiliza para intentar encontrar el amor.  

Pero, independientemente del uso que cada uno quiera darle, están ahí y permiten que estemos conectados de manera casi inmediata. Precisamente eso es lo que resume el triunfo de las redes sociales: ofrecer a los usuarios una forma de comunicación a través de espacios virtuales, sin importar en qué lugar del planeta se encuentren, y, en la gran mayoría de los casos, de manera gratuita (o eso pensamos). 

Según datos arrojados a principios de este año por Hootsuite, el número total de usuarios en redes sociales por aquel entonces era de 4.200 millones de personas, lo que supondría una representación del 53,6% sobre el total de la población mundial. Además, si comparamos estos datos con los del mismo periodo del año anterior, se aprecia un incremento del 13,2%, por lo que las cifras nos indican que esta tendencia a corto plazo seguirá creciendo al mismo ritmo o incluso a mayor velocidad de la alcanzada hasta el momento.  

Entre las redes más utilizadasFacebook tiene el pódium del mercado, seguido de las plataformas de Youtube y Whatsapp. Además, la compañía de Mark Zuckerberg también posee otras tres de las redes sociales más grandes, todas con más de mil millones de usuarios activos mensuales. Estas son: el ya mencionado WhatsApp, Facebook Messenger e Instagram. 

Gráfico

Descripción generada automáticamente
Imagen 1: Las redes sociales más populares en todo el mundo a julio de 2021, clasificadas por número de usuarios activos (en millones). Fuente: Statista. 

Pero ¿qué pasaría si un gigante como Facebook se “apaga” durante 6 horas seguidas sin previo aviso? 

Pues justo eso es lo que tuvimos que descubrir el pasado 4 de octubre. A pesar de que esta situación ya se había dado con anterioridad, generalmente había sido en periodos de tiempo más cortos y en una plataforma en concreto (no en las tres a la vez). Además, el motivo reportado en estos casos por parte de la compañía ha sido achacado, citando palabras textuales, a “problemas técnicos”, sin llegar a profundizar mucho más en el tema. En esta ocasión, sin embargo, las razones han salido a la luz.  

Para entender cuál fue la causa de esta caída a nivel mundial, debemos saber que Internet es una gran red de redes que funciona gracias al uso de grandes routers constituidos por enormes listas de posibles rutas para llevar un paquete de datos desde un punto a otro. 

Para que esto funcione, se hace uso de un protocolo, y ahí es donde entran en juego los Border Gateway Protocol o más comúnmente conocidos como BGP's. Como definición, un BGP es un protocolo que se utiliza para intercambiar información de encaminamiento de diferentes sistemas autónomos (AS) y para facilitar el intercambio de información sobre redes IP.  

Cada uno de estos sistemas autónomos, tendrá conexiones o sesiones internas (iBGP), así como sesiones externas (eBGP), por lo que se considera que, un BGP es un protocolo interdominio (entre sistemas autónomos) e intradominio (dentro del mismo sistema autónomo). 

Todo esto, se sostiene gracias a una sesión de comunicación basada en TCP (Protocolo de control de transmisión o, en inglés, Transmission Control Protocol) que permite que cada uno de los extremos de la comunicación puedan intercambiar adecuadamente la información. 

Es decir, se mantienen sesiones BGP sobre TCP para que pueda llevarse a cabo la comunicación entre los sistemas autónomos. Por otro lado, es importante tener en cuenta que, existe más de una ruta posible entre dos sistemas autónomos y que, por otro lado, es posible tener más de un router de borde (BGP) en el mismo sistema autónomo, tal y como puede observarse en la siguiente imagen: 

Diagrama

Descripción generada automáticamente con confianza baja
Imagen 2: Ejemplo de distintos sistemas autónomos (AS) con distintas redes en cada uno de ellos (N) y sus correspondientes BGP´s.  

Entre todas estas redes de Internet se encuentra Facebook (entendido como sistema autónomo (AS) o red individual), con una serie de normas internas y unificadas de enrutamiento de paquetes. La plataforma, a través del BGP anunciaba sus rutas y las hacía accesibles, sin embargo, en un momento dado, Facebook dejó de anunciar estas rutas prefijadas, en concreto aquellas que encaminaban a su dominio (DNS o Domain Name System) y ahí empezó el caos. Al dejar de anunciar el prefijo de enrutamiento de sus DNS, los servicios de resolución de DNS (aquellos que permiten navegar por Internet utilizando nombres de dominio en lugar de direcciones numéricas) no tuvieron forma de conectar a sus servidores de nombres. 

Entre las grandes consecuencias de este error podemos destacar: 

- La huida de los usuarios a otras plataformas como Twitter o Telegram, lo que demostró que, aunque parezca que el mercado de las redes sociales está monopolizado, también existen otras alternativas que dan el mismo servicio. Incluso Facebook fue el primero que hizo uso de Twitter para comunicar a sus usuarios que estaban tratando de resolver el problema.  

Imagen 3: Comunicado de Facebook a través de la plataforma de Twitter. Fuente: Twitter.  

- El hecho de que las tres grandes redes sociales (Facebook, Whatsapp e Instagram) pertenezcan a la misma compañía, hizo que todo estuviera unido y cayeran simultáneamente provocando una gran frustración entre los de millones de usuarios de sus plataformas.  

- En el mundo del marketing y la publicidad, tampoco dejó indiferente a nadie: campañas pausadas con inversiones ya realizadas y planificaciones temporales específicas. Los anunciantes dejaron de aparecer durante las seis horas que Facebook no estuvo disponible. 

- En la bolsa de valores, Facebook vio una caída de casi el 5% en el valor de sus acciones. 

- Para más inri, durante la caída de Facebook, el dominio «Facebook.com» apareció a la venta en la herramienta Domain Tools, lo que hizo pensar a gran parte de los usuarios que se trataba de un hackeo, algo que posteriormente fue desmentido por la compañía.  

- Escándalo social agravado por la previa controversia generada por unos archivos internos filtrados a la prensa de EE.UU. por una exempleada, cuyo contenido agravó más el revuelo público generado por la caída.  

La conclusión a la que se ha llegado una semana más tarde del suceso, es que el cambio “defectuoso” en la configuración de los routers que coordinan el tráfico entre los centros de datos de la compañía, según los expertos, podría atribuirse a un error humano. La teoría es que una persona interna de la compañía, borró accidentalmente la información de los servidores, lo que provocó la desaparición de los servicios de Facebook en Internet como si nunca hubiesen existido.  

A pesar de que no lo hayan confirmado de manera oficial desde la empresa, aparentemente, estos sistemas son muy fuertes, pero hasta el líder del mercado de las redes sociales puede cometer el más “mínimo” fallo y perder en un solo día alrededor de 6.000 millones de dólares.  

Lo anteriormente mencionado, es algo que se puede extrapolar a cualquier ámbito laboral, en el que un error puede generar pérdidas de miles y miles de euros, por lo que es importante que todos los miembros del equipo sean precisos en su trabajo y conscientes de que los datos y los números pueden ser infinitos, pero los errores en este tipo de entornos, por desgracia, no lo son.  

Fuentes utilizadas:

https://www.lavanguardia.com/vida/junior-report/20200702/482045667909/mundo-redes-sociales.html

https://www.statista.com/statistics/272014/global-social-networks-ranked-by-number-of-users/

https://www.xataka.com/servicios/que-protocolo-bgp-que-provoco-que-whatsapp-facebook-e-instagram-desaparecieran-internet-durante-horas

https://www.lasprovincias.es/tecnologia/internet/dominio-facebookcom-venta-20211004220139-nt.html?ref=https%3A%2F%2Fwww.lasprovincias.es%2Ftecnologia%2Finternet%2Fdominio-facebookcom-venta-20211004220139-nt.html  

https://www.elmundo.es/tecnologia/2021/10/04/615b2224fdddff5b448b4570.html

https://www.elcomercio.es/tecnologia/caida-facebook-whatsapp-instagram-fallo-humano-20211005211003-nt.html?ref=https%3A%2F%2Fwww.elcomercio.es%2Ftecnologia%2Fcaida-facebook-whatsapp-instagram-fallo-humano-20211005211003-nt.html