Posted 5 октября 2021, 10:57
Published 5 октября 2021, 10:57
Modified 30 марта, 08:26
Updated 30 марта, 08:26
Вчера, по данным Downdetector, с массовыми сбоями столкнулись десятки соцсетей, мессенджеров и интернет-сервисов. В их числе Facebook, Instagram, WhatsApp, Telegram, Twitter, ВКонтакте, TikTok, Gmail, Bank of America, YouTube, Netflix, Snapchat, Tinder, Viber, Zoom, Southwest Airlines. Что произошло и может ли глобальный сбой повториться, «Росбалт» спросил экспертов.
Ведущий аналитик Российской ассоциации электронных коммуникаций (РАЭК) Карен Казарян:
«Есть такой сетевой протокол — BGP. Это один из старейших протоколов. Наряду со всей системой DNS он составляет основу функционирования Сети. Он был создан, когда Интернет был другим. Когда сетей, которые он объединял, были десятки, а не десятки тысяч. Он предполагал несколько интимные знания работы Сети как таковой. Что он делает? Когда сети физически объединяются между собой, у них на границе есть, грубо говоря, роутер, который одну сеть связывает с другой. Протокол BGP объясняет этим пограничным роутерам, что в одной сети, что в другой, и как сигнал должен пройти между ними.
Что случилось вчера с Facebook? Поскольку это гигантская компания, фактически сам себе провайдер, пограничные роутеры у нее собственные. Вчера Facebook их обновлял, и что-то пошло не так. В результате, фактически вся подсеть Facebook исчезла из Интернета. Ее пограничные роутеры перестали получать маршруты, передали другим пограничным роутерам, что этих маршрутов больше нет, и дальше по цепочке. За короткое время все основные сетки мира перестали видеть подсеть Facebook в принципе.
Сбой в работе Facebook повлек за собой непредвиденные последствия. Сервисы и приложения компаний, которые были завязаны на авторизацию через Facebook или их DNS-резолверы, тоже перестали работать. Поскольку Facebook и его CDN-сети — большой магнит трафика, в результате сбоя резко выросла нагрузка на другие сети, и не все эту нагрузку выдержали. Получается, сбой в системах Facebook срикошетил на другие компании. Через шесть часов сотрудники Facebook, как говорят, смогли физически попасть в Центры обработки данных, обновить роутеры и начать их поднимать, и постепенно все снова заработало.
Хочу напомнить, что в 2006 году Пакистан хотел заблокировать YouTube у себя в стране. Тогда в правительстве как раз решили перенастроить пограничные роутеры основных своих телеком-операторов так, чтобы они просто прекратили принимать маршруты YouTube. А получилось, что он перестал работать во всем мире, потому что пограничные роутеры начали отдавать измененный маршрут по цепочке, и сбой стал глобальным. К подобным коллапсам мирового масштаба могут привести самые непредвиденные решения и обстоятельства, и прогнозировать их довольно сложно. Важно понимать: когда кто-то начинает делать что-то не то, эффект получается неожиданным для всех участвующих сторон».
Один из ведущих российских экспертов в области открытых данных, директор АНО «Инфокультура» Иван Бегтин:
«Проблема возникла из-за того, что администраторы Facebook оказались криворукими и ошиблись в настройках подсети, которая относится к их серверам имен. Это DNS-сервера, благодаря которым, когда вы набираете facebook.com, ваш компьютер понимает, что надо обратиться именно к этому серверу, сопоставляет название домена с набором IP-адресов, за которыми он находится. Сервера, которые за это отвечают, оказались в этой подсети. Ее фактически исключили из обмена трафиком с Интернетом, и все те домены, которые были завязаны на эти DNS-сервера, Instagram, Facebook, WhatsApp и куча другой инфраструктуры, вышли из строя. Причем, это произошло в довольно короткие сроки. Проблема усугубилась тем, что из-за пандемии сократился штат инженеров, находящихся в Центрах обработки данных. В результате, специалисты Facebook не могли попасть в этот ЦОД несколько часов. У компании нашлась точка сбоя. Она сработала на 100%, и усугубилась пандемией. В итоге, восстановление работы заняло несколько часов.
Почему полетели все остальные сервисы? Facebook многие использовали как мессенджер, когда он «лег», люди стали переходить в Telegram, ВКонтакте и другие сервисы, на них одномоментно резко выросла нагрузка, и не все из них выдержали. Кроме того, огромное количество сервисов в Интернете так или иначе завязаны на серверы Facebook. Когда они не могут к ним обратиться, пользовательские устройства начинают долбиться и постоянно запрашивать информацию. Поэтому многие приложения и сайты, которые использовали авторизацию через Facebook, тоже стали сбоить. Основная причина в этом. Возможно, какие-то еще события совпали и наложились на эту историю. Возможно, проблема с подсетью оказалась более комплексной и могла затронуть что-то еще.
Мне кажется, даже если бы Facebook не работал месяц, никто кроме рекламодателей серьезно не пострадал бы, потому что слишком много альтернатив. Большинство людей держат обычно пять-шесть мессенджеров в телефоне. Так что случившееся вчера — еще не глобальная катастрофа. Но у нас есть Google, Amazon, Cloudflare, Microsoft и еще четыре-пять сервисов, кроме перечисленных, падение которых реально затронет весь мир. Всех, включая тех, кто играет в импортозамещение в российских госорганах. Если бы то же самое произошло с Google, и он оказался недоступен на несколько часов, это почувствовали бы все моментально. Аналогичное случилось бы при сбое в Microsoft. На них завязано очень много внутренней инфраструктуры большинства сервисов. Вчера, считайте, прошли интернет-учения, настоящие, а не те, что у нас устраивает Роскомнадзор. И они показали, что Facebook-зависимость не такая уж серьезная».
Контент-директор Gem4me Светлана Карачарова:
«Глобальный сбой произошел по причине того, что, как сообщалось, „записи DNS, которые сообщают системам, как найти Facebook.com или Instagram.com, были удалены из таблиц глобальной маршрутизации“. Марк Цукерберг объяснил эти проблемы техническим сбоем внутри сети Facebook, однако пока возникают вопросы, что это также могло быть внешним вмешательством. Хотя хакерскую атаку опровергли и сам Цукерберг, и американские спецслужбы. Так что вопрос открыт, что это было на самом деле, и кто это сделал. Вполне возможно, что простые обыватели правды не узнают. Очевидно одно: если такой сбой возможен, если это приводит к остановке очень многих систем и сервисов по всему миру (даже некоторые американские авиакомпании заявили о проблемах, а это уже крайне серьезно), то проблема безопасности мирового Интернета выходит на первый план. Если представить, что вдруг мировая сеть перестает работать по всему миру — это означает коллапс глобальной экономики, остановку транспорта и дальше по цепочке. Ведь все сейчас завязано на стабильно работающей сети. Если интернет вдруг пропадет, это вызовет огромные проблемы для всех — от населения и бизнеса до государственных органов и систем вооружений. Вчерашний сбой — пример уязвимости, которую нужно очень быстро устранить и не допускать в дальнейшем».
Анна Семенец