火曜日の早朝、ウェブの大部分が約1時間にわたってダウンしました。ダウンしたサイトには明確なテーマや地理的特徴はなく、障害は世界規模で発生し、RedditからSpotify、The New York Times(そしてもちろんWIREDも)まで、あらゆるサイトが影響を受けました。実際、これらのサイトすべてに共通しているのは、コンテンツ配信ネットワーク(CDN)プロバイダーのFastlyだけです。同社の夜明け前のダウンはインターネット全体に波紋を広げました。
Fastlyという名前を聞いたことがない方もいるかもしれませんが、オンラインに接続するたびに何らかの形でFastlyと関わっているのではないでしょうか。CloudflareやAkamaiと並んで、世界最大級のCDNプロバイダーの一つです。Fastlyは火曜日に発生した世界的な障害を比較的迅速に解決しましたが、このインシデントは、インターネットインフラがいかに脆弱で相互接続性に富んでいるかを改めて思い起こさせます。特に、そのインフラの大部分が、一般の目にはほとんど触れずに運営されている少数の企業に依存している場合、なおさらです。
速達
Fastlyの問題がいかにして瞬く間にすべての人の問題になるかを理解するために、インターネットエコシステムにおけるCDNの役割について簡単に考えてみましょう。インターネットは漠然としたものだと考えがちですが(実際は「クラウド」と呼ばれています)、あなたが読む記事、ストリーミングする映画や音楽、投稿する写真など、すべては物理サーバー上に存在します。そして、そのコンテンツは主にクラウドプロバイダーによってホストされているかもしれませんが、それでも人々に迅速かつ効率的に届ける手段が必要です。
そこでCDNの出番です。世界中にサーバーを運用することで、CDNはスマートフォンとお好みのインターネット体験の距離を縮めることができます。インターネットにおける野球のリレー選手のようなものだと考えてみてください。外野手が自分でホームベースにボールを投げるのではなく、内野手に投げ、内野手がキャッチャーにボールを渡すのです。より高速で効率的です。
「ストリーミング動画であれ、eコマースサイトにアクセスした際にポップアップ表示される小さな画像であれ、コンテンツのパフォーマンスを非常に向上させます」と、ネットワーク監視会社Cisco ThousandEyesのプロダクトマーケティングディレクター、アンジェリーク・メディナ氏は述べています。「ユーザーの近くにコンテンツを提供することで、読み込み時間が大幅に短縮され、誰もがウェブサーフィンをする際に非常に優れた体験を得られるようになります。」
あなたが今読んでいるこの記事を例に挙げましょう。おそらく、この記事のコピーは、あなたの地域のどこかにある「Point of Presence(プレゼンス拠点)」と呼ばれるサーバーのキャッシュに保存されているでしょう。Fastlyのネットワークマップによると、同社は世界58都市以上にPOP(Point of Presence)を運営しており、ロサンゼルス、ロンドン、シンガポールといった人口密集地域にも複数のPOPが設置されています。また、それらの世界全体の容量は、なんと130テラビット/秒とされています。

Fastly の CDN サービスによって提供される Reddit.com****** にアクセスしようとする世界中のユーザー。
サウザンドアイズ提供それだけではありません!CDNは、コンテンツを必要とするデバイスの近くにコンテンツを保存するだけではありません。インターネット上でコンテンツを誘導する役割も担っています。「まるで巨大な道路網の交通の流れを調整するようなものです」と、マサチューセッツ大学アマースト校のコンピューターサイエンティストで、Akamaiのプリンシパルアーキテクトとして最初の大規模CDNの構築に貢献したラメシュ・シタラマン氏は言います。「インターネット上のリンクに障害が発生したり、混雑したりしても、CDNのアルゴリズムは目的地までの代替ルートを迅速に見つけます。」
CDNがダウンすると、インターネットの膨大な部分が同時にダウンしてしまう可能性があることが、これでようやく理解できたのではないでしょうか。しかし、これだけでは、火曜日の被害がなぜこれほど広範囲に及んだのか、説明しきれません。特に、これらのシステムには多くの冗長性が組み込まれているにもかかわらずです。少なくとも、そうあるべきです。
CDN統合
火曜日の大部分の間、Fastlyで何が起きたのかは不明でした。「世界中のPOPで混乱を引き起こしたサービス構成を特定し、その構成を無効化しました」と、同社の広報担当者は同日朝の声明で述べました。「当社のグローバルネットワークはオンラインに復帰しています。」
火曜日の夜遅く、同社はブログでこのインシデントの詳細を明らかにしました。根本的な原因は、実は5月12日にFastlyが広範なソフトウェア導入の一環として意図せずバグを仕込んだことに遡ります。特定の呪文を唱えることでのみ邪悪な力を発揮するルーンのように、このバグはFastlyの顧客が特定の設定を行うまでは無害でした。ところが、約1ヶ月後、ある顧客が特定の設定を行ったのです。
世界的な混乱は東部標準時午前5時47分に始まり、Fastlyは1分以内にそれを検知しました。しかし、障害の原因となったバグを引き起こした設定を特定するには、さらに少し時間がかかり、東部標準時午前6時27分までかかりました。この時点で、Fastlyネットワークの85%でエラーが発生し、南極大陸を除くすべての大陸で影響が出ていました。東部標準時午前6時36分には復旧が始まり、正午までにほぼ正常に戻りました。
Fastlyは根本的な問題を修正した後も、ユーザーが「キャッシュヒット率」(探しているコンテンツが近くのサーバーに既に保存されている場合の頻度)の低下と「オリジンロードの増加」(キャッシュにないアイテムをソースに戻すプロセス)を経験する可能性があると警告しました。つまり、キャッシュの棚はまだかなり空っぽだったのです。そして、Fastlyが根本的なバグ自体に対処したのは、グローバルで在庫が補充された後でした。そして、数時間後、東海岸では昼食時間頃にようやく「恒久的な修正」をリリースしました。
CDNは通常、このような突発的な障害にも耐えられるように設計されていることを考えると、今回の障害発生は驚くべきことです。「原則として、非常に高い冗長性が確保されています」とシタラマン氏はCDN全般について語ります。「サーバーが故障しても、他のサーバーが負荷を引き継ぐことができます。データセンター全体が故障しても、負荷を他のデータセンターに移すことができます。もしすべてが完璧に機能していたとしても、ネットワークの故障、データセンターの問題、サーバーの故障が何度も発生しても、CDNの回復力メカニズムによって、ユーザーがパフォーマンスの低下を目にすることはありません。」
シタラマン氏によると、問題が発生する場合、通常はソフトウェアのバグや構成エラーが複数のサーバーに同時に発生していることが原因だという。
それでも、CDNを採用しているサイトやサービスは通常、独自の冗長性を備えています。少なくとも、そうあるべきです。実際、今朝の対応速度を見れば、各サービスがいかに多様化しているかがうかがえます、とメディナ氏は言います。Amazonはトラフィックを他のCDNプロバイダーに転送できたため、復旧に約20分かかりました。Fastlyのみに依存していた、あるいは障害に対応するための自動化システムを導入していなかった企業は、復旧を待つしかありませんでした。
「今回の障害は単一文化の結果です」と、セキュリティ企業Netscoutの主任エンジニア、ローランド・ドビンズ氏は述べています。彼は、まさにこのような状況を避けるために、オンラインで大きな存在感を持つすべての組織は複数のCDNプロバイダーを利用するべきだと提言しています。
しかし、選択肢はますます限られてきています。クラウドがAmazon、Google、Microsoftに大きく吸収されたように、オンラインコンテンツの流れはCloudflare、Akamai、Fastlyという3つのCDNプロバイダーによって支配されています。「ごく少数のサービスプロバイダーに利用が集中しています」とメディナ氏は言います。「この3つのプロバイダーのいずれかに問題が発生した場合、通常はそれほど長くは続きませんが、インターネット全体に大きな影響を及ぼします。」
メディナ氏によると、最近このような障害が頻繁に発生し、今後も悪化の一途を辿る大きな要因はそこにあるという。野球には遮断係が必要であり、交差点には交通警官が必要だ。頼れる人が減れば減るほど、接続が途切れることが多くなり、事故も大きくなる。
このストーリーは、火曜日の障害の原因について Fastly からの追加の詳細を含めるように更新されました。
WIREDのその他の素晴らしい記事
- 📩 テクノロジー、科学などの最新情報: ニュースレターを購読しましょう!
- ボウリングボールの中心へ向かう男の驚くべき旅
- 世界最古のハダカデバネズミの長く奇妙な生涯
- 私はロボットじゃない!なのに、どうしてキャプチャは私を信じてくれないの?
- 次のエンジェル投資家に会おう。彼らは19歳だ
- 物を売ったり、寄付したり、リサイクルしたりする簡単な方法
- 👁️ 新しいデータベースで、これまでにないAIを探索しましょう
- 🎮 WIRED Games: 最新のヒントやレビューなどを入手
- 🏃🏽♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください