ゆるふわSEの日常♪

IT業界でゆるふわSEになりたい人あーつまれ(*´▽`*)♪

Slackの大規模アクセス障害を体験してみたんだ♪〜障害対応にあたるサービスの中の人はもっと褒められてもいい件について〜

おはこんばんちは!!!

ゆるふわSEの「ゆるちょここ」です♪

 

それはそれは、ホントについ最近の「2020年5月13日(水)」の出来事。

日本の多くの会社さんの始業は大方「9:00」だろー。

そして、最近はコロナウイルスによる緊急事態宣言のおかげで、多くの会社さん(特にIT企業)は在宅での「リモートワーク」をしていることうけあいである。

そんな何の変哲もないいつもの朝、日本中の多くのエンジニアさんが、気持ちのいい朝日を浴びてのびーっ♪と起床し、歯を磨き、朝ごはんを食べ、あっついコーヒーをすすりながら、若干の寝ぼけまなこをこすりこすりし、、、

「ふぁーあー、今日もお仕事がーんばろぉ(´・ω・`)♪」

って思って、PCを起動し、メーラーを立ち上げ、いつもの如くビジネスチャットツールである「Slack」を立ち上げ・・・、

↓これがSlackさんのホームページね♪

slack.com

ん?!、たちあげー、、、、、、

あれれ?!、たちあげー、、、、、、、、、

ようとすると、こんな見覚えのない画面が表示されるのである。。。(´・ω・`)

f:id:senonichijo:20200515222905p:plain

 

f:id:senonichijo:20200515235555j:plain

 

 

 

この瞬間。

ぎゃー!!!

た、立ち上がんねーΣ(・ω・ノ)ノ!

という阿鼻叫喚の無数の「おはぎゃー」が日本中にこだましたことは想像に難くありませんw

※影響は日本だけじゃなく世界規模だったので、おやすみぎゃー(略しておやぎゃー?!w)もあったかも?!w

そんな中、私はというと、、、

一瞬のおはぎゃー(3秒くらい)を伴う動揺の後、

ほーん・・・(´_ゝ`)

謎にSlack落ちてるっぽいなー(´・ω・`)

きっと私だけじゃないよなー。ということで、

とりまメールでみんなに落ちてるっぽい旨共有しーの。

お仕事上困らないようにSlack復旧までの暫定対応を指示しーの。

Webサービス落ちてるっぽいときは、まずTwitterで確認確認っと♪

どれどれー?!(´_ゝ`)

・・・(´・ω・`)

きっつー。

あ、阿鼻叫喚の叫びだらけだな・・・(´・ω・`)w

みんなどんだけSlackに依存してんねんってくらいの叫びだらけの中、コミュニケーション手段を絶たれた孤独なエンジニアたちの悲喜こもごものつぶやきは一瞬にして日本中を席捲したわけです・・・(´・ω・`)

その勢いは障害発生からものの数分で、速攻Twitterのトレンド1位になる位のエンジニアたちの悲しみが渦巻き、Slackがどれほどお仕事のコミュニケーションツールとして使われてるのかっていう分かりみが深くてなんか勉強になりましたw

↓エルチキおいしーよね、エルチキ(´・ω・`)w

f:id:senonichijo:20200515224503p:plain

うわぁ、Slackの中の人もきっと大変なんだろーなぁ・・・(´・ω・`)

と、同じエンジニアとしては、よそのシステムが落ちたときは、なんだかひとごとのはずなのに、ひとごとじゃないかのよぉな心配をしちゃって謎にちょっぴりそわそわしてましたw

自分が担当しているシステムとかだと、こういったシステム障害のたびに、胃の痛くなるよーな思いをしながら障害対応をしていたりする(楽しんで障害対応できるすーぱーなメンタルを手に入れたいw)ので、心中まじでお察しするのですよ・・・(´・ω・`)

でかいシステムとかだと、よくテレビでニュースになってたりするのでなかなかのがくぶるです(´・ω・`)w

いやぁ、どんなシステムでも完全なる可用性を持たせた、絶対に障害の起こらないシステムの構築なんて、まーほぼほぼ無理ぽなわけで、エンジニアと障害対応っちゃーきってもきりはなせないよぉな関係性なわけですが、それはそれはなかなかもって心身共によくないよなぁとは思います(´・ω・`)w

まーでも、いうてもやっぱりよそのシステムなので、そんな心中のお察しなんてほんの1分くらいしたら、普通に通常業務をしていたわけですが、なんとこのSlackさん!

8:50分頃に障害が発生した模様ですが、ものの9:40分くらいには少しずつ復旧させ、11時26分には完全復旧を宣言した模様!!! 

japan.cnet.com

私の環境だと、9:40ごろには復旧したのでダウンタイムはおよそ40分程度。

コミュニケーションツールでの「40分」というダウンタイムが長いか、短いかっていうのは人によって感じ方は様々でしょーが、私としては既に代替案の別コミュニケーションツールにすっかり切り替えるという暫定対応を実施済でしたので、それほどのダメージはなく、割とお早い対応かなぁと思いました☆彡

Slackの中のひとすごい!!!

障害対応お疲れ様ですっ(*^^*)♪

 

ちなみに、Slackのユーザってどのくらいいるんだろー?ってちょっと気になったので調べてみたところ、、、

slackhq.com

2019年2月時点で、日間アクティブユーザ数「1000万」だそー。

「1000万」だと・・・(´・ω・`)

すごw

こりゃーおはぎゃーで埋め尽くされるはずですねw

 

ということで、完全復旧した今だからこそできる個人的に面白かった障害時のツイートを7つだけご紹介♪

な、なんて可愛い嘆きw

大丈夫!!!

みんな同じ気持ちだよ(´・ω・`)w

 

こちらは外国の方のエントリー!

「slack is dead(´・ω・`)」

さすが外国の方。直球ストレートにわかりやすいですw

 

Slackが落ちてることをSlackで連絡できない問題w

あ、Slackおちてるやん・・・(´・ω・`)

きっつー。。。

一刻も早くSlackでみんなに落ちてることを連絡しないと(`・ω・´)!!!

あ、Slackおちてるやん・・・(´・ω・`)(ぱにっくw)

の無限ループに陥ってる人もいたかもですねー(>_<)w

何事も冗長性って大事おね☆彡

他のコミュニケーションツールである

「Teams」や「Google Chat」や「Chatwork」を導入している方は、そちらで代替してるっぽいツイートもちらほらみかけました♪

 

これね!!!

失って♪

初めてわかる♪

大切さ♪

5・7・5です☆彡

 

ぐぬぬ・・・(>_<)

これはエンジニアの胃がいたくなるつぶやき(´・ω・`)w

 

学生だったらなー(´_ゝ`)遠い目w

 

おぉ、なんてすばらしい励ましついーと!!!

私もおんなじ気持ちですた(´_ゝ`)w

 

【せっかくなので503エラーを学ぼう♪】 

はい、ここまで読んでくれた皆さんは、中の人の大変さはなんとなくわかったものの学びはゼロw(´・ω・`)

それはちょっと申し訳ないので、今回出た503エラーについて一緒に学んでみましょー☆彡

みんな大好きWikipedia先生によるとぉ・・・

HTTP 503、またはエラーメッセージ Service Unavailable(「サービス利用不可」「サービスが利用できません」の意)は、HTTPステータスコードの一つ。

一時的にサーバーにアクセスできないことを示す。

ほほー(´・ω・`)

 

HTTPによる通信の際、クライアント(ブラウザー)からのアクセス要求に対するサーバー側からの返答コード(HTTPステータスコード)の一つ。

初めの5がサーバー内部のエラーであることを示している。

同様にサーバーエラーが関連して表示されるエラーコードである500 Internal Server Errorとは違い、このコードは一時的にサーバにアクセスできずサービスが利用不可能になっていることを示している。

このコードが表示される要因としては、

・当該ウェブサイトに瞬間的に多数のアクセスがなされ、サーバーが処理不能に陥った。
・サーバーがメンテナンス中などで機能していなかった。
・サーバ内の最大データ転送量を超過した。
・同一サーバ内の他のサイトへのアクセスの集中。

などが挙げられる。

一度このエラーが発生してしまうと、サーバのトラブルが解消されない限り復旧しない。

対処法としてはウェブサーバー側の高性能化、キャッシュを利用したデータの転送量および転送速度の向上などがある。

「一度このエラーが発生してしまうと、サーバのトラブルが解消されない限り復旧しない。」

ほほーん(´_ゝ`)

これを見る限り、原因はおおよそ「アクセス集中による過負荷」ってとこかー(´・ω・`) 

そして、利用者としては、これに遭遇したら中の人を応援しつつTwitterを見ながら待つしかないってことね(´・ω・`)w

わっかりやすーいwww

 

【今回の教訓はー?!(´・ω・`)】

なにごとも冗長化とか代替策を用意するって大事だよね♪

に、決まりですっ(/・ω・)/☆彡w

みなさんも、どーかお気を付けあれ(*^^*)

 

でゎでゎ☆彡