おはこんばんちは!
ゆるふわSEの「ゆるちょここ」です♪
2020年10月1日。
年度の下期の始まりという割と気持ちのいい節目な日ですが、ニュースを見ていると、
「東京証券取引所がシステム障害で終日取引停止」となったそーな・・・(´・ω・`)
原因は、
ハードウェア障害の発生と、バックアップ切り替えの不具合
で、具体的には下記のようにまとめられております!
「arrowhead」(アローヘッド)と呼ばれる株式売買システムの内部に2台あるストレージシステム「共有ディスク装置」の1号機に異常が発生したと説明する。異常の原因は装置のメモリ故障という。
通常であれば1号機に異常が発生しても2号機に自動的に切り替わる設定になっているはずだったが、何らかの理由で切り替わらなかったとしている。この結果として、arrowheadの情報配信処理や売買監視システムに異常が発生したことから、午前8時54分にネットワークを遮断し、取引を停止したとしている。
東証は2019年11月にarrowheadを刷新したばかり。現システムの稼働から1年足らずで今回の障害が発生した。メモリの故障や切り替えが動作しなかった原因については、システム開発元の富士通とともに原因を究明するとしている。
サイバー攻撃の可能性については、メモリの故障がログから明らかになっており、このメモリが外部と直接つながっていないことに加え、外部からの攻撃監視にも異常がみられないとして否定した。
再発防止に向けて東証は今後、原因が判明するまで当面の間、共有ディスク装置の動作状況や切り替えについて人的監視を強化することで対応するとしている。
東証は現時点で、2日から取引を再開するとしているが、本日中に最終決定する方針。
きっつー。。。(´・ω・`)
外の人も中の人も真っ青な事象で、午前8時54分にネットワークを遮断したことからギリギリまで粘って復旧とか、システムを停止させるかどうかとか、対外的なところをどうするかとかの判断をしてたんだと思われます。。。
ハードウェアのメモリ障害なんてあるあるですし、それに対するバックアップへの自動切換えで冗長化しておくのもあるある。
システムを構築した時に、メインに障害があった場合にバックアップに切り替わるかどうかという異常系のテストは一般的には実施していると思いますが、一度まともに本番稼働してしまえばこのようなミッションクリティカルなシステムはめったに落ちないので、異常系の処理なんて忘れ去られたり、当時の担当者がいなくなったりで、障害が発生した時に迅速に適切な対応ができないとかもあるあるなのかもしれません・・・(´・ω・`)
※今回の事象について当てはまるかどうかは分かりませんが。
その他には自動で切り替えが不可の時に備え、手動での切り替え方法を代替案として準備したりもしますが、今回はそういうのもできなかったように見えますね・・・(´・ω・`)
明日(2020年10月2日)無事に市場が開くのを願うばかりです☆彡
同じエンジニアとして、他人事とは思えず全力で応援したくなりますw
中の人も外の人も頑張れ(>_<)
とか思って、Twitterでちょいとつぶやこうとした夜の23時過ぎ、なぜかツイートできない事象が・・・(´・ω・`)
Webサービスがつながらないときに、障害なのかどうかはTwitterの検索が最速で役立ちそうなのでよく利用しているのですが、まさか、まさか。
Twitterさんのシステム障害(´・ω・`)w
なんて日だ(/・ω・)/☆彡w
ものの10分ちょいで復旧したよぉですが、Twitterの中の人もお疲れさまでした!!!w
世の中のエンジニアに最大限の労いと祝福と健康を元気玉のよぉに与えたい♪
おわり。
※Twitterでつぶやけなかったので代替案でブログ書いてみた感じですw