おはこんばんちは!
ゆるふわSEの「ゆるちょここ」です♪
2021年02月28日。
2月の月末。日曜日。うるう年(うるう年は29日まである)ではない。
こういった特殊な事情が関わっているのかどーかは謎ですし、そんな事情は消費者にとってはなーんにも関係がない事ですが、ニュースを見ていると、
「みずほ銀行が3度目のシステム障害」
を起こして、長時間ATMが利用不可。
ATMが単に使えないっていうのならまだいーものの、キャッシュカードを吸い込んで返してくれないわ、備え付けの電話は繋がらないわで踏んだり蹴ったりだったらしー(´・ω・`)。。。
大規模・(´・ω・`)
障害・・(´・ω・`)
3度目・・・(´・ω・`)
まじきっつーやん(´・ω・`)w
みずほ銀行って本障害が起こる前から、障害が良く起こっているイメージがついちゃってるのに、それを払拭しようと10年近く費やして刷新した基幹システムを一昨年に稼働させたのに、また大規模障害を起こしちゃうなんて、このイメージ回復はなーかなかに厳しいものがあるなぁと思います。。。
しかも今回はシステム障害後の人的対応もちょっと後手後手に出てる感もあって、システム面だけじゃなくて、その後のリカバリーも不十分な感が消費者に伝わっちゃってるのが痛いとこだなーって気がします。。。。。
ひとごととは思えず「が、がんばれぇ(´・ω・`)」と自分とは関係ないのになんだか胃が痛くなる思いをしているSEさんも多いかと思いますが、今回はそんな「みずほのシステム障害」について思うことを語っていきたいと思いまーす!
(´・ω・`)
・・・(´・ω・`)
あーΣ(・ω・ノ)ノ!
そーいえばみずほフィナンシャルグループの株もってるんだった・・・(´・ω・`) w
私もひとごとじゃなかったwww
「止まらないシステムはない」
とか、
「バグのないシステムはない」
ってよくエンジニア界隈で言われていたりしますが、、、
我々エンジニアは「完璧に動き続けるシステム」っていうのをもちろん可能な限り作ろうとし、設計した機能に対し、想定できうるテストパターンを網羅的に洗い出し、テストをし、NGとして出てきたバグを徹底的につぶしていく。
また、システムにもよりますが、通常の利用方法で機能的な部分がきちんと動くかどうかとは別に、多量のアクセスに耐えられるかどうか等の負荷テストであったり、通常の利用では考えられないイレギュラーケースについても、もちろん実施したりしています!
そーして、「エンジニア目線」では完璧にバグのないシステムが出来上がるというわけです!
機能面以外でも、今後のアクセス増を見越したキャパシティや拡張性の考慮とかであったり、障害発生時に異常系から正常系へと人間の手を介在することなく自動切換するよぉな冗長性のある構成にしたりと、システムのリリース後の運用面も考慮して、極力人の手がかからず、きちんと動き続けるよぉにシステムを構築したりします(´・∀・`)v
そーして、「エンジニア目線」では完璧に運用し続けられるシステムが出来上がるわけです!
が!!!
コミュニケーションツールの代表格である「Slack」も止まってじぇんじぇんコミュニケーションが取れなくなっちゃうこともありますし、、、
YoutubeやGmailに代表される「Google」だって止まってすぐTwitterのトレンドにのっちゃうこともありますし、、、
※最近よく障害起こってるイメージありますなー(´・ω・`)w
「AWS」が止まって世界中の色んなシステムが同時多発的に止まって(色んなソシャゲとかも止まる模様)阿鼻叫喚の世界になることだってありますし、、、
「Salesforce」だって止まることはありますし、、、
なんと、天下の東京証券取引所だって止まっちゃうこともあるわけです(´・ω・`)w
ここでのポイントは「エンジニア目線」で問題なくテストが通って、リリースできて、運用できてたけど止まっちゃうこともあるってことで、「超スーパーウルトラ天才エンジニア」と言えども、100%あらゆる状況において障害の出ないシステムなんて作ろうとするけど、作ることは難しいってことを意味してるよーな気がします!
「だって、にんげんだもの(´・ω・`)」
ってすっごく「みつを感」出してみましたけど、 まーそんなもんなんだと思います。
それとは別に通常利用では問題なく動くけど、途中のシステム変更時の影響で動かなくなっちゃう的なのであったり、オペレーションミスによる人災であったり(これらの原因が割かし多いイメージ)でも障害が起こっちゃうことってあるので、人間が何らかの作業をしなければいけない状況が発生する場合の障害を完全に防ぐのは難しーのかもしれません(´・ω・`)
ですが、利用者側にとっては小島よしおばりに「そんなの関係ねー♪」わけで、
システムは動いて当然。
利用したいときに、利用できて当然なわけです。
会社に通勤するときに、
「おうちのマンションの自動ドアが開く」のは当然ですし、
「駅でSuicaにチャージができる」のも当然ですし、
「そのSuicaでピッと改札がくぐれる」のも当然ですし、
「電車が時間通りに動く」のも当然ですし、
「電車の中で見るニュースアプリやゲームアプリができる」のも当然ですし、
「会社のドアがセキュリティカードでピッと開く」のも当然なわけですw
その裏でシステムがちゃーんと動いているからなせるわけで、あまりにも当たり前に利用しているだけに、それが空気レベルのインフラになっているから、ひとたびこーいったインフラが使えなくなると「大混乱」になってしまうわけですねー(´・ω・`)
で、このシステム達でも種類によって重要度があったりして、ニュース見れないとかゲームできないとかであれば、「むちゃくちゃ困って超やばい」って方は少ないでしょーが、「銀行のATMが使えない」ってなると「むーっちゃくちゃ困る人」が出てくるわけですねー。
そーいった超ウルトラちゃんと動いてないと困る(止まることが許されないシステム)っていうのを「ミッションクリティカルなシステム」とかって言ったりしますが、総じて銀行などの金融系のシステムはミッションクリティカルなシステムが多いイメージがあります!
なので金融系のシステムをやっていたエンジニアさんとお話すると、その壮絶にしんどいお仕事のお話を色々聞かせてくれて面白かったりしますw
「その話は黒歴史なのでもーしないでくれ(´・ω・`)www」
的な方もいたりするってほどですw
そんなミッションクリティカルなシステムの中でもみずほ銀行のシステムは「IT業界のサグラダファミリア」とか言われるぐらい混沌を極めるというのは業界でも有名な話だったりして、それを題材にした書籍がすっごい売れるちゃうほどだったりするよぉですが、、、
みずほのシステムは色んなベンダさんが関わりに関わりまくって、結構大変だったというお話みたいです!
ちなみにお仕事してたらみずほさんほどではないにしろ色んなベンダさんと関わって、一緒にお仕事していくことって結構あるあるで、そのあたりを実践に即した形で面白可笑しく小説で読めちゃう「なれる!SE 4 誰でもできる?プロジェクト管理」という本がためになるのでプロジェクトマネージャ(PM)さんやプロジェクトリーダ(PL)さんには結構おしゅしゅめです♪
色んなベンダさんを交えたプロジェクトを引っ張っていくためには、ちゃーんとしたプロジェクトマネジメント能力が必要ですし、
規模が大きいプロジェクトですと、コミュニケーションとかも多く発生するので、コンサル力もあった方がいーですね☆彡
じゃないと炎上しちゃいますからねー♪
また、炎上の回避策とかも知っておくとプロジェクトがうまくいく可能性は上がるかもです☆彡
まぁ何がいーたいかというと、、、
中の人これからも大変かもだけど「頑張れぇ(´・∀・`)!」
ということですw
システムは動いて当然。
だけど、その
「システムを作ってる人」と、「運用している人」が当たり前に動いている状況に感謝されることって超少ない。
なので、動いて当然なんだけど、そんな動いて当然のシステムを利用する際に少しでもほんの1ミリでもいーから中の人に「便利なシステムをありがとう」という気持ちを抱いていただいていただくと世の全エンジニアはきっと嬉しみが深くてエモいんじゃないかなぁと思います☆彡
世の中のエンジニアに最大限の労いと祝福と健康を元気玉のよぉに与えたい✧*。٩(ˊωˋ*)و✧*。
おわり。