かならずよんで ね!

みずほのシステムトラブル

工学コミュニケーションの基礎(EE04)

池田光穂

●インシデント発生

2002年04月01日「第一勧業、富士、日本興業 の3銀行のシステムを「みずほ銀行」として一本化するシステム統合で、統合の方針決 定が紆余曲折し、システム統合のスケジュール・統合作業が遅れて、予定していたシステム稼働テストの開始がずれ込み、十分な見極めができないまま開業したた め、開業初日から現金自動預入払出機(ATM)の障害が発生、さらに公共料金の自動引き落としなどの口座振替に遅延が生じるトラブルが起きた。トラブル発 生後も対応が遅れるなどで、口座振替の遅延が拡大、大混乱となり最大級の大規模システム障害に陥った」失敗知識データベース「みずほフィナンシャルグループ大規模シス テム障害」)

●原因:1)ATMが正常に稼働しなくなった原因、 2)口座振替のトラブルの原因

「みずほ銀行は、1988年に稼働した勘定系システムを旧第一勧業銀行から引き継ぎ、修整や機能の追加を繰り返しながら使い続けている」斉藤&坂下『はじめての工学倫理』134ページ。

●付加設計

 意味:「要求に応えることで、つぎつぎと設計を付け足す「付加設計」」出典

「設計をしない設計者」が良い設計者である理由とは何か

●他行の対処行動

「同様な銀行のシステム統合を控えていた三菱東京 UFJ銀行では、既存システムの継ぎ足しではなく、多くの時間、工数、費用を費やして新たなシステムを設計し、システム統合を行った。三菱東京UFJ銀行 では2つのフェーズに分けてシステム統合を実施した。まず、2006年1月から「Day1」プロジェクトを開始し、旧東京三菱銀行と旧UFJ銀行の勘定系 と市場系システムを相互接続した。続けて「Day2」プロジェクトを開始し、残された勘定系システムを統合した。これらのプロジェクトに費やした開発工数 と開発費用はDay1で3万人月、800億円、Day2で11万人月、2500億円である。多くの工数、費用、時間を費やした結果、大きなトラブルも無く システム統合を行うことができたが、その間、ATM停止、同じ銀行でありながら旧東京三菱か旧UFJの口座によって使える店舗やサービスが違うなど、利用 者にとっては不便を強いられることになった」失敗知識データベース「みずほフィナンシャルグループ大規模シス テム障害」)

●後日談:扇情的なタイトルの書物よりもアマゾンに掲載されたブックレビューが興味ふかいで すね

「一時期次期シスに携わっていた身として「横断 PT」や「天眼システム」等みずほ独自のワードがたくさん出てきて懐かしいなあと思い読み進めました。最後まで案件に携わられた方々お疲れ様でした。 ただ、みずほとして工夫した点や改善点をメインに記載している本であり、内部告発の本ではありません。淡々と改善点を洗い出しリリースされたように読めま すが、実際は困難を極めたと記憶しています。リハーサルでうまく行かず、「どうなってんだよ!」「明日の朝8時に改善策を報告しろ!」等怒号が飛び交い、 帰宅するのは日付が変わり朝になることも多々ありました。それに耐えられなくなった人がリタイアし、残った人がリタイアした人の仕事も背負うという負のス パイラル状態でした。 そういった極限状態のなかで、小さいインシデントについては事が大きくならないよう、役席に報告せず内々で解決するといったことも、、、 リリース作業中のテレビ電話でのやりとりやリリースオープン時、時報が鳴り響く中での確認作業等の描写があればより緊迫感が伝わると思います。 発売前に「ヤバい本がでる」、「闇を感じる」「最恐のホラー小説」等騒がれてた方々にとっては拍子抜けすると思います」ブックレビューより)

●JRクレジット決済障害(2020年2月10日)

「鉄道情報システムによると、トラブルはJRの特急 券や指定席券などの発売を処理する「マルス」と呼ばれるシステムのうち、クレジット決済を担うサブシステムで発生。「サブシステムを構成するサーバーに付 随するデータベースで何らかの不具合が発生した。どのような不具合だったのか、詳細は確認中。データベースサーバーの提供元は現時点で開示していない」 (鉄道情報システム広報)としている。/システム障害が発生したのは同日午前4時ごろ。券売機や駅窓口でクレジット決済ができず、各駅では現金での購入を 呼びかけていた。JR東日本によると、同社のチケット予約サービス「えきねっと」は「一部機能が使えなくなっているほか、駅での発券時にクレジットカード が必要であり利用できない」状態だった。「Suica」など各社の交通系ICカードでの入場・出場は可能だった。JR東海の「エクスプレス予約」「スマー トEX」も利用可能だった」https://xtech.nikkei.com/atcl/nxt/news/18/07053/?SS= imgview&FD=-654642772

●成功例:世界最大のシステム完全統合 遅れ、トラブルなく6000人が完遂(三菱東京UFJ銀行)

「三菱東京UFJ銀行は、2006年1月に旧東京三 菱銀行と旧UFJ銀行が合併した後、しばらく旧2行のシステムを並存させた。二つのシステムを一つにするのが「Day2」だ。世界最大とも言われたプロ ジェクトを大きなトラブルなく予算・納期どおりに完了できたポイントは、プロジェクトを始める前の綿密な計画・準備にあった。例えば、プロジェクトの途中 で直面する可能性のあるリスクを徹底的に洗い出して対策を考えてから臨んだ。最終局面ではテストに8カ月を費やす計画を立てて、切り替えやデータ移行のリ ハーサルは26回を予定した」

●システム障害  【 system failure 】

「操作ミスや機器の故障・破損、想定を超える過負荷 や利用の急増、ソフトウェアの誤り(バグ)、インターネットなどを通じた外部からの攻撃、システム内に潜入したコンピュータウイルスなどのマルウェアの活 動など、様々な原因によって発生する。/システム障害が発生すると一部の機能が喪失したり、保存されたデータが破壊あるいは消失したり、処理能力が極端に 低下したり、外部からの通信を受け付けなくなったり、利用者や管理者の操作を受け付けなくなったり、システムが完全に停止したりする。/障害発生時には代 替手段への切り替えや関係者への周知、原因究明や復旧を並行して速やかに進める必要がある。平時から代替機材の準備や非常時の対応マニュアルや行動計画の 策定、模擬的な環境による訓練などを行っておく必要がある」出典

●ボーイング737MAXのソフトウェア問題

「米ボーイングは運航停止となっている737MAX で新たに判明したソフトウエアの問題を解決するのに、最長3カ月が必要となる可能性がある。事情に詳しい関係者が(2019年6月)27日明らかにした。 米連邦航空局(FAA)のテストパイロットがシミュレーター試験で緊急対応に遅れを経験し、この不具合が分かったという。遅れを感じた理由はコンピュー ターチップがデータに圧倒されたためだとしている」ブルームバーグ:2019 年6月28日

「ボーイングが2019年12月16日(月、現地時 間)、同社の新鋭機ボーイング737MAX型機の生産を2020年1月から一時停止すると発表しました。関係当局の承認を得ることができなかったためとし ており、再開の予定は現在のところ未定とされています」乗り 物ニュース

「ボーイング737 MAX(Boeing 737 MAX、ボーイング737マックス)は、アメリカ合衆国の航空機メーカーボーイング社が製造していたボーイング737の第4世代の小型ジェット旅客機であ る。ライオン・エア610便墜落事故とエチオピア航空302便墜落事故に伴う全世界的飛行停止処分(ボーイング737 MAXにおける飛行トラブル)の影響により、2020年1月をもって生産停止[4]。」ウィキペディア)

●今日では、システムトラブルよりも「顧客情報漏 洩」のほうがより、企業の存続リスクを増大させる。

リンク(システム障害)

リンク

リンク

文献

その他の情報

Maya_Abeja

Copyleft, CC, Mitzub'ixi Quq Chi'j, 1997-2099

池田蛙  授業蛙 電脳蛙 医人蛙 子供蛙