インシデントマネージメントについての覚書エントリ - Modern System Administration By Jennifer Davis

learning.oreilly.com

12 Managing Incidents の章で オンコール対応とインシデント管理についてページが割かれていた

12. Managing Incidents

インシデント管理の目的を The aim of incident management is to minimize the damage, costs, and recovery time. と唱えてから

  • インシデントの定義は組織によって異なる
  • Blameless な組織文化
  • 役割と責任の分担
  • コミュニケーションの確立
  • インシデント後のふりかえり ( postmortem, after action review ... )

... あたりをさらっと触れている内容だ。よく見かける感じのサブテーマ・構成で書かれている。SRE 本や PagerDuty のドキュメントあたりを読んだことがある人なら、目新しい記述はさほど多くはないだろう。


可観測性とか IaC とか デファクトになった感のあるテーマも抑えてあって、「なるほど これがモダンか」と、さらっと読み流すのによいボリュームの書籍

toruby 175th に参加しました - セコンさん おいで那須

juen29 さんと連れ立って、セコンさん ( @hotchpotch ) さんが初参加の回でした。おいで 🍆 〜

toruby.connpass.com

私はチャリで駆けつけました。CDK。

勉強会の内容

セコンさんの Python トークが主題。

Python の言語仕様の話 (Ruby と比較して言語のパラダイムを比較する ) から、型ヒントの話、機械学習の話までだーっとお話を聞かせてもらう回だった。内容がすごい密度なんだけど、用語や論旨が的確でわかりやすいの、さすがセコンさん節って感じで、懐かしい気分にもひたれた。

聞いてるみなさんからも「△△はどうなの?」「〇〇だと思ってた〜」と質問も多くていい雰囲気だった。

ご飯

会が終わった後に、よねざわさん, セコンさん、june29さんと フライングガーデンで肉

↓ に載ってる系列店。

r.gnavi.co.jp

いまいまは 会食もできる状況なので、よかったよかった。

この辺だと自転車のお店はどこなんだ? とか、みんな どこで知り合いになったのだ? とか、観光にくる人の那須塩原と住んでる人の那須塩原のイメージの食い違いだとか ... そんな話をした。

CloudNative Days Tokyo 2021 「インシデントレスポンスを自動化で支援する - Slack Bot で人機一体なセキュリティ対策を実現する」の発表を終えた - アーカイブ動画の宣伝とふりかえり

技術のエントリです


2021年11月4,5 日の日程で CloudNative Days Tokyo 2021 がオンライン開催されました。

event.cloudnativedays.jp

私は GMOペパボの事例をひっさげて インシデントレスポンスを自動化で支援する - Slack Bot で人機一体なセキュリティ対策を実現する というタイトルでの発表でした。このエントリで、資料をまとめておきます。

アーカイブ動画

こちらで公開されています

event.cloudnativedays.jp

スライド

speakerdeck.com

PDF

PDF もダウンロードできます。

github.com

スライド内で引用している書籍やブログのリンクを開きたい場合は、PDF でご覧になるとよいでしょう

感想

twitterはてなブックマークでも いろいろなコメントをいただいており、発表して確かに手応えがあった感じです

b.hatena.ne.jp

f:id:hiboma:20211110115056p:plain


そもそもの話として、障害やセキュリティインシデントは未然に防ぐの好ましく、何も起きないようにする、あるいは、何かがおきてもシステムに問題がないよう信頼性を高めていくのが大前提でしょう。

しかしながら、現実にはちょっとした綻びでもって可用性・信頼性・完全性が失われてしまい 「インシデント」を引き起こします。平時とは違う緊急のプレッシャーに晒されて対応する人々を支援・組織化するインシデントマネジメント ( 組織の力 + エンジニアリングでの支援 ) を整えておくことで、高いレジリエンスを獲得できるでしょう。

障害対応やセキュリティインシデント(の疑いがある事象) についての対応などは 公開するのが難しいところもあるでしょうが、知見や取り組みをオープンにディスカッションできればと思っています。

謝辞

CNDT 運営のみなさま ありがとうございました!

那須烏山 🚴‍♂️ Khruangbin - So We Won't Forget のロケ地巡り

趣味の自転車の話です。


10/31 (日曜) 那須烏山まで出向いた記録

f:id:hiboma:20211105113439p:plain

Khruangbin - So We Won't Forget のプロモーションビデオの撮影地が那須烏山なのだ。わかる範囲でロケ場所を巡ってきた

www.shimotsuke.co.jp


www.youtube.com

走行距離 100km 獲得標高 750m

続きを読む

Infra Study 2nd #6 で 「インフラ技術者とキャリアドリフト」の発表をしたので まとめとふりかえり

こちらのイベントにオンライン登壇しました

forkwell.connpass.com

当日のスライド

speakerdeck.com

フォントがしゃばしゃばしているのが気になる方は、PDF も用意していますのでこちらをご覧ください

github.com

発表の構成について

私個人のキャリアの話を混ぜつつ、キャリア・メンタリングの理論・概念も引用して一般化・抽象化を試みて、聞いている方にもキャリアを内省してもらえるような構成で考えていました。

twitter の #infrastudy ハッシュタグの反応を読んだ限りでは、いろいろな感想や考えが飛び交っていて、私の意図・狙いが伝わったような感触も確かに得ました。 ただただ、自分語りになってしまうのは避けたいなと思ったので よかったよかった。


f:id:hiboma:20211102115022p:plain

f:id:hiboma:20211102114938p:plain

f:id:hiboma:20211102114956p:plain

事後、発表を読み返してみると もうちょい概念の整頓や一般化・抽象化を交えて話せるところもあったなと思ったので どっかでアップデートかけたい


登壇のオファーを受けたものの kazuho さんと yoku さんに挟まれて何を話すか ... と迷いに迷って捻り出した構成でもあったのでした。

kazuho さん、yoku さんはテクニカルな話に集中した内容でしたが、それはそれで、端々から「キャリアのすごさ」みえるトークでしたよね。技術ネタ一本で、キャリアを暗に語れるようなところを目指したいもんだと思った。


しかしながら、この手の発表は短期間に何度も繰り返しやるもんでもなさそうで、数年単位でのあれやこれやの蓄積を どばーっと解き放つような感覚じゃないと なかなか話せないなぁ。キャリアドリフトの話でいえば「節目」にあたるタイミングだろう。

謝辞

登壇を推薦してくれた pyama86 さん ありがとう! あと結婚おめでとう!

オファーを受け入れて登壇までをフォローしてくれた Forkwell 重本さん、赤川さん ありがとうございました! 本番の運営も安定感があって、安心して自分の話に集中することができました。