Skip to main content
もう一度読むSRE

もう一度読むSRE

By Topotal

「もう一度読むSRE」は、株式会社Topotal(トポタル)の高村と菱田がディスカッション形式で「SRE サイトリライアビリティエンジニアリング」を読み進めるポッドキャストです。

SRE を今から知りたい方はもちろん、SRE の基礎を改めて学びたい方もぜひ視聴ください。Twitter のハッシュタグは #もう一度読むSRE です。
Available on
Apple Podcasts Logo
Google Podcasts Logo
Pocket Casts Logo
RadioPublic Logo
Spotify Logo
Currently playing episode

もう一度読むSRE #3

もう一度読むSREJul 06, 2021

00:00
52:01
もう一度読むSRE #90

もう一度読むSRE #90

23.4.5 パフォーマンスに関する考察:Fast Paxos から 23.4.7 バッチ処理 まで

Apr 10, 202425:15
もう一度読むSRE #89

もう一度読むSRE #89

23.4.2 読み取り負荷が大きいワークロードのスケーリングから23.4.4 分散合意のパフォーマンスとネットワークのレイテンシまで

Mar 27, 202430:52
もう一度読むSRE #88

もう一度読むSRE #88

23.4.1 Multi-Paxos:詳細なメッセージフロー

Mar 11, 202427:43
もう一度読むSRE #87

もう一度読むSRE #87

23.3.5 信頼性を持つ分散キュー及びメッセージング から 23.4 分散合意のパフォーマンス まで

Feb 07, 202429:43
もう一度読むSRE #86

もう一度読むSRE #86

23.3.3 リーダー選出を利用する高可用性を持つ処理 から 23.3.4 分散協調及びロックサービス まで

Jan 31, 202421:58
もう一度読むSRE #85

もう一度読むSRE #85

23.3 分散合意のためのシステムアーキテクチャパターン から 23.3.2 信頼性を持つ複製データストア及び設定ストアまで

Jan 24, 202435:10
もう一度読むSRE #84

もう一度読むSRE #84

23.2 分散合意の動作 から 23.2.1 Paxosの概要: サンプルプロトコル まで

Dec 25, 202346:16
もう一度読むSRE #83

もう一度読むSRE #83

23.1 合意を利用する目的:分散システムの協調障害 から 23.1.3 ケーススタディ 3:問題のあるグループメンバーシップアルゴリズム まで

Oct 25, 202325:37
もう一度読むSRE #82

もう一度読むSRE #82

23章 クリティカルな状態の管理: 信頼性のための分散合意

Oct 18, 202326:27
もう一度読むSRE #81

もう一度読むSRE #81

SRE NEXT 2023 Chair ぐりもおさん をゲストに迎え、SRENEXTのことをお聞きしました。

Sep 14, 202329:36
もう一度読むSRE #80

もう一度読むSRE #80

22.6 カスケード障害に対応するためにすぐに行うべき手順 から 22.7まとめまで

Aug 23, 202332:14
もう一度読むSRE #79

もう一度読むSRE #79

22.4 カスケード障害を引き起こす条件 から 22.5.3 重要度の低いバックエンドのテスト まで

Aug 17, 202327:30
 もう一度読むSRE #78

もう一度読むSRE #78

22.3 起動直後の低パフォーマンスとコールドキャッシュ から 22.3.1 スタックは常に下っていくようにすること まで

Aug 10, 202329:37
もう一度読むSRE #77

もう一度読むSRE #77

22.2.4 レイテンシとタイムアウト から 22.2.4.4 二峰性のレイテンシ まで

Jul 20, 202323:39
もう一度読むSRE #76

もう一度読むSRE #76

22.2.2 ロードシェディングとグレースフルデグラデーション から 22.2.3 リトライ まで

Jul 05, 202326:12
もう一度読むSRE #75

もう一度読むSRE #75

22.1.3 利用できないサービス から 22.2.1 キューの管理 まで

Jun 28, 202325:60
もう一度読むSRE #74

もう一度読むSRE #74

22章 カスケード障害への対応 から 22.1.2.5 リソース間の依存関係 まで

本編は12分05秒あたりからになります。

Jun 15, 202340:20
もう一度読むSRE #73

もう一度読むSRE #73

21.7 接続によって生じる負荷 から 21.8 まとめ まで

Jun 07, 202326:56
もう一度読むSRE #72

もう一度読むSRE #72

21.5 利用率のシグナル から 21.6.1 リトライの判断 まで

May 31, 202327:43
もう一度読むSRE #71

もう一度読むSRE #71

21.3 クライアント側でのスロットリング から 21.4 重要度 まで

May 24, 202327:16
もう一度読むSRE #70

もう一度読むSRE #70

21章 過負荷への対応 から 21.2 顧客単位での制限 まで

May 10, 202324:10
もう一度読むSRE #69

もう一度読むSRE #69

20.4 ロードバランシングのポリシー から 20.4.1.3 マシンのばらつき まで

Apr 26, 202333:46
もう一度読むSRE #68

もう一度読むSRE #68

20.3.3 サブセット選択のアルゴリズム : 決定的なサブセット選択

Apr 05, 202326:57
もう一度読むSRE #67

もう一度読むSRE #67

20.3 サブセットの設定によるコネクションプールの制限 から 20.3.2 サブセットの選択アルゴリズム:ランダムなサブセットの選択 まで

Mar 29, 202329:00
もう一度読むSRE #66

もう一度読むSRE #66

20章 データセンターでのロードバランシング から 20.2.2 不健全なタスクへの確実なアプローチ:レイムダック状態 まで

Mar 23, 202332:00
もう一度読むSRE #65

もう一度読むSRE #65

19.3 仮想 IP アドレスでのロードバランシング まで

Mar 16, 202333:28
もう一度読むSRE #64

もう一度読むSRE #64

19章 フロントエンドにおけるロードバランシング から 19.2 DNS を使ったロードバランシング まで

Feb 27, 202340:48
もう一度読むSRE #63

もう一度読むSRE #63

18.3.5 チームの力学 から 18.5 まとめ まで

Feb 02, 202344:50
もう一度読むSRE #62

もう一度読むSRE #62

18.3.4 認知の向上と採用の推進 から 18.3.4.4 適切なレベルでの設計 まで

Jan 25, 202320:31
もう一度読むSRE #61

もう一度読むSRE #61

18.3.2 Auxon の紹介 から 18.3.3.1 近似 まで

Jan 04, 202331:12
もう一度読むSRE #60

もう一度読むSRE #60

<ul>
<li>18.2.2 Google におけるソリューション:インテントベースのキャパシティプランニング から 18.3.1.2 パフォーマンスメトリクス まで</li>
</ul>
Dec 28, 202228:30
もう一度読むSRE #59

もう一度読むSRE #59

18章 SRE におけるソフトウェアエンジニアリング から 18.2 Auxon のケーススタディ:プロジェクトの背景と問題の領域 まで

Dec 07, 202226:45
もう一度読むSRE #58

もう一度読むSRE #58

17.3.7 プロダクション環境におけるプローブ から 17.4 まとめ まで

Dec 01, 202226:56
もう一度読むSRE #57

もう一度読むSRE #57

17.3.6 結合 まで

Nov 16, 202230:52
もう一度読むSRE #56

もう一度読むSRE #56

17.3.5 予想されるテストの失敗 まで

Nov 06, 202236:23
もう一度読むSRE #55

もう一度読むSRE #55

17.3.4 プロダクションへのプッシュ

Oct 27, 202224:48
もう一度読むSRE #54

もう一度読むSRE #54

17.3.2 ディザスタのテスト から 17.3.3 速度の重要性 まで

Oct 19, 202230:15
もう一度読むSRE #53

もう一度読むSRE #53

17.3 大規模なテスト から 17.3.1 スケーラブルなツールのテスト まで

Oct 11, 202237:20
もう一度読むSRE #52

もう一度読むSRE #52

17.2 テストの作成と環境の構築 まで

Oct 04, 202226:08
もう一度読むSRE #51

もう一度読むSRE #51

17.1.2.2 ストレステスト から 17.1.2.3 カナリアテスト まで

Sep 14, 202229:57
もう一度読むSRE #50

もう一度読むSRE #50

17.1.2 プロダクションテスト から 17.1.2.1 設定テスト まで

Aug 31, 202222:30
もう一度読むSRE #49

もう一度読むSRE #49

17 信頼性のためのテスト から 17.1 ソフトウェアテストの種類 まで

Aug 24, 202241:46
もう一度読むSRE #48

もう一度読むSRE #48

16章 サービス障害の追跡 から 16.2.4 予想外のメリット まで

Aug 18, 202238:18
もう一度読むSRE #47

もう一度読むSRE #47

15章 ポストモーテムの文化: 失敗からの学び から 15.4 まとめと改善の継続 まで

Aug 03, 202233:20
もう一度読むSRE #46

もう一度読むSRE #46

15章 ポストモーテムの文化: 失敗からの学び から 15.1 Google におけるポストモーテムの哲学

本編は3分35秒からです。

Jul 26, 202237:07
もう一度読むSRE #45

もう一度読むSRE #45

14.3 インシデント管理のプロセスの構成要素 から 14.5 インシデントと宣言すべき場合 まで

本編は11分00秒からです。

Jul 19, 202245:15
もう一度読むSRE #44

もう一度読むSRE #44

13.6 過去から学び、繰り返さない から 14.3.4 はっきりとした引き継ぎ まで

本編は6分22秒からです。

Jun 29, 202236:37
もう一度読むSRE #43

もう一度読むSRE #43

13.4  プロセスが引き起こした緊急事態 から 13.5 解決できない問題は存在しない まで

本編は3分10秒からです。


Jun 22, 202225:13
もう一度読むSRE #42

もう一度読むSRE #42

13.3 変更が引き起こした緊急事態 から 13.3.3.2 学んだこと まで

本編は4分10秒からになります。

Jun 14, 202225:59
もう一度読むSRE #41

もう一度読むSRE #41

13章 緊急対応 から 13.2.3.2 学んだこと まで

本編は5分50秒からになります。

Jun 06, 202229:57