VTRyo Blog

一歩ずつ前に進むブログ

sre

MySQLテーブル毎のデータサイズ集計をDatadog × Prometheus Exporter × Kubernetesを使って自動化する

これは SRE Advent Calendar 17日目の記事です。 2022年に引き続きSRE Advent Calendarをやっていきます。 blog.vtryo.me ※今回は一部ChatGPTを使って文章生成しています。 背景 データベースのデータ量が日々増大していく中で、その監視は非常に重要な課題…

【SRE NEXT 2023】エモと学びと次の世代

近未来を思わせるデザインと臨場感あるムービー。 これから始まるのは究極の体験であるといわんばかりに。あれはまさに没入へのカウントダウンだった。 SRE NEXTは相変わらずカンファレンスがうまい。 3年連続でSRE NEXTに参戦してきました 思えば、初年度の…

What are Product SRE's do?

この記事はSRE Advent Calendar 11日目のエントリです。

新たなSREメンバーが増えた時に考えたいこと

新しいSREが自グループに参画した場合、どのようなオンボードを実施すればいいか迷う。 SREグループという名で活動が始まったのは2022年6月からであり、僕が弊社に入社したのは半年前のことである。 blog.vtryo.me つまりSREグループのオンボードというもの…

SRE NEXT 2022 ONLINEに「一人から始めるプロダクトSRE」で登壇しました

5月14・15日に開催されたSRE NEXT 2022 ONLINEの初日セッションで登壇させていただきました。 前回の2020年版では初めて大きな規模のカンファレンスに参加したという思い入れもあり、中々感慨深いものがあります。 blog.vtryo.me なお公募プロポーザルに出し…

"けしからん"Redash v4をv9-betaにバージョンアップした

「けしからんことを放置してはいけない」と僕の心の登大遊氏に叫ばれた。 logmi.jp

SREチーム立ち上げてから6ヶ月経ちました

2020年の1月から立ち上がったSREチームの取り組みをふりかえります。 blog.vtryo.me ※これらはSREチームの成果であり、記載された内容のすべてが筆者だけの成果というわけではありません

Dockerログ収集にDatadogのAuto Discovery機能を使う

ども。 Datadogのログ収集の話。 本番や開発環境はKubernetesで動いているものの、一部のコンテナは諸事情でDocker on EC2になっている。 このDocker on EC2のログをDatadogで収集したかったのだが、とにかくハマってしまった。

Datadog Logsでparseして任意のログレベルに変えたいときのremap方法

ども。 Datadogでログを取ってると「このログ、ぶっちゃけWARNINGでいいんだけど」みたいなのがある。 Datadogは自分でparseルールをカスタムできるので、それを利用してremapしてやるのだがそのやり方を毎回忘れる。 そして例によってわかりにくい公式ドキ…

SREチームとして取り組んでること2020 〜キックオフ編〜

sre

ども。2020年、弊社はSREチームを4名3名にしてパワーアップしました*1。 その取り組み備忘録を小出しにしていきます。細かいテクニカルな話は長くなるのでまた別途にします。 *1:途中でフロントエンド人材の不足で泣く泣く異動していきました

【発表資料付】SREカンファレンス "SRE NEXT" 行っていきレポ

豊洲で行われたSREカンファレンスの参加レポ。 sre-next.dev twitter.com 自分が参加したところを書いていく。行けなかったところについては他の参加レポを待つ!

ログ保存期間が過ぎてアーカイブされたログをDatadog内に復元する Rehydrating from Archives

Datadogはログ保存期間をすぎるとDatadog内で確認できなくなる。 そのため、S3にアーカイブする機能がもともと備わっている。 それがLog Rehydration™機能によりDatadog内で取得できるようになってたのでメモ*1。 *1:相変わらず公式ドキュメントは書いてある…

TD Presents!SRE勉強会に参加しました!

今宵はこちらに参加してきました! 【TD Presents】「信頼性×大規模」サービスを運営する会社が語る! サービスを安定的、かつ、スケーラブルに運営するための技術事例勉強会 ~インフラ/SRE編~