社名
社名非公開
職種
システム開発(Web・オープン・モバイル系)
業務内容
■募集要件【必須要件】(Must)・AWS,GCP,Azure などのクラウド技術を用いたシステム設計・構築・運用経験・Docker, Kubernetesを利用したサービスの運用経験・IaCを用いたインフラ構築の経験・Datadog等何らかのSaaSを用いた監視・運用経験・Site Reliability Engineering に関する基本的な知識の保持【歓迎要件】(Want)・マイクロサービスパターン等を用いたクラウドネイティブなアプリケーションの開発・運用経験・大規模プロダクトにおけるキャパシティプランニングの経験や可用性向上の経験・アプリケーションのパフォーマンスチューニングの経験・運用しているプロダクトのオブザーバビリティを向上させた経験・SLI/SLOの設計のような何らかのSREプラクティスの実践経験
...
求められる経験
■業務概要
※プロダクトチームへのSLO導入・ 運用の仕組みの構築
・プロダクトチームに対して、サービスレベル目標(SLO)の概要や意義・重要性についてのオンボーディング、及び導入支援
・SLOを効果的に導入・運用するためのSLO定義やアラート設定用Terraformモジュールの作成・整備
・SLOの達成度を定期的に評価し、信頼性向上のための改善策をプロダクトチームと協力して実施
※アラート/インシデントマネジメントの仕組みの構築
・プロダクトチームが自らアラートに対応できるよう、通知の仕組みを構築・改善
・Runbookの作成および各アラートの優先度や通知先などの基準を整備し、アラートの標準化を推進
・オブザーバビリティの向上
・システムの監視やトラブルシューティングに必要なログ・メトリクスの収集方法の整備
・収集したデータを可視化し、リアルタイムでの状況把握やトラブル発生時の迅速な対応を可能にするダッシュボードの構築
・収集したデータから、異常検知や障害原因の特定に役立つアラートの設定やチューニング
・収集したデータを分析し、システムのパフォーマンスやセキュリティ、ユーザー体験などの改善につながるインサイトの発掘
・オブザーバビリティ向上に必要なツールや技術の調査・導入、および既存ツールの改善やカスタマイズ
※キャパシティプランニングの改善
・サービス特性(トラフィックパターン、ピーク時など)の分析から将来的な利用量の予測、リソースの調達
・アーキテクチャやインフラを評価、プロダクトチームに対して改善提案
・ドキュメントによるプロダクトチームへの共有、それらの自動化
・プロダクトチームに対する SRE 文化の Enabling
・プロダクトチーム横断の委員会活動を通じ、プラットフォームへの課題感の吸い上げ
。プロダクトチーム内のトイル比率の可視化及び削減の支援
・プロダクトの運用・保守をよりスムーズにするためのドキュメンテーション作成や整備
・開発プロセスやシステム構成の見直しや最適化に向けたアドバイスや支援
保険
健康保険,厚生年金保険,雇用保険,労災保険
休日休暇
土曜日 日曜日 祝日
土日祝日、年末年始休暇、慶弔休暇、有給休暇(入社日付与)、疾病休暇(有給扱い年6日付与)
給与
年収1,000 ~ 1,300万円
賞与
-
雇用期間
期間の定めなし
show more
社名
社名非公開
職種
システム開発(Web・オープン・モバイル系)
業務内容
■募集要件【必須要件】(Must)・AWS,GCP,Azure などのクラウド技術を用いたシステム設計・構築・運用経験・Docker, Kubernetesを利用したサービスの運用経験・IaCを用いたインフラ構築の経験・Datadog等何らかのSaaSを用いた監視・運用経験・Site Reliability Engineering に関する基本的な知識の保持【歓迎要件】(Want)・マイクロサービスパターン等を用いたクラウドネイティブなアプリケーションの開発・運用経験・大規模プロダクトにおけるキャパシティプランニングの経験や可用性向上の経験・アプリケーションのパフォーマンスチューニングの経験・運用しているプロダクトのオブザーバビリティを向上させた経験・SLI/SLOの設計のような何らかのSREプラクティスの実践経験
求められる経験
■業務概要
※プロダクトチームへのSLO導入・ 運用の仕組みの構築
・プロダクトチームに対して、サービスレベル目標(SLO)の概要や意義・重要性についてのオンボーディング、及び導入支援
・SLOを効果的に導入・運用するためのSLO定義やアラート設定用Terraformモジュールの作成・整備
・SLOの達成度を定期的に評価し、信頼性向上のための改善策をプロダクトチームと協力して実施
※アラート/インシデントマネジメントの仕組みの構築
・プロダクトチームが自らアラートに対応できるよう、通知の仕組みを構築・改善
・Runbookの作成および各アラートの優先度や通知先などの基準を整備し、アラートの標準化を推進
・オブザーバビリティの向上
・システムの監視やトラブルシューティングに必要なログ・メトリクスの収集方法の整備
・収集したデータを可視化し、リアルタイムでの状況把握やトラブル発生時の迅速な対応を可能にするダッシュボードの構築
・収集したデータから、異常検知や障害原因の特定に役立つアラートの設定やチューニング
・収集したデータを分析し、システムのパフォーマンスやセキュリティ、ユーザー体験などの改善につながるインサイトの発掘
・オブザーバビリティ向上に必要なツールや技術の調査・導入、および既存ツールの改善やカスタマイズ
※キャパシティプランニングの改善
・サービス特性(トラフィックパターン、ピーク時など)の分析から将来的な利用量の予測、リソースの調達
・アーキテクチャやインフラを評価、プロダクトチームに対して改善提案
・ドキュメントによるプロダクトチームへの共有、それらの自動化
...
・プロダクトチームに対する SRE 文化の Enabling
・プロダクトチーム横断の委員会活動を通じ、プラットフォームへの課題感の吸い上げ
。プロダクトチーム内のトイル比率の可視化及び削減の支援
・プロダクトの運用・保守をよりスムーズにするためのドキュメンテーション作成や整備
・開発プロセスやシステム構成の見直しや最適化に向けたアドバイスや支援
保険
健康保険,厚生年金保険,雇用保険,労災保険
休日休暇
土曜日 日曜日 祝日
土日祝日、年末年始休暇、慶弔休暇、有給休暇(入社日付与)、疾病休暇(有給扱い年6日付与)
給与
年収1,000 ~ 1,300万円
賞与
-
雇用期間
期間の定めなし
show more