調査まとめ

必要な時に応じて引用できるようにするための資料集

【書評】大規模サービス技術入門

 

 

概要

  • はてなでの大規模サービスの運営保守ノウハウをまとめた本
  • 大規模サービスでは大規模なデータをどう処理するかが主要なテーマとなる
  • サービスが成長し続けることによりシステム構成を試行錯誤で変化させる必要がある
  • 本書は2009年におけるオンプレでの話であるからこそ尚更学びがある
  • 具体的な実践手法の把握したい場合は本熟読推奨

 

はてなのサービス規模(2009年)

  • 登録ユーザー数:100万人
  • 月間UU数:1500万人
  • 月間アクセス数:数十億
  • ピーク時の回線トラフィック量:430Mbs
  • 運用台数:500台
  • アクセスログ:GB/日の単位
  • DB:GB、TBの単位
  • 例:ブックマークテーブル
  • レコード数:4500
  • 容量:5.5GB

大規模開発に伴う主な課題

  • スケーラビリティ、負荷分散、冗長性の確保
    ロードバランサによるスケールアウト
    CPU負荷、I/O負荷 
    (スケールアップはオンプレマシンの代金と冗長性に問題がある)
  • 開発人数の増加とそれに伴う開発体制構築
    開発環境の標準化
    ワークフローの導入
    アジャイル開発体制の浸透
  • 大規模データの処理、スループットの確保
    いかにメモリで済ませることがでるのか
    データ構造、探索アルゴリズム
    データ圧縮、全文情報検索
  • 仮想マシン自動監視体制、省力運用