「前日のうちに誰かが変更したかもしれないサーバー、何を確認すればいいのか毎回迷う」
新人だけでなく、ある程度経験を積んだエンジニアからも意外とよく聞く悩みです。
この記事では、20年以上Linuxサーバーを運用してきた経験から、朝一番にやるべき「サーバーのヘルスチェック」をどう習慣化するか、現場で信頼される運用者がどんな視点で1日を始めているかを解説します。
この記事のポイント
・朝一チェックは「障害の芽」を先に摘むための攻めの習慣
・load・disk・log・backupの4点を決まった順で確認する
・チェックはスクリプト化して目視の余地を残すのが正解
・信頼される運用者ほど「昨日との差分」で異常に気づく
でも安心してください。プロのエンジニアはコマンドを暗記していません。
「現場で使える型」を効率よく使いこなしているだけです。
なぜ「朝一チェック」が運用者の評価を決めるのか
サーバー運用の仕事は、障害が起きてから動くものだと思われがちです。しかし私のセミナーで3,100名以上の受講生と接してきた中で、現場で評価される運用者には共通点があります。それは「異常が表に出る前に気づいている」ということです。
ディスク使用率が80%を超えていた、昨夜のバックアップが失敗していた、深夜のcronが想定より長く動いていた。こうした「まだ誰も困っていない異常」を朝のうちに拾えるかどうかで、その日1日の運用品質が決まります。
逆に、障害が表面化してから慌てて確認するタイプの運用者は、どれだけコマンドに詳しくても現場の信頼を得にくいものです。受講生からよく聞かれるのが「どうやって先回りするんですか?」という質問ですが、答えはシンプルで、朝の10分をチェックに使う習慣があるかどうか、ただそれだけなのです。
朝一チェックで見るべき4つの視点
朝のチェックは、網羅しようとすると終わらなくなります。私が現場で教えているのは「load・disk・log・backup」の4点に絞る方法です。1. サーバー負荷(load)の傾向を見る
まずuptime や w で過去15分・5分・1分のロードアベレージを確認します。昨日の同時刻と比べて異常に高くなっていないか、むしろ「いつもより低すぎる」変化がないかを見ます。負荷が低すぎるというのは一見よい状態に見えますが、本来動いているはずのバッチ処理が止まっている可能性を示す重要なサインです。絶対値ではなく「昨日との差分」で見る感覚が、熟練運用者と初心者を分けるポイントになります。
2. ディスク使用率(disk)を予測する
df -h で主要パーティションの使用率を確認します。大事なのは「今日の数字」ではなく「このペースだとあと何日で100%に到達するか」という視点です。私がこれまで見てきた障害で、もっとも避けられたはずなのに繰り返されているのが、ログ肥大によるディスク満杯です。前日比で使用率が2〜3%跳ねていたら、それはログ設計か想定外の書き出しに問題があるサインです。
3. ログ(log)の昨夜の異常を拾う
journalctl --since "yesterday" や /var/log/messages の前日分を眺めます。ここで全部読む必要はありません。「いつもと違う単語」があるかを眺める程度で十分です。現場で差がつくのは、エラーログを「検索するスキル」ではなく「異常の匂いに気づく嗅覚」です。毎朝同じログを眺めていると、いつもと違うメッセージが自然に目に飛び込んでくるようになります。
4. バックアップ(backup)が成功しているか確認する
昨夜のバックアップジョブが正常終了したかは、絶対に毎朝見てください。「cronが正常終了していること」と「バックアップが実際に使えること」は別問題です。ジョブのexit codeが0でも、出力ファイルのサイズが異常に小さい、前日と同じ内容で更新されていない、といった静かな失敗が現場では頻発します。
現場で実際に使っているチェックの流れ
実際の朝のチェックは、10分以内で終えることを目標にします。以下は私が現場で使っている順番の例です。# サーバー負荷とログインユーザーを確認 $ uptime 09:05:02 up 47 days, 14:22, 2 users, load average: 0.18, 0.24, 0.30 # ディスク使用率を確認 $ df -h Filesystem Size Used Avail Use% Mounted on /dev/xvda1 30G 21G 8.0G 73% / /dev/xvdb1 100G 62G 33G 65% /var # 昨夜のエラーログだけ抽出 $ journalctl --since "yesterday" --until "today" -p err # 昨夜のバックアップログの末尾を確認 $ tail -20 /var/log/backup/nightly.log
チェックは自動化しつつ、目視も残す
「だったら全部スクリプトで自動化して、閾値を超えたら通知すればいいのでは?」と聞かれることがあります。もちろん監視ツールや通知は必須です。ただ、それと朝の目視チェックはまったく別のものとして両立させることをおすすめします。
監視ツールは「閾値を超えたこと」は教えてくれますが、「まだ超えていないが、そろそろ怪しい」という兆候は拾えません。毎朝サーバーを自分の目で眺める習慣があると、数字の後ろにある挙動の違和感に気づけます。この嗅覚こそが、運用者としての実力を長期的に作っていきます。
チェック項目をまとめたシェルスクリプトの例
以下のような薄いスクリプトを朝のチェック補助として置いておくと、目視チェックの効率が大幅に上がります。#!/bin/bash # morning_check.sh - 朝一チェック補助スクリプト echo "===== uptime =====" uptime echo "===== disk =====" df -h | awk '$5+0 > 70 {print}' echo "===== errors (last 24h) =====" journalctl --since "24 hours ago" -p err --no-pager | tail -20 echo "===== backup log =====" tail -5 /var/log/backup/nightly.log 2>/dev/null
異常を見つけた場合の初動で差がつく
ここが、朝一チェックの本当の価値が現れる瞬間です。異常を見つけた時、すぐに直そうとするのは初心者の動きです。ベテランはまず「事実を記録する」ところから始めます。・いつから発生しているかを
journalctl --since や /var/log/messages で特定する・他に連動している異常はないかを周辺ログで確認する
・影響範囲を
df・ps・ss で広めにスナップショットするこれを5分やってから対処に入ると、「原因不明のまま再発する」「直したつもりで別のところが壊れる」といったトラブルを激減させられます。注意すべきは、焦って先に再起動してしまうと、原因究明に必要なログや状態が消えてしまうことです。「とりあえず再起動」が一番危険な初動だということを、現場で何度も目にしてきました。
朝一チェックを続けるための3つのコツ
習慣化は、どんなエンジニアでも最初は続きません。受講生の中にも「最初の1週間で挫折しました」と言う人が少なくありません。私が現場で実際に勧めているのが次の3つです。・同じ順番で固定する:load→disk→log→backupの順を変えない。順番を考える時間をゼロにすることで習慣として定着します。
・出社後の最初の作業にする:メールやチャットを開く前にチェックを済ませる。他人の用事が先に入ると絶対に続きません。
・結果を1行メモに残す:「異常なし」でもよいので、日付つきで記録する。後日振り返った時に、その記録が最強のトラブル調査資料になります。
まとめ
朝一チェックは「障害対応の後処理」ではなく「運用品質を能動的に作るための攻めの習慣」です。| 視点 | 見るべきポイント |
|---|---|
| load(負荷) | 昨日との差分、低すぎる変化にも注目 |
| disk(ディスク) | 残り何日で100%に到達するか |
| log(ログ) | いつもと違う単語の「匂い」を拾う |
| backup(バックアップ) | exit codeでなくファイル実体を確認 |
朝一チェックを「自信を持ってこなせる」運用者になりませんか?
load・disk・log・backupを毎朝確認するには、サーバーの構造と運用の「型」を理解している必要があります。断片的な知識の寄せ集めではなく、現場で通用する安全なLinuxサーバー構築の「型」を体系的に身につけたい方へ、『Linuxサーバー構築入門マニュアル(図解60P)』を完全無料でプレゼントしています。
「独学の時間がもったいない」「プロから直接、現場の技術を最短で学びたい」という本気の方には、2日で実務レベルのスキルが身につく【初心者向けハンズオンセミナー】も開催しています。
3,100名以上が実践した「型」を無料で公開中
プロのエンジニアはコマンドを暗記していません。
「現場で使える型」を効率よく使いこなしているだけです。
その「型」を図解60Pにまとめた入門マニュアルを、完全無料でプレゼントしています。
登録10秒/合わなければ解除3秒 / 詳細はこちら
- 次のページへ:Ansibleのエラー処理を甘く見ていませんか——現場で信頼されるコードの書き方
- 前のページへ:「エラーが出たら嬉しい」と言えるエンジニアが最速で伸びる理由|現役講師が語るトラブルとの向き合い方
- この記事の属するカテゴリ:Linux学習ガイドへ戻る

無料メルマガで学習を続ける
Linuxの実践スキルをメールで毎週お届け。
登録は1分、解除もいつでも可。
登録無料・いつでも解除できます