Linuxスキルが社内で突然必要とされた日の話|誰も教えてくれない現場でどう乗り切ったか

HOMEリナックスマスター.JP 公式ブログLinux学習ガイド > Linuxスキルが社内で突然必要とされた日の話|誰も教えてくれない現場でどう乗り切ったか
宮崎智広 この記事の監修:宮崎智広(Linux実務・教育歴20年以上・受講者3,100名超)
「お前、Linuxできるんだろ?ちょっとこのサーバー見てくれないか」
入社して間もない頃、先輩から突然そう声をかけられた日のことを、今でも鮮明に覚えています。

Linuxを学びはじめた多くの人が、ある日突然「あなたが担当」になる瞬間を経験します。周りには詳しい人がいない。マニュアルもない。でもサーバーは動かし続けなければならない。そのプレッシャーの中で、どう動くべきか。

この記事では、20年以上Linuxサーバーを運用してきた経験から、「突然の現場デビュー」をどう乗り切り、そこから何を学んだかをお伝えします。

この記事のポイント

・「突然の現場デビュー」は多くのLinuxエンジニアが経験する
・まず「現状把握」だけに集中することが最初の正解
・誰も教えてくれない環境でこそ、ログを読む力が問われる
・その経験が「考えながら動く力」の土台になる


Linuxスキルが社内で突然必要とされた日の話|誰も教えてくれない現場でどう乗り切ったか
「このままじゃマズい」と感じていませんか?
参考書を開く気力もない、同年代に取り残される不安——
でも安心してください。プロのエンジニアはコマンドを暗記していません。
「現場で使える型」を効率よく使いこなしているだけです。
図解60P/登録10秒/解除も3秒 / 詳細はこちら

「Linuxできるんだろ?」の一言が全ての始まりだった

私がSE時代(2001年~2006年)に経験した話です。

入社2年目の夏、所属していたプロジェクトのインフラ担当が急遽異動になりました。後任の調整が間に合わず、「Linuxを少しかじっている」という理由だけで、私がサーバー管理を引き継ぐことになったのです。引き継ぎ資料はほとんどなし。担当者は翌日には別フロアへ。「これ、パスワードね」とメモを渡されただけで、実質的なドキュメントも何もありませんでした。

そのサーバーは社内の複数のシステムが依存しているWebアプリケーションサーバーで、止まれば業務が止まります。「とりあえず何かトラブルがあったら頼むよ」という無責任なバトンパスでした。

私はそのとき、本当に怖かったです。「触れば壊すかもしれない」「何かが起きても対応できない」という恐怖感が、頭をぐるぐる回っていました。

でも、あの体験があったからこそ、今の私があると感じています。

誰も教えてくれない現場で最初にやるべきこと

1. まず「触らない・把握する」から始める

最初に私がやったことは、サーバーにSSHでログインして「何も変更しない」ことです。

焦ると「とりあえず何かしなければ」という気持ちになりますが、それが一番危険です。現状が分からない状態で触れば、今ある問題を悪化させる可能性があります。

まず確認したのはこの3点です。

・稼働しているプロセスは何か(ps auxで確認)
・現在どんなサービスが起動しているか(systemctl list-units --type=serviceで確認)
・ディスクとメモリに余裕はあるか(df -hfree -mで確認)

これだけで、サーバーの「今の健康状態」が大まかに把握できます。変更は、把握してから。これが鉄則です。

2. ログを読むことを習慣の起点にする

把握フェーズで次に重要なのが、ログを読むことです。

私はその日、まず/var/log/messages/var/log/secureを開きました。このとき「意味が分かる行だけ読む」というスタンスで問題ありません。

# check recent errors and warnings $ tail -100 /var/log/messages | grep -i "error\|warn\|fail" May 20 10:12:33 web01 kernel: EXT4-fs error ... May 20 11:05:22 web01 httpd[1234]: [error] ... # 認証関連のログを確認する $ tail -50 /var/log/secure May 20 09:30:11 web01 sshd[5678]: Failed password for root from 192.168.x.x port 49222

最初から全部理解しようとしなくていい。「何か異常なことが起きていないか」を確認する目を持つだけで十分です。私がその日見たログには、定期的にSSHへのブルートフォース攻撃(不正ログイン試行)のログが記録されていました。当時は「これは普通のことなのか、問題なのか」すら判断できませんでしたが、「こういうことが起きているのか」と知ることが第一歩でした。

3. 変更前に必ずバックアップを取る習慣を即日始める

現状把握が終わったら、設定ファイルのバックアップを取る作業を最初にやりました。

# backup key config files before any changes $ cp /etc/httpd/conf/httpd.conf /etc/httpd/conf/httpd.conf.bak_20010901 $ cp /etc/ssh/sshd_config /etc/ssh/sshd_config.bak_20010901 # バックアップが取れたことを確認する $ ls -la /etc/httpd/conf/ -rw-r--r--. 1 root root 11753 Sep 1 14:32 httpd.conf -rw-r--r--. 1 root root 11753 Sep 1 14:33 httpd.conf.bak_20010901

これは技術的に難しいことではありません。しかし「誰も教えてくれない環境」では、こうした当たり前のことすら教えてもらえません。私が独学と失敗から学んだのは、「何かを変えるなら、元に戻せる状態を作ってから変える」という原則です。

セミナーで3,100名以上を指導してきた中で、この原則を自然に実践できている人は、意外と少ないです。ドキュメントよりも体で覚える原則のひとつだと感じています。

「分からない」ことへの向き合い方が全てを変えた

「分からない=調べる」を反射的にできるか

「誰も教えてくれない現場」での最大のストレスは、疑問が湧いても聞ける人がいないことです。私の場合、エラーメッセージやコマンドの意味を調べる手段がmanページとインターネット検索しかありませんでした。

そこで私が実践したのは、「分からない言葉は必ずその場で調べて、必ず作業メモに残す」というルールです。

たとえば、ログにSIGTERM(プロセスへの正常終了要求シグナル)という文字が出てきた。意味を調べる。「プロセスに正常終了を依頼するシグナルだ」と分かる。そのメモを残す。次に同じ言葉を見た時には知っている状態になる。

この「調べる→記録する→次に活かす」という小さなサイクルが、知識を積み上げていく唯一の方法でした。

「完全に理解してから動く」を捨てた

もうひとつ、私が変えたメンタルがあります。「完全に理解してから動く」という姿勢を捨てたことです。

Linuxの現場では、全てを理解してから着手することは事実上できません。サーバーの歴史、設定の経緯、依存関係……それらを完全に把握するまで動かないでいれば、何もできません。

大切なのは「今分かる範囲で判断して、影響範囲が小さいところから動かしてみる」という姿勢です。たとえば設定ファイルをバックアップした上で小さな変更を試す。ログを見て反応を確認する。問題があれば戻す。問題がなければ次に進む。

この繰り返しが、「考えながら動く力」です。私がSE時代の現場で身につけたのは、Linuxコマンドよりもこの思考パターンだったと、今では感じています。

「突然の担当」が自分を成長させた3つの理由

1. 「本当に必要な知識」だけを素早く習得できた

教科書通りに順番に学んでいると、自分の現場に関係ない知識もたくさん出てきます。でも「今このサーバーを動かし続けるために必要な知識」を探す状況では、学びに無駄がありません。

目の前の問題を解くために必要なことだけを調べる。それが最も効率的な学習法でもあります。

2. ログとエラーメッセージへの恐怖心がなくなった

最初はログを開いても何も分かりませんでした。でも毎日読んでいると、「正常な状態のログ」が目に染みついてきます。すると、異常なログが出たとき「あ、これは普段と違う」という感覚が働くようになります。

これはマニュアルでは学べない感覚です。現場で積み上げるしかない。

3. 「自分で調べて解決した」という体験が自信になった

誰かに聞いて解決した体験は、次のトラブルでも「聞けばいい」という依存を生みます。でも自分で調べて解決した体験は、「次も自分で解決できる」という自信を生みます。

20年以上指導してきた経験から言うと、独力で問題を解決した体験の積み重ねが、現場で自走できるエンジニアとそうでないエンジニアの差になります。

「何かがおかしい」エラーが出た時のトラブル初動対応

担当になったばかりの現場で「何かがおかしい」と感じた時、どう動けばよいか。よくある状況と初動対応をまとめます。

サービスが遅い・応答しないと感じたら

まず現在のサーバー負荷を確認します。

# check load, memory, and disk in one shot $ uptime 14:52:31 up 3:10, 2 users, load average: 0.92, 1.05, 1.12 $ free -m total used free Mem: 3840 3712 128 Swap: 2048 512 1536 $ df -h Filesystem Size Used Avail Use% Mounted on /dev/sda1 20G 18G 2.0G 90% /

上の例では、メモリの空きが128MBしかなく、ディスク使用率が90%になっています。この状態では、サービスが不安定になる可能性があります。ただし、この段階ではまだ何も変更せず、「どんな状態か」を把握することだけを目的にします。

エラーログに見慣れない文字列が出ていたら

エラーの内容をそのままコピーして検索することが最初の一手です。「英語が読めない」という不安を持つ方も多いですが、エラーメッセージの文字列をそのまま検索するだけで、多くの場合は原因と対処法が見つかります。

私が現場で実践していた方法は次の手順です。

・エラーメッセージをそのままコピーする
・Googleで「Linux [エラーメッセージ]」と検索する
・公式ドキュメントまたは信頼性の高い解説記事を確認する
・対処法を試す前に、必ず設定ファイルのバックアップを取る(鉄則)

「誰も教えてくれない」環境では、この調べ方の精度を上げることが最も重要なスキルになります。

まとめ

「突然の現場デビュー」は、準備が整ってから来るものではありません。多くのエンジニアが経験するように、それは突然やってきます。
場面 取るべき行動
引き継ぎ直後 まず触らず現状把握(ps/systemctl/df/free)
ログ確認 tail + grepでエラー・警告だけ抽出して読む
設定変更前 必ず設定ファイルをバックアップしてから着手
分からない用語 その場で調べて作業メモに残す
全体的な姿勢 完全理解より「小さく動かして確認する」
誰も教えてくれない環境こそ、エンジニアが最も成長できる場所です。怖くて当然。でもその恐怖の先に、本当の意味でのLinuxスキルがあります。

私のセミナーでは、こうした「現場で通用する思考の型」を、コマンドの使い方と並行して伝えています。Linuxスキルを確実に実務につなげたい方は、ぜひ一度ご覧ください。

突然の現場でも動じない力を、体系的に身につけませんか?

現場で通用する安全なLinuxサーバー構築の「型」を体系的に身につけたい方へ、『Linuxサーバー構築入門マニュアル(図解60P)』を完全無料でプレゼントしています。

「独学の時間がもったいない」「プロから直接、現場の技術を最短で学びたい」という本気の方には、2日で実務レベルのスキルが身につく【初心者向けハンズオンセミナー】も開催しています。

無料メルマガで学習を続ける

Linuxの実践スキルをメールで毎週お届け。
登録は1分、解除もいつでも可。

登録無料・いつでも解除できます

暗記不要・1時間後にはサーバーが動く

3,100名以上が実践した「型」を無料で公開中

プロのエンジニアはコマンドを暗記していません。
「現場で使える型」を効率よく使いこなしているだけです。
その「型」を図解60Pにまとめた入門マニュアルを、完全無料でプレゼントしています。

登録10秒/合わなければ解除3秒 / 詳細はこちら

Linux無料マニュアル(図解60P) 名前とメールで30秒登録
宮崎 智広

この記事を書いた人

宮崎 智広(みやざき ともひろ)

株式会社イーネットマーキュリー代表。現役のLinuxサーバー管理者として20年以上の実務経験を持ち、これまでに累計3,100名以上のエンジニアを指導してきたLinux教育のプロフェッショナル。「現場で本当に使える技術」を体系的に伝えることをモットーに、実践型のLinuxセミナーの開催や無料マニュアルの配布を通じてLinux人材の育成に取り組んでいる。

趣味は、キャンプにカメラ、トラウト釣り。好きな食べ物は、ラーメンにお酒。休肝日が作れない、酒量を減らせないのが悩み。最近、ドラマ「フライトエンジェル」を観て涙腺が崩壊しました。


Linux無料マニュアル(図解60P) 名前とメールで30秒登録