Ollamaをインストールする方法｜Ubuntu・WSL2・Docker別の導入手順とモデル取得まで

この記事の監修：宮崎智広（Linux実務・教育歴20年以上・受講者3,100名超）

ＨＯＭＥ＞ Linux技術リナックスマスター.JP（Linuxマスター.JP）＞ローカルLLM ＞ Ollamaをインストールする方法｜Ubuntu・WSL2・Docker別の導入手順とモデル取得まで

「Ollamaのインストール方法がわからない」
「Ubuntu・WSL2・Dockerのどの環境を選べばいいか判断できない」

そんな悩みを抱えるローカルLLMをこれから始める初心者は多いはずです。この記事では、OllamaをUbuntu・WSL2・Dockerそれぞれの環境にインストールする具体的な手順を解説します。curl一発導入からモデルの取得・動作確認まで、「とりあえずOllamaを動かす」ところをゴールにします。WSL2とDockerの導入差分や、インストール後に遭遇しやすいエラーの対処法もあわせてカバーします。

この記事のポイント

・Ollamaは curl -fsSL https://ollama.com/install.sh | sh の一行でUbuntu・WSL2に導入できる
・WSL2はUbuntuと同じコマンドで動くが、systemd有効化の確認とGPU連携の手順が追加になる
・Dockerでは docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama で起動できる
・ollama: command not foundが出る場合はPATH再設定と source ~/.bashrc で解消できることが多い

Ollamaをインストールする方法｜Ubuntu・WSL2・Docker別の導入手順とモデル取得まで

「このままじゃマズい」と感じていませんか？

参考書を開く気力もない、同年代に取り残される不安——
でも安心してください。プロのエンジニアはコマンドを暗記していません。
「現場で使える型」を効率よく使いこなしているだけです。

図解60P／登録10秒／解除も3秒／詳細はこちら

Ollamaとは何か｜ローカルLLMを動かす最短ルート

Ollamaは、LLM（大規模言語モデル）をローカル環境で手軽に実行するためのランタイムです。公式のインストールスクリプトを実行するだけで環境が整い、`ollama run` コマンド一つでLlama3.3やGemma 3、Phi-4といったオープンソースモデルをすぐに使い始められます。macOS・Linux・Windowsに対応しており、GPUがなくてもCPUで動作します。

クラウドLLMサービス（ChatGPTなど）とOllamaの最大の違いは、データがローカルから外に出ない点です。社内の機密文書を要約したり、個人情報を含むログを解析したりする場合、クラウドLLMへのデータ送信はリスクになります。Ollamaを使えばネットワークを遮断した環境でもLLMが稼働するため、情シス担当やセキュリティを重視する現場でニーズが高まっています。

社内でChatGPTの利用が制限されているケースでローカルLLMがどう機能するかは、社内でChatGPTが使えないときの代替手段｜機密データを守るローカルLLMという選択肢で詳しく解説しています。

OllamaのアーキテクチャはシンプルなAPI構造です。インストールするとバックグラウンドで `ollama serve` が常駐し、`http://localhost:11434` にAPIエンドポイントを公開します。CLI経由でもHTTP REST API経由でも操作できるため、スクリプトや他のアプリとの連携もしやすい設計になっています。

UbuntuへのOllamaインストール手順（curl一発導入）

Ubuntuへのインストールは、公式が提供するシェルスクリプト一行で完結します。Ubuntu 20.04・22.04 LTS・24.04 LTSで動作確認されています。rootでの実行は不要で、sudoが使えるユーザーであれば問題ありません。

1. 前提確認（OSバージョンと必要スペック）

インストール前にOSバージョンとアーキテクチャを確認します。

# OSバージョンとアーキテクチャ確認 $ lsb_release -a && uname -m No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 24.04.1 LTS Release: 24.04 Codename: noble x86_64

x86_64（AMD64）であれば問題ありません。ARM64（Raspberry Pi・Apple Silicon Mac上のLinux）にも対応しています。最低スペックの目安はRAM 8GB以上・ストレージ空き10GB以上です。GPUなしのCPU環境でも動作しますが、推論速度はGPUと比べて大幅に遅くなります。

2. curlコマンド一行でインストールする


# Ollama公式インストールスクリプトを実行
$ curl -fsSL https://ollama.com/install.sh | sh
>>> Downloading ollama...
>>> Installing ollama to /usr/local/bin...
>>> Creating ollama user...
>>> Adding ollama to 'render' group...
>>> Adding ollama to 'video' group...
>>> Adding current user to 'ollama' group...
>>> Creating ollama systemd service...
>>> Enabling and starting ollama service...
Created symlink /etc/systemd/system/default.target.wants/ollama.service
>>> The Ollama API is now available at 127.0.0.1:11434.
>>> Install complete. Run "ollama" from the command line.

インストールスクリプトは以下を自動で実行します。
・Ollamaバイナリを `/usr/local/bin/ollama` に配置する
・`ollama` システムユーザーを作成する
・`ollama.service` というsystemdサービスを登録・起動する

スクリプト実行後、Ollamaはsystemdサービスとして自動起動します。再起動後も自動で起動するため、追加の設定は不要です。

3. Ollamaの起動を確認する

# systemdサービスの状態確認 $ systemctl status ollama * ollama.service - Ollama Service Loaded: loaded (/etc/systemd/system/ollama.service; enabled; preset: enabled) Active: active (running) since Fri 2026-06-20 09:00:00 JST; 30s ago Main PID: 3456 (ollama) # APIエンドポイントが応答するか確認 $ curl http://localhost:11434 Ollama is running

`Active: active (running)` と `Ollama is running` の両方が確認できれば、インストール完了です。Ubuntu Serverへの本番構築（ユーザー権限・ファイアウォール・外部公開の設計）については、Ubuntu ServerでローカルLLMを構築する方法｜Ollamaで機密データを外に出さず業務AIを動かす完全ガイドを参照してください。

WSL2へのOllamaインストール｜WindowsからローカルLLMを使う

WindowsのWSL2（Windows Subsystem for Linux 2）でOllamaを動かすと、Windowsマシンのまま手軽にローカルLLM環境を試せます。WSL2はUbuntuをほぼそのまま動かせるため、インストールコマンド自体はUbuntuと共通です。ただし、systemdの有効化確認とGPU連携の手順に差分があります。

1. WSL2のsystemd有効化を確認する

WSL2でOllamaをsystemdサービスとして管理するにはsystemdを有効にする必要があります。デフォルトで無効になっているディストリビューションがあるため、先に確認します。

# WSL2バージョン確認（PowerShellで実行） > wsl --version WSL バージョン: 2.3.26.0 カーネルバージョン: 5.15.167.4-1 # WSL2のUbuntu内でsystemd設定を確認 $ cat /etc/wsl.conf [boot] systemd=true

`/etc/wsl.conf` が存在しない、または `systemd=true` の記述がない場合は、以下を追記してからWSLを再起動します。


# /etc/wsl.confを作成してsystemdを有効化
$ sudo tee /etc/wsl.conf << 'EOF'
[boot]
systemd=true
EOF

# PowerShellでWSLを再起動
> wsl --shutdown
> wsl

2. Ubuntuと同じコマンドでインストールする

systemdが有効になったWSL2 Ubuntu環境で、Ubuntuと同じコマンドを実行します。

# WSL2（Ubuntu）でのインストール（Ubuntuと同一コマンド） $ curl -fsSL https://ollama.com/install.sh | sh # インストール確認 $ ollama --version ollama version is 0.6.8 # APIの応答を確認 $ curl http://localhost:11434 Ollama is running

systemdが有効であればOllamaがsystemdサービスとして登録されます。systemdが無効なWSL2環境の場合は、後述の「サービス手動起動」の方法で `ollama serve` を起動してください。

3. WSL2でのGPU連携（NVIDIA GPU使用時）

WSL2でNVIDIA GPUを使う場合、WindowsホストにNVIDIAドライバを入れるだけでWSL2側はCUDAを自動認識します。Ubuntu Serverと異なりWSL2側でのCUDA Toolkitの個別インストールは不要です。

# WSL2内でGPU認識を確認 $ nvidia-smi +-----------------------------------------------------------------------------+ | NVIDIA-SMI 550.54.15 Driver Version: 550.54.15 CUDA Version: 12.4 | |-------------------------------+----------------------+----------------------+ | 0 NVIDIA GeForce RTX 3060 On | 00000000:01:00.0 Off | N/A | +-----------------------------------------------------------------------------+ # OllamaのGPU使用状況を確認 $ ollama ps NAME ID SIZE PROCESSOR UNTIL gemma3:4b a72c7f4d3796 3.3 GB 100% GPU 5 minutes from now

`PROCESSOR` 列に `100% GPU` が表示されれば、WSL2でもGPU推論が機能しています。`nvidia-smi` がWSL2内で動作する状態であれば、Ollamaは追加設定なしに自動でGPUを検出します。

DockerコンテナでOllamaを動かす方法

DockerでOllamaを動かすと、ホストOS（Ubuntu・CentOS・macOS・Windowsなど）を問わず同じ手順で環境を用意できます。複数のOllamaバージョンを切り替えたい場合や、Kubernetes等のコンテナ基盤にOllamaを組み込む場合にも有効です。また、ホストOS環境を汚さずに試したい場合にも適しています。

1. Dockerのインストール確認

# Dockerのバージョン確認 $ docker --version Docker version 27.0.3, build 7d4bcd8 # Dockerサービスが動作しているか確認 $ systemctl status docker * docker.service - Docker Application Container Engine Active: active (running)

DockerはDocker公式ドキュメントの手順でインストールしてください。Ubuntu 24.04では `apt install docker.io` より `docker-ce` の公式リポジトリ経由インストールを推奨します。

2. docker runでOllamaコンテナを起動する

GPU非使用（CPUのみ）の場合と、NVIDIA GPU使用の場合でコマンドが異なります。

# CPUのみで起動（GPU不使用） $ docker run -d \ --name ollama \ -v ollama:/root/.ollama \ -p 11434:11434 \ ollama/ollama # NVIDIA GPUを使って起動（nvidia-container-toolkitが必要） $ docker run -d \ --name ollama \ --gpus=all \ -v ollama:/root/.ollama \ -p 11434:11434 \ ollama/ollama

`-v ollama:/root/.ollama` はDockerボリュームを指定しています。コンテナを削除・再作成してもダウンロード済みモデルが保持されるため、毎回再ダウンロードせずに済みます。`-p 11434:11434` でホスト側のポート11434にAPIが公開されます。

3. コンテナ経由でモデルを実行する

起動したコンテナに対して `docker exec` でコマンドを実行するか、ホストから `curl` でAPIを叩きます。

# コンテナ内でollama runを実行（対話モード） $ docker exec -it ollama ollama run gemma3:4b pulling manifest pulling aabd4debf0c8... 100% ████████ 3.3 GB/3.3 GB >>> こんにちははい、こんにちは。何かお手伝いできることはありますか？ # ホスト側からREST APIでプロンプトを送信する $ curl http://localhost:11434/api/generate \ -d '{"model":"gemma3:4b","prompt":"cronで毎日0時に実行する書き方は？","stream":false}'

コンテナを停止・削除しても `ollama` というDocker Volumeにモデルが保持されているため、次回起動時に再ダウンロードは不要です。Docker Composeを使う場合は、`ollama/ollama` イメージと同じ設定をYAMLに記述するだけで構成管理できます。

モデルの取得と動作確認（Llama3.3・Gemma 3・Phi-4）

Ollamaが起動したら、次はモデルを取得して実際に動かします。`ollama pull` でモデルをダウンロードし、`ollama run` で実行します。Ubuntu・WSL2・Dockerいずれの環境でも手順は共通です。

1. ollama pullでモデルを取得する

# Gemma 3:4b（軽量・VRAM 4GB～で動作）を取得 $ ollama pull gemma3:4b pulling manifest pulling aabd4debf0c8... 100% ████████ 3.3 GB/3.3 GB verifying sha256 digest writing manifest success # Llama3.3:70b（量子化版・VRAM 24GB以上推奨）を取得 $ ollama pull llama3.3:70b-instruct-q4_0 # Phi-4（Microsoft製・VRAM 12GB推奨）を取得 $ ollama pull phi4

モデルは `~/.ollama/models/` に保存されます。Dockerの場合は指定したボリューム内に格納されます。ストレージ容量の目安として、Gemma 3:4bは約3.3GB、Phi-4は約9.1GB、llama3.3:70b-instruct-q4_0は約40GBが必要です。ダウンロード途中で中断しても `ollama pull` を再実行すると途中から再開します。

2. ollama runで動作確認する

# Gemma 3:4bを起動して対話（モデルが未取得の場合はpullも自動実行） $ ollama run gemma3:4b >>> Linuxのcronで毎日0時にスクリプトを実行する書き方は？ cronで毎日0時に実行するには、以下をcrontabに追加します： 0 0 * * * /path/to/script.sh この設定は毎日午前0時（深夜0時）に指定したスクリプトを実行します... # /bye で終了、または Ctrl+D >>> /bye

3. インストール済みモデルの確認と削除

# ダウンロード済みモデルの一覧表示 $ ollama list NAME ID SIZE MODIFIED gemma3:4b a72c7f4d3796 3.3 GB 2 minutes ago llama3.3:70b-instruct-q4_0 a6eb4748fd29 43 GB 1 hour ago phi4 ac896e5b8b34 9.1 GB 30 minutes ago # 不要なモデルを削除する $ ollama rm llama3.3:70b-instruct-q4_0 deleted 'llama3.3:70b-instruct-q4_0'

各モデルのVRAM消費量・用途別の使い分けについては、ローカルLLMのモデルを比較する方法｜Llama3.3・Mistral・Gemma・Phi-4をUbuntuで使い分けるポイントで詳しく解説しています。

「ollama: command not found」が出た時の対処法

インストール後にコマンドが見つからないエラーが出るケースは一定数あります。原因のほとんどはPATHが通っていないことで、以下の手順で解消できます。WSL2・Dockerでのトラブルも含めて整理します。

1. PATHの確認と再設定

# ollamaコマンドの場所を確認 $ which ollama /usr/local/bin/ollama # PATHに/usr/local/binが含まれているか確認 $ echo $PATH /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin # PATHに含まれていない場合は.bashrcに追記して反映 $ echo 'export PATH=/usr/local/bin:$PATH' >> ~/.bashrc $ source ~/.bashrc # 再確認 $ ollama --version ollama version is 0.6.8

`which ollama` でパスが表示されない場合は、インストールが完了していない可能性があります。`ls -la /usr/local/bin/ollama` でファイルの存在を確認し、なければインストールスクリプトを再実行してください。

2. systemdが無効な環境でサービスを手動起動する

WSL2でsystemdが無効な場合や、CI環境・一部のDockerコンテナ内のような環境では、`ollama serve` を手動で起動します。

# バックグラウンドでollamaサーバーを手動起動 $ nohup ollama serve &> /tmp/ollama.log & [1] 12345 # 起動確認 $ curl http://localhost:11434 Ollama is running # ログでエラーがないか確認 $ tail -20 /tmp/ollama.log time=2026-06-20T09:00:00.000+09:00 level=INFO source=routes.go msg="Ollama version 0.6.8"

3. その他のよくあるエラーと対処法

インストール後に遭遇しやすいエラーを整理します。

・「port 11434 is already in use」が出る場合：`sudo lsof -i :11434` でポートを使っているプロセスを確認し、既存のOllamaプロセスを `sudo systemctl restart ollama` で再起動する
・モデルのダウンロードが途中で止まる場合：`ollama pull` を再実行すると途中から再開できる（Ollamaは途中再開をサポート）
・「Error: context deadline exceeded」が出る場合：モデルサイズに対してRAMが不足している。Gemma 3:4b（3.3GB）など軽量モデルを試すか、量子化タグ（`llama3.3:70b-instruct-q4_0` 等）でメモリ消費を抑える
・Dockerで「no such image」が出る場合：`docker pull ollama/ollama` を先に実行してイメージをローカルに取得してから `docker run` を実行する
・WSL2で「cannot connect to the Docker daemon」が出る場合：Docker Desktop for WindowsのWSL2 Backend設定が有効になっているか確認する
知人のインフラエンジニアがWSL2でOllamaを試した際、インストール自体は成功したのにコマンドが見つからないという状態になりました。原因はsystemdが無効で `ollama serve` が起動していなかったことで、`nohup ollama serve` の手動起動で解消しています。こういうケースは入門時に見落としがちなポイントです。

本記事のまとめ｜Ollama導入早見表

OllamaはUbuntu・WSL2・Dockerの3環境で動作し、インストール方法の基本は共通です。curl一行でインストールし、`ollama pull` でモデルを取得、`ollama run` で使い始めるという流れは変わりません。環境ごとの差分はsystemd設定とGPU連携の箇所だけです。

20年以上Linuxサーバーを運用してきた経験から言うと、OllamaはローカルLLMランタイムの中で最も導入障壁が低いツールの一つです。インストールスクリプト一行・モデルpull一行という設計の潔さは、「まず動かして確かめたい」現場の技術者には特に響きます。GPUなしのCPU環境でも動作するため、手元のノートPCで試してから本番サーバーに展開するという段階的なアプローチが取りやすいのも強みです。

チームで共有するUbuntu Serverへの本番展開（外部公開の設計・systemd設定・ファイアウォール）については、本番構築の詳細手順はこちらで詳しく解説しています。

環境	インストールコマンド	GPU連携	特徴
Ubuntu	`curl -fsSL https://ollama.com/install.sh \| sh`	自動認識（CUDAが必要）	systemdで自動起動。最もシンプル
WSL2	`curl -fsSL https://ollama.com/install.sh \| sh`	Windowsドライバで自動認識	Windowsマシンそのままで使える
Docker（CPU）	`docker run -d -v ollama:/root/.ollama -p 11434:11434 ollama/ollama`	なし	OS非依存・複数バージョン管理可
Docker（GPU）	`docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama`	nvidia-container-toolkit必要	コンテナ基盤への組み込みに最適
モデル取得	`ollama pull gemma3:4b`	共通	3環境共通。途中再開サポート
動作確認	`ollama run gemma3:4b`	共通	対話モードで即確認できる

Ollamaの導入から実務活用までを2日間のハンズオンで体験する

インストールは手順通りに進んでも、環境の差異でつまずくことがあります。実機GPU環境で手を動かしながら習得したい方向けに、「ローカルAIマスターセミナー」を開催しています。
少人数（最大8名）ZOOMハンズオン形式で実施しています。

＞＞ローカルAIマスターセミナーの詳細を確認する

無料メルマガで学習を続ける

Linuxの実践スキルをメールで毎週お届け。
登録は1分、解除もいつでも可。

登録無料・いつでも解除できます

暗記不要・1時間後にはサーバーが動く

3,100名以上が実践した「型」を無料で公開中

プロのエンジニアはコマンドを暗記していません。
「現場で使える型」を効率よく使いこなしているだけです。
その「型」を図解60Pにまとめた入門マニュアルを、完全無料でプレゼントしています。

登録10秒／合わなければ解除3秒／詳細はこちら

Linux無料マニュアル（図解60P）名前とメールで30秒登録

この記事を書いた人

宮崎智広（みやざきともひろ）

株式会社イーネットマーキュリー代表。現役のLinuxサーバー管理者として20年以上の実務経験を持ち、これまでに累計3,100名以上のエンジニアを指導してきたLinux教育のプロフェッショナル。「現場で本当に使える技術」を体系的に伝えることをモットーに、実践型のLinuxセミナーの開催や無料マニュアルの配布を通じてLinux人材の育成に取り組んでいる。

趣味は、キャンプにカメラ、トラウト釣り。好きな食べ物は、ラーメンにお酒。休肝日が作れない、酒量を減らせないのが悩み。最近、ドラマ「フライトエンジェル」を観て涙腺が崩壊しました。

前のページへ：Ubuntu ServerでGPUを使ってローカルLLMを動かす方法｜nvidia-smi・CUDA・ドライバ導入で挫折しない手順
この記事の属するカテゴリ：ローカルLLMへ戻る