Open WebUI 完全攻略
インストールから使いこなしまで
Ollamaに「顔」をつける。無料でChatGPT超えのローカルAI画面が5分で手に入る。
Web検索・画像解析・複数モデル切替・RAGまで全機能を完全解説。
📋 目次
🖥️ Open WebUIとは何か?何ができるのか
Ollamaに「目・耳・顔」をつけるフロントエンド。これがなければAIは動かせない。
Ollamaは「エンジン」、Open WebUIは「コックピット」
Ollama単体ではコマンドライン(黒い画面)でしか操作できない。Open WebUIを入れた瞬間、ChatGPTそっくりのチャット画面がブラウザで使えるようになる。しかもWeb検索・画像添付・会話履歴・複数モデル切替・ユーザー管理まで全部無料。これがあなたの「ローカルChatGPT」の完成形だ。
チャットUI
ChatGPTと同じ感覚で使える
Web検索
最新情報をリアルタイム検索
画像解析
画像を貼って質問できる
モデル切替
LLaMA・Mistral等を瞬時に切替
RAG対応
PDFを読み込んで質問できる
マルチユーザー
家族・チームで共有利用可能
Open WebUIはGitHubスター数8万超えの超人気OSS
2024年に登場して爆速で普及。現在のローカルAI環境のデファクトスタンダード。世界中のエンジニア・研究者・ホビイストが使っている実績あるツールで、アップデートも活発だ。
🔍 必要なものと前提条件チェックリスト
インストール前に確認すべき環境要件を全て整理する。ここを飛ばすと詰まる。
まず自分のPCスペックを確認しよう
Open WebUI自体は軽量だが、Ollamaで動かすAIモデルがGPUまたはCPUリソースを大量消費する。快適に使うための最低限スペックを確認しておこう。
💻 推奨スペック一覧
| 項目 | 最低限(動く) | 推奨(快適) | 最強(爆速) |
|---|---|---|---|
| 🖥️ OS | Windows 10 / macOS 12 / Ubuntu 20 | Windows 11 / macOS 13+ | Ubuntu 22 / WSL2 |
| 💾 RAM | 8GB(7B小モデルのみ) | 16GB | 32GB以上 |
| 🎮 GPU | なしでも動く(CPUのみ・低速) | NVIDIA RTX 3060以上 | RTX 4070以上(爆速) |
| 💿 ストレージ | 20GB以上の空き容量 | 50GB以上 | 100GB以上(SSD推奨) |
| 🐳 Docker | Docker Desktop(推奨)または pip でもOK | ||
Ollama
ollama.com からダウンロード
Open WebUIの前に必ずOllamaをインストールしておく必要がある。Ollamaが動いていないとOpen WebUIは起動しても意味がない。
Docker Desktop
docker.com からダウンロード
Open WebUIをDockerで動かすのが最も安定・簡単。Dockerを使わないpipインストールも可能だが、初心者はDockerを強くすすめる。
ブラウザ(Chrome推奨)
Google Chrome / Firefox / Edge
Open WebUIはブラウザで操作する。インストール後は localhost:3000 にアクセスするだけ。アプリのインストールは不要。
MacユーザーはApple Silicon(M1/M2/M3)でもGPUアクセラレーションが効く。OllamaがApple Metalに対応しているため、GPU非搭載でもWindowsより快適に動作することが多い。MacユーザーはGPUの心配は不要。
🦙 STEP 1:Ollamaをインストールする
まずエンジンを積む。Open WebUIより先に必ずこちらを終わらせること。
Ollamaのインストールは拍子抜けするほど簡単
公式サイト ollama.com からインストーラーをダウンロードするか、1行のコマンドを実行するだけ。5分もあれば完了する。OS別の手順を以下に示す。
💻 OS別 Ollamaインストール手順
# または PowerShell で:
winget install Ollama.Ollama
② インストール完了後、タスクバーにOllamaアイコンが表示されれば成功# 動作確認:
ollama –version
# または Homebrew で:
brew install ollama
② メニューバーにOllamaのアイコンが出れば成功。自動でバックグラウンド起動する。# 動作確認:
ollama –version
curl -fsSL https://ollama.com/install.sh | sh
② 自動的にsystemdサービスとして登録される。動作確認:ollama –version
systemctl status ollama
🧠 AIモデルをダウンロードする(必須)
Ollamaはエンジンだけで、モデル(頭脳)は別途ダウンロードが必要。以下のコマンドを実行する。
ollama pull llama3.2
画像認識対応モデル(Vision)→ 画像解析したい場合に追加ollama pull llava
軽量高速モデル(RAM 4GB〜)→ スペックが低い場合ollama pull phi3
モデル一覧を確認:ollama list
ターミナルで ollama list を実行してモデル名が表示されれば、Ollamaのセットアップは完了。次のステップへ進もう。
🐳 STEP 2:Open WebUIをインストールする
Docker 1コマンドで完了。これが世界で最も簡単なAI画面の構築方法だ。
推奨はDockerインストール一択
Open WebUIのインストール方法は「Docker」と「pip(Python)」の2種類ある。初心者には断然Dockerを推奨。コマンド1行で全ての依存関係が解決し、アップデートも簡単。pip方式はPython環境の依存で詰まることがある。
🐳 方法① Docker(推奨)でのインストール
【前提】Docker Desktopが起動していることを確認してから実行
docker run -d -p 3000:8080 –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui –restart always ghcr.io/open-webui/open-webui:main
🎮 NVIDIA GPU を使いたい場合(CUDA 対応):docker run -d -p 3000:8080 –gpus all –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui –restart always ghcr.io/open-webui/open-webui:cuda
起動確認(ブラウザでアクセス):http://localhost:3000
※ 初回起動時は数分かかる場合がある(Dockerイメージのダウンロード)
🐍 方法② pip(Python)でのインストール
Dockerを使いたくない場合。Python 3.11以上が必要。
pip install open-webui
② 起動:open-webui serve
③ ブラウザでアクセス:http://localhost:8080
DockerとOllamaを別々に動かす構成(Ollamaはホスト側、Open WebUIはDockerコンテナ内)では、--add-host=host.docker.internal:host-gateway オプションが必須。これを忘れると「Ollamaに接続できない」エラーが発生する。コマンドをそのままコピーすれば問題ない。
🔧 Open WebUI ↔ Ollama の接続構造
🔑 STEP 3:初回セットアップとログイン
初めてアクセスしたときの画面の流れを全部説明する。迷わず完了できる。
🌐 ブラウザで http://localhost:3000 にアクセス
Open WebUIのトップ画面が表示される。初回はアカウント登録画面になる。pipインストールの場合は localhost:8080 になる。
👤 管理者アカウントを作成する
「Sign Up(新規登録)」をクリック。名前・メールアドレス・パスワードを入力して登録。最初に登録したアカウントが自動的に管理者(Admin)になる。このアカウントは全設定にアクセスできる。
🦙 Ollamaへの接続を確認する
ログイン後の画面左上にモデル選択欄が表示されていれば接続成功。何も表示されない・エラーが出る場合は「Settings → Connections → Ollama URL」を確認し、http://host.docker.internal:11434 を設定する。
💬 最初のチャットを試してみる
左上のモデル選択欄から「llama3.2」などをクリックして選択。テキストボックスに「こんにちは」と入力してEnter。AIが返答すれば完全に成功だ。ここまで来たらChatGPTと同じ操作感で使える。
ブラウザでチャットができれば環境構築は完了。次からはPCを起動するたびにDockerが自動起動し、localhost:3000 にアクセスするだけで使えるようになる(--restart always オプションの効果)。
🤖 モデルの追加・切り替え方法
複数のAIモデルを使い分けるのがOllama + Open WebUIの真骨頂。全部解説する。
モデルを目的別に使い分けるのが正解
ChatGPTは1つのモデルしか使えないが、Ollama + Open WebUIなら用途に応じて最適なモデルを瞬時に切り替えられる。コーディング・日本語会話・画像認識・高速応答など、それぞれ得意なモデルが違う。
➕ Open WebUIからモデルを追加する方法
【方法A】Open WebUI の画面から直接追加
Settings(歯車アイコン)→ Models → 検索欄に「llama3」などと入力 → 「Pull」ボタンをクリック。画面操作だけでモデルをダウンロードできる。最も簡単。
【方法B】ターミナルのコマンドで追加
ターミナルで ollama pull モデル名 を実行。追加後は自動的にOpen WebUIのモデル一覧に表示される。
llama3.2 / llama3.3
Meta製・最新版
日本語の精度が高く、会話・要約・翻訳・コーディングに幅広く対応。最初に入れるべき定番モデル。3Bは軽量版、8Bが標準、70Bは高性能。
llava / llava-llama3
LLaVA Project
画像を貼り付けてAIに質問できるVisionモデル。「この画像に何が写っている?」「このスクリーンショットの問題は?」など。セキュリティ調査にも使える。
phi3 / phi3.5
Microsoft製
RAM 4GBでも動く超軽量モデル。スペックが低いPCや、とにかく速い応答が欲しい用途に最適。コーディング補助にも強い。
qwen2.5 / qwen2.5-coder
Alibaba製
中国製だが日本語・英語・コーディングすべての精度が非常に高い。7Bでも驚くほどの品質を出す。日本語会話ならllama3.2と双璧。
mistral / mixtral
Mistral AI(フランス製)
欧州産の高品質LLM。指示への忠実さが高く、セキュリティレポート生成・コード解析・脅威分析に向く。Mixtralは8つの専門家モデルを組み合わせたMoE構造で高性能。
gemma2 / gemma3
Google DeepMind製
GoogleのGeminiを蒸留したローカル版。2Bモデルが非常に軽快かつ高品質で、低スペックPCでも意外な能力を発揮する。用途を問わず使える万能型。
モデルの切り替えはチャット画面の左上1クリックで完了
Open WebUIの画面左上にモデル選択ドロップダウンがある。会話の途中でも切り替え可能。複数モデルを比較しながら使うことも、1つのチャットで複数モデルに同じ質問を投げることもできる(マルチモデル機能)。
🌐 Web検索の設定と使い方
ローカルAIの弱点「最新情報を知らない」を、Web検索で完全に克服する。
Web検索連携でローカルAIが「今」を知る
Ollamaのモデルは学習カットオフ以降の情報を知らない。しかしWeb検索を有効にすれば、「今日のニュース」「最新の脆弱性情報」「リアルタイムの株価」も取得できる。Open WebUI は複数の検索エンジンに対応している。
⚙️ Settings → Web Search を開く
Open WebUIの画面左下にある「Settings(歯車アイコン)」をクリック → 「Web Search」タブを選択。
🔧 検索エンジンを選択する
以下の中から使いたいエンジンを選ぶ。最も手軽なのはDuckDuckGo(APIキー不要)。より高品質な結果が欲しい場合はSerpAPI・Brave Search APIを使う。
✅ Web Search を「有効」に切り替えて保存
トグルスイッチをONにしてSave。チャット画面に「🌐」アイコンが表示されるようになる。
🧪 テストしてみる
チャット画面下部の「🌐」ボタンをクリックしてONにし、「今日の日本のニュースを教えて」と入力。Web検索を実行して最新情報を答えてくれれば成功。
🔎 対応検索エンジン比較
| 検索エンジン | APIキー | 無料枠 | 品質 | おすすめ用途 |
|---|---|---|---|---|
| DuckDuckGo | ✅ 不要 | ✅ 完全無料 | △ 普通 | お試し・軽い調査 |
| Brave Search | 要取得(無料) | 月2,000回 | ○ 高め | プライバシー重視・日常利用 |
| SearXNG(セルフホスト) | ✅ 不要 | ✅ 完全無料 | ○ 高め | プライバシー最重視・自前運用 |
| Serper(Google系) | 要取得(有料) | 月2,500回(無料) | ◎ 最高 | Google品質を求める場合 |
| Tavily | 要取得 | 月1,000回 | ◎ AI向け最適化 | AIエージェントとの連携 |
セキュリティ研究者には SearXNG セルフホストが最強
SearXNGは自分のPC/サーバーでDockerで動かせるメタ検索エンジン。APIキー不要・無制限・Google/Bingなど複数エンジンを同時検索。検索クエリが外部に一切記録されないため、機密調査にも安心して使える。
🖼️ 画像認識(Vision)の設定と使い方
画像をAIに「見せる」だけ。フィッシング判定からOCRまで全部できる。
画像をドラッグ&ドロップするだけで解析できる
VisionモデルをOllamaにインストールしてOpen WebUIで選択するだけ。追加設定はほぼ不要。スクリーンショット・写真・グラフ・PDFのスキャン画像など、あらゆる画像にAIが答えてくれる。
🧠 Visionモデルをダウンロードする
ターミナルで ollama pull llava または ollama pull llava-llama3 を実行。高精度を求めるなら ollama pull qwen2-vl が最強。
🔄 Open WebUIでVisionモデルに切り替える
チャット画面左上のモデル選択から 「llava」または「qwen2-vl」を選ぶ。通常のllama3.2では画像を受け付けないので、必ずVision対応モデルに切り替えること。
📎 画像をアップロードして質問する
テキスト入力欄の左にあるクリップアイコンをクリック → 画像ファイルを選択(またはドラッグ&ドロップ)→ 質問を入力してEnter。画像を認識して回答が返ってくる。
🎣 フィッシング判定
- 怪しいメールのスクリーンショットを貼る
- 「このメールはフィッシングか?」と聞く
- URLの偽装・ロゴの模倣を検出
📄 OCR・文字抽出
- 紙の書類をスキャンして貼る
- 「この書類の内容を文字にして」
- 手書き文字の認識も可能
📊 グラフ・図表分析
- 売上グラフを貼り付ける
- 「このグラフから傾向を分析して」
- データの読み取りと考察を自動化
🔒 セキュリティ画面解析
- 不審なエラー画面をスクショ
- 「これは何の攻撃か?」と聞く
- ログやコンソール画面の解析も
画像解析はGPUが大幅に速度を左右する。GPU搭載PCなら5〜10秒で応答するが、CPU専用だと30秒〜数分かかる場合がある。画像解析を多用するなら、VRAM 8GB以上のGPU環境を強くすすめる。
🔧 よくあるエラーと解決方法
詰まったらここを見ろ。9割のトラブルはここで解決する。
「Ollamaに接続できない」
Connection refused / Unable to connect to Ollama
最も多いエラー。原因は3つ:① Ollamaが起動していない ② DockerからOllamaのURLが間違っている ③ ファイアウォールがブロックしている。
回答が遅い・タイムアウトする
応答に数分かかる・途中で止まる
原因はほぼ100%「GPUが使われていない(CPU処理になっている)」か「モデルサイズがRAMに収まっていない」。
モデルが一覧に出てこない
モデル選択ドロップダウンが空
OllamaにモデルがDLされていないか、OllamaとOpen WebUIの接続が確立できていない。
Web検索が動かない
検索しても古い情報しか返ってこない
チャット画面下部のWeb検索トグルがOFFになっているか、検索エンジンのAPIキーが間違っている。
Windowsで「OllamaがGPUを認識しない」場合は、OllamaをWSL2(Windows Subsystem for Linux)の中で動かすことを検討しよう。WSL2 + CUDA環境ではGPUアクセラレーションが安定して効くことが多い。WSL2のセットアップは別記事で解説予定。
🚀 次のステップ:さらに強化する
Open WebUIが動いたら次は何をすべきか。拡張ロードマップを全公開する。
Open WebUI は「出発点」にすぎない
ここまでで「ローカルChatGPT」は完成した。しかし本当の力は周辺ツールと組み合わせることで指数関数的に膨らむ。以下に拡張のロードマップを示す。
📚 AnythingLLMを追加 → PDF・社内文書AIへ進化
AnythingLLMはOllamaをバックエンドに使ったRAGシステム。PDFやWordをドラッグするだけでAIが内容を記憶し、「この契約書の第5条は?」と自然言語で聞けるようになる。次のステップはここ。
⚙️ n8nを追加 → 完全自動化AIへ進化
n8nはノーコードの自動化ツール。「毎朝6時にセキュリティニュースを収集→Ollamaで要約→Slack通知」という自動パイプラインが、コードなしで作れる。情報収集の完全自動化はここから。
🤖 OpenHandsを追加 → AIエージェントへ進化
AIが自律的にブラウザ・ファイル・コードを操作する最終形態。「この脅威レポートを調査して、Excel集計してPDFにまとめて」という指示一発で全部やってくれる。Ollamaの最終到達点。
🛡️ 全スタック統合 → 家庭用SOC完成
全ツールを統合すると「脅威情報の自動収集→AI分析→IOC検知→通知」という24時間稼働のセキュリティ監視システムが完成する。これがOllamaスタックの最終形態・家庭用SOCだ。
📊 Open WebUI 機能まとめ早見表
| 機能 | 設定難度 | APIキー必要? | ひとこと |
|---|---|---|---|
| 💬 チャット | ★☆☆ 超簡単 | 不要 | インストールしたらすぐ使える |
| 🤖 モデル切替 | ★☆☆ 超簡単 | 不要 | ドロップダウン1クリック |
| 🖼️ 画像解析 | ★★☆ 普通 | 不要 | Visionモデルのpullのみ必要 |
| 🌐 Web検索 | ★★☆ 普通 | エンジンによる | DuckDuckGoなら設定だけ |
| 📚 PDFアップロード | ★☆☆ 超簡単 | 不要 | Open WebUI内で直接アップ可能 |
| 👥 マルチユーザー | ★★★ やや複雑 | 不要 | Admin設定画面で管理 |
この記事の手順通りに進めれば、最短15分でChatGPT相当のローカルAI環境が完成する。Ollama + Open WebUI の組み合わせは、2026年現在のローカルAI構築における最もコスパの高い選択肢だ。次はAnythingLLMでPDF記憶機能を追加しよう。
Ollama単体でも ollama run llama3.2 とターミナルに打てば会話はできます。ただ、それだと以下の問題があります。 ターミナルでできないことが、Open WebUIでできるようになります。 会話履歴の保存・検索ができません。ターミナルは画面を閉じたら消える。Open WebUIはブラウザのChatGPTみたいに過去の会話が全部残って検索できます。 画像を貼り付けられません。ターミナルはテキストのみ。Open WebUIならスクリーンショットをドラッグするだけで画像解析できます。 複数モデルを簡単に切り替えられません。ターミナルだとモデルごとにコマンドを打ち直す必要があります。Open WebUIはドロップダウン1クリック。 Web検索との統合ができません。Open WebUIはDuckDuckGoやBrave Searchと繋いで「今日のニュース」を検索しながら回答できます。 PDFをアップロードして質問できません。ターミナルではファイルをそのまま食わせられない。 複数人で使えません。家族やチームで同じAI環境を共有したいなら、Open WebUIのマルチユーザー管理が必要です。 一言でまとめると、「ターミナルで1人でテストする」ならOllama単体で十分。「実際に日常使いする・業務で使う・家族と使う」ならOpen WebUIが必須、という感じです。 ChatGPTが使いやすいのはUIがあるからで、Ollamaも同じ理由でUIが必要になります。


コメント