業務効率化のために Gemini や ChatGPT を使いたいけれど「社外秘データや個人情報があるから会社では使えない……」と諦めていませんか?
そんなビジネスパーソンにおすすめなのが、インターネットにデータを送信せず、自分のパソコン内だけでAIを動かす「ローカルLLM」です。
世界中の開発者が AIモデルを公開しています。その AIモデルをダウンロードすることで、自分のパソコンで AI を動かすことができます。
今回は、初心者でも簡単にローカルAI環境を作れる無料ソフト「LM Studio」の使い方までを分かりやすく解説します。
ローカルLLMの特徴
ローカルLLM とは、インターネット上のサーバではなく、自分のパソコン上で AI を動かす仕組みのことです。
ネットにつながっていない状態でも動作するため、社内文章や個人情報を読み込ませても、データがインターネットの向こう側へ送信されることはありません。
一方で、AI として有名な Gemini や ChatGPT などは各事業者のデータセンターにある巨大なサーバで実行されます。
そのため、圧倒的な処理スピードや賢さを持つ反面、入力した情報が事業者のサーバへ送信されるため、機密情報などを扱うには細心の注意が必要になります。
ローカルLLM は、自分のパソコン内だけで処理が完結するため、そういった心配をする必要がありません。
- オフラインで使える
- 個人情報を外部送信しない
- API 料金が不要
- モデルを自由に変更できる
- インターネット通信が不要なのでレスポンスが高速な場合がある
- AI を快適に実行させるにはスペックの高いパソコンが必要
- モデルサイズが大きい
- 日本語性能はモデルに依存する
高性能な AI を実行するには、確かにスペックの高いパソコンが必要です。
しかし、非常に軽量化された AIモデルも多く公開されています。
モデル選びを工夫すれば、一般的なパソコンでも十分に AI を体験することができます。
まずはインストールして試してみましょう。
LM Studioをインストールする
ローカルLLM を使うためには、AI をコントロールする専用のソフトが必要になります。
代表的なものには「LM Studio」や「Ollama」などがありますが、今回は「LM Studio」をインストールします。
LM Studio は無料で利用でき、コマンドプロンプトなどの黒い画面での操作が不要で、わかりやすいユーザーインターフェースで使うことができます。
- LM Studio公式サイトにアクセスして、インストーラーをダウンロードします。
- ダウンロードしたファイルを実行し、画面の指示に従って、LM Studio をインストールします。
実際に、Windows11 のパソコンに 「LM Studio 0.4.13」をインストールしてみます。
「Get Started」をクリックします。

「Your first model」で AIモデルをダウンロードできますが、あとでダウンロードするので、ここでは「Skip for now」をクリックします。

「Advanced settings」は、そのままで「Continue to LM Studio」をクリックします。

インストールできました。

モデルをダウンロードする
LM Studioのインストールが終わったら、次は「AIの脳」にあたるモデルをダウンロードします。
イメージとしては「LM Studio」がゲーム機本体で、「モデル」がゲームソフトのような関係です。
本体だけでは遊べないので、ソフト(モデル)を追加します。
モデルをダウンロードするために LM Studio の画面左側にあるメニューから「Search Model」をクリックします。

今回は Google が開発した軽量で高性能な「Gemma」を探してみましょう。
検索バーに「Gemma」を入力します。
検索結果からモデルをクリックすると「Download」の左側にパソコンのスペックに応じた診断メッセージが表示されます。
- 赤色や黄色の警告:パソコンのスペックに対して AI のデータが大きすぎる可能性があります。動作が非常に重くなるため、避けた方が良いです。
- 緑色の表示:パソコンのスペックで AI を快適に動作するサインです。
「Gemma 4 E4B」は、「Likely too large」パソコンのスペックに対して大きすぎるようです。

AIモデルには「1B」「4B」「7B」などのサイズがあります。
この数字が大きいほど高性能になる傾向がありますが、その分スペックが必要になります。
「4B」より小さいもので「FULL GPU Offload Possible」と表示された「Gemma 3 1B」をダウンロードしました。

「Gemma」以外では、アリババの「Qwen」や、Metaの「Llame」が有名です。
オフラインのパソコンにモデルを追加する
LM Studio をインストールしたパソコンがオフライン環境の場合でも、別のネットにつながるパソコンがあれば、AI のデータファイル(GGUF形式)をダウンロードして、そのファイルをオフラインのパソコンに移動することで AI を動かすことが可能です。
GGUFは、GPT-Generated Uniied Format の略で、AI のモデルをローカル環境で効率的に動かすために開発されたファイル形式です。
モデルのファイル名には「Q4_K_M」「Q5_K_M」「Q8_0」などが書かれています。
これは、AI の「量子化(データの圧縮率)」をあらわしており、簡単には次のようなイメージです。
- Q4_K_M:最も一般的な標準モデルで、動作も快適でバランスが良い。
- Q5_K_M:Q4 よりも少しデータが精密で、やや高精度。
- Q8_0:圧縮率が低く非常に高精度だが、パソコンへの負荷も大きい。
GGUFファイルをダウンロードするために、ネットにつながるパソコンで、世界中の AIモデルが集まるサイト「Hugging Face」にアクセスします。
使いたいモデルの GGUF ファイルをダウンロードし、USBメモリなどでオフラインのパソコンへ移します。
ダウンロードした GGUFファイルを次のフォルダに置くことで、LM Studio でそのモデルを使えるようになります。
~/.lmstudio/models/
└── publisher/
└── model/
└── model-file.ggufたとえば、Hugging Face から「bartowski/Llama-3.2-1B-Instruct-GGUF」の「Llama-3.2-1B-Instruct-Q8_0.gguf」をダウンロードした場合、次のようなフォルダを作成して配置します。

使ってみる
モデルのダウンロードが終われば、いよいよ AI と会話をしてみましょう。
LM Studio の画面左側のメニューで「Chat」を開き「New chat」をクリックします。

新しいチャットができるので「Pick a model」から、先ほどダウンロードした「Gemma 3 1B」などのモデルを選択します。
モデルの Setting 画面が表示されますが、今回は何も変えずに、そのまま「Load Model」をクリックします。

モデルの読み込みが終われば、チャットに入力するだけです。
AI は、パソコン内で実行されるので、完全にオフラインにしても作業することができます。
RAG(資料読み込み機能)を使ってみる
RAG とは、「Retrieval Augmented Generation」の略で、AI に手元の資料を読ませて、その内容をベースに回答させる仕組みのことです。
LM Studio には、PDFやテキストファイルを読み込ませて会話ができる RAG 機能が最初から備わっています。
「マニュアル」や「ガイドライン」などのファイルを読み込ませることで、外部にデータを漏らすことなく、知的な検索アシスタントを作ることができます。
RAG の使い方
- チャットを開き、モデルを読み込ませます。
- チャット入力欄のすぐ上にある「+」ボタンをクリックします。
- AI に読み込ませたいファイルを選択します。ファイルは5つまで(合計30MB)アップロードすることができます。
- ファイルを選択すると、LM Studio が自動的にファイルを解析し、AI が検索しやすい状態にします。
- 読み込みが完了したら、「添付した資料をもとに、○○について教えて」と質問するだけです。
チャットデータの保存場所
LM Studio でやり取りした会話データは、クラウド上ではなく、すべて自分のパソコン内に保存されます。
チャットを右クリックし「Show in File Explorer」をクリックすることで、チャットの会話データの保存場所を確認することができます。
Windowsの場合、具体的な保存場所は以下のとおりです。
%USERPROFILE%\.lmstudio\conversations会話データは、ただのテキストデータ(JSON形式など)なので、手動でコピーしてバックアップしたり、不要になったら削除することも簡単です。
サーバーとして実行する
LM Studio のもう一つの強力な機能が「ローカルサーバー」としても実行できる点です。
自作のプログラム(Python など)から AI を呼び出して処理を自動化する場合は、「Ollama」などのツールが使われることが多いです。
しかし、LM Studio でもアプリをバックグラウンドで起動させておくことで、簡単に「AIサーバー」に変身させることができます。
サーバーの起動方法
- LM Studio の画面左側のメニューから「Developer」をクリックします。
- 画面上部にある「Status: Stopped」をクリックすると、表示が「Status: Running」になりサーバーが起動します。

サーバーが起動しているか確認するために、ブラウザで次のURLにアクセスします。
http://127.0.0.1:1234/v1/models接続に成功すると、以下のような画面が表示されます。
{
"data": [
{
"id": "google/gemma-3-1b",
"object": "model",
"owned_by": "organization_owner"
},
{
"id": "llama-3.2-1b-instruct",
"object": "model",
"owned_by": "organization_owner"
},
{
"id": "text-embedding-nomic-embed-text-v1.5",
"object": "model",
"owned_by": "organization_owner"
}
],
"object": "list"
}この状態になれば、OpenAI の API と同じ規格(互換API)を使って、ローカルAI を呼び出すことができます。
同じ社内ネットワーク(LAN)のほかのパソコンからも、この AI を使わせたい場合は「Server Settings」内にある「Server on Local Network」をオンにします。
