【完全ローカル】機密情報も安全!LM Studioで始めるローカルLLM構築・活用ガイド

seagul-brain AI

業務効率化のために Gemini や ChatGPT を使いたいけれど「社外秘データや個人情報があるから会社では使えない……」と諦めていませんか?

そんなビジネスパーソンにおすすめなのが、インターネットにデータを送信せず、自分のパソコン内だけでAIを動かす「ローカルLLM」です。

世界中の開発者が AIモデルを公開しています。その AIモデルをダウンロードすることで、自分のパソコンで AI を動かすことができます。

今回は、初心者でも簡単にローカルAI環境を作れる無料ソフト「LM Studio」の使い方までを分かりやすく解説します。

ローカルLLMの特徴

ローカルLLM とは、インターネット上のサーバではなく、自分のパソコン上で AI を動かす仕組みのことです。

ネットにつながっていない状態でも動作するため、社内文章や個人情報を読み込ませても、データがインターネットの向こう側へ送信されることはありません。

一方で、AI として有名な Gemini や ChatGPT などは各事業者のデータセンターにある巨大なサーバで実行されます。

そのため、圧倒的な処理スピードや賢さを持つ反面、入力した情報が事業者のサーバへ送信されるため、機密情報などを扱うには細心の注意が必要になります。

ローカルLLM は、自分のパソコン内だけで処理が完結するため、そういった心配をする必要がありません。

ローカルLLMのメリット
  • オフラインで使える
  • 個人情報を外部送信しない
  • API 料金が不要
  • モデルを自由に変更できる
  • インターネット通信が不要なのでレスポンスが高速な場合がある
ローカルLLMのデメリット
  • AI を快適に実行させるにはスペックの高いパソコンが必要
  • モデルサイズが大きい
  • 日本語性能はモデルに依存する

高性能な AI を実行するには、確かにスペックの高いパソコンが必要です。

しかし、非常に軽量化された AIモデルも多く公開されています。

モデル選びを工夫すれば、一般的なパソコンでも十分に AI を体験することができます。

まずはインストールして試してみましょう。

LM Studioをインストールする

ローカルLLM を使うためには、AI をコントロールする専用のソフトが必要になります。

代表的なものには「LM Studio」や「Ollama」などがありますが、今回は「LM Studio」をインストールします。

LM Studio は無料で利用でき、コマンドプロンプトなどの黒い画面での操作が不要で、わかりやすいユーザーインターフェースで使うことができます。

  1. LM Studio公式サイトにアクセスして、インストーラーをダウンロードします。
  2. ダウンロードしたファイルを実行し、画面の指示に従って、LM Studio をインストールします。

実際に、Windows11 のパソコンに 「LM Studio 0.4.13」をインストールしてみます。

「Get Started」をクリックします。

LMStudio-Get-Started

「Your first model」で AIモデルをダウンロードできますが、あとでダウンロードするので、ここでは「Skip for now」をクリックします。

LMStudio-Your-First-Model

「Advanced settings」は、そのままで「Continue to LM Studio」をクリックします。

LMStudio-Advanced-Settings

インストールできました。

LMStudio-Install

モデルをダウンロードする

LM Studioのインストールが終わったら、次は「AIの脳」にあたるモデルをダウンロードします。

イメージとしては「LM Studio」がゲーム機本体で、「モデル」がゲームソフトのような関係です。

本体だけでは遊べないので、ソフト(モデル)を追加します。

モデルをダウンロードするために LM Studio の画面左側にあるメニューから「Search Model」をクリックします。

LMStudio-Search-Modl

今回は Google が開発した軽量で高性能な「Gemma」を探してみましょう。

検索バーに「Gemma」を入力します。

検索結果からモデルをクリックすると「Download」の左側にパソコンのスペックに応じた診断メッセージが表示されます。

  • 赤色や黄色の警告:パソコンのスペックに対して AI のデータが大きすぎる可能性があります。動作が非常に重くなるため、避けた方が良いです。
  • 緑色の表示:パソコンのスペックで AI を快適に動作するサインです。

「Gemma 4 E4B」は、「Likely too large」パソコンのスペックに対して大きすぎるようです。

LMStudio-too-Large

AIモデルには「1B」「4B」「7B」などのサイズがあります。

この数字が大きいほど高性能になる傾向がありますが、その分スペックが必要になります。

「4B」より小さいもので「FULL GPU Offload Possible」と表示された「Gemma 3 1B」をダウンロードしました。

LMStudio-FULL-GPU-Offload-Possible

「Gemma」以外では、アリババの「Qwen」や、Metaの「Llame」が有名です。

オフラインのパソコンにモデルを追加する

LM Studio をインストールしたパソコンがオフライン環境の場合でも、別のネットにつながるパソコンがあれば、AI のデータファイル(GGUF形式)をダウンロードして、そのファイルをオフラインのパソコンに移動することで AI を動かすことが可能です。

GGUFは、GPT-Generated Uniied Format の略で、AI のモデルをローカル環境で効率的に動かすために開発されたファイル形式です。

モデルのファイル名には「Q4_K_M」「Q5_K_M」「Q8_0」などが書かれています。

これは、AI の「量子化(データの圧縮率)」をあらわしており、簡単には次のようなイメージです。

  • Q4_K_M:最も一般的な標準モデルで、動作も快適でバランスが良い。
  • Q5_K_M:Q4 よりも少しデータが精密で、やや高精度。
  • Q8_0:圧縮率が低く非常に高精度だが、パソコンへの負荷も大きい。

GGUFファイルをダウンロードするために、ネットにつながるパソコンで、世界中の AIモデルが集まるサイト「Hugging Face」にアクセスします。

使いたいモデルの GGUF ファイルをダウンロードし、USBメモリなどでオフラインのパソコンへ移します。

ダウンロードした GGUFファイルを次のフォルダに置くことで、LM Studio でそのモデルを使えるようになります。

~/.lmstudio/models/
└── publisher/
    └── model/
        └── model-file.gguf

たとえば、Hugging Face から「bartowski/Llama-3.2-1B-Instruct-GGUF」の「Llama-3.2-1B-Instruct-Q8_0.gguf」をダウンロードした場合、次のようなフォルダを作成して配置します。

LMStudio-model-folder

使ってみる

モデルのダウンロードが終われば、いよいよ AI と会話をしてみましょう。

LM Studio の画面左側のメニューで「Chat」を開き「New chat」をクリックします。

LMStudio-Chat

新しいチャットができるので「Pick a model」から、先ほどダウンロードした「Gemma 3 1B」などのモデルを選択します。

モデルの Setting 画面が表示されますが、今回は何も変えずに、そのまま「Load Model」をクリックします。

LMStudio-Load-Model

モデルの読み込みが終われば、チャットに入力するだけです。

AI は、パソコン内で実行されるので、完全にオフラインにしても作業することができます。

RAG(資料読み込み機能)を使ってみる

RAG とは、「Retrieval Augmented Generation」の略で、AI に手元の資料を読ませて、その内容をベースに回答させる仕組みのことです。

LM Studio には、PDFやテキストファイルを読み込ませて会話ができる RAG 機能が最初から備わっています。

「マニュアル」や「ガイドライン」などのファイルを読み込ませることで、外部にデータを漏らすことなく、知的な検索アシスタントを作ることができます。

RAG の使い方

  1. チャットを開き、モデルを読み込ませます。
  2. チャット入力欄のすぐ上にある「+」ボタンをクリックします。
  3. AI に読み込ませたいファイルを選択します。ファイルは5つまで(合計30MB)アップロードすることができます。
  4. ファイルを選択すると、LM Studio が自動的にファイルを解析し、AI が検索しやすい状態にします。
  5. 読み込みが完了したら、「添付した資料をもとに、○○について教えて」と質問するだけです。

チャットデータの保存場所

LM Studio でやり取りした会話データは、クラウド上ではなく、すべて自分のパソコン内に保存されます。

チャットを右クリックし「Show in File Explorer」をクリックすることで、チャットの会話データの保存場所を確認することができます。

Windowsの場合、具体的な保存場所は以下のとおりです。

%USERPROFILE%\.lmstudio\conversations

会話データは、ただのテキストデータ(JSON形式など)なので、手動でコピーしてバックアップしたり、不要になったら削除することも簡単です。

サーバーとして実行する

LM Studio のもう一つの強力な機能が「ローカルサーバー」としても実行できる点です。

自作のプログラム(Python など)から AI を呼び出して処理を自動化する場合は、「Ollama」などのツールが使われることが多いです。

しかし、LM Studio でもアプリをバックグラウンドで起動させておくことで、簡単に「AIサーバー」に変身させることができます。

サーバーの起動方法

  1. LM Studio の画面左側のメニューから「Developer」をクリックします。
  2. 画面上部にある「Status: Stopped」をクリックすると、表示が「Status: Running」になりサーバーが起動します。
LMStudio-Developer

サーバーが起動しているか確認するために、ブラウザで次のURLにアクセスします。

http://127.0.0.1:1234/v1/models

接続に成功すると、以下のような画面が表示されます。

{
  "data": [
    {
      "id": "google/gemma-3-1b",
      "object": "model",
      "owned_by": "organization_owner"
    },
    {
      "id": "llama-3.2-1b-instruct",
      "object": "model",
      "owned_by": "organization_owner"
    },
    {
      "id": "text-embedding-nomic-embed-text-v1.5",
      "object": "model",
      "owned_by": "organization_owner"
    }
  ],
  "object": "list"
}

この状態になれば、OpenAI の API と同じ規格(互換API)を使って、ローカルAI を呼び出すことができます。

同じ社内ネットワーク(LAN)のほかのパソコンからも、この AI を使わせたい場合は「Server Settings」内にある「Server on Local Network」をオンにします。

参考

タイトルとURLをコピーしました