1億円分の無駄を削減!OpenClaw の Token 消費を 10 分の 1 にする完全手順

OpenClaw を使っているなら、token 消費の速さをすでに実感しているはずです。
特に Claude ユーザーは、数ラウンド会話しただけで limit に到達しがちです。

さらに、多くのケースで agent が無関係な情報まで context に詰め込み、
コストが増えるだけでなく、精度も下がるという問題が起きています。

では、
agent に「必要なことだけを正確に思い出させ」、
しかも 完全にゼロコストで運用する方法はあるのでしょうか。

あります。

qmd —— ローカル実行、永久無料、精度 95% 以上。

GitHub: https://github.com/tobi/qmd


qmd とは

qmd は Shopify 創業者の Tobi が開発した、
AI Agent 向けに設計されたローカル実行型の意味検索エンジンです。
Rust 製で、高速かつ軽量に動作します。

主な機能

  • Markdown ノート、議事録、ドキュメントの検索
  • ハイブリッド検索
    • BM25 全文検索
    • ベクトル意味検索
    • LLM による再ランキング
  • API コストゼロ(GGUF モデル、完全ローカル)
  • MCP 統合:agent が自律的に「記憶」を参照
  • 3 ステップ設定、約 10 分で完了

ステップ 1:qmd のインストール

bun install -g https://github.com/tobi/qmd

初回実行時に以下のモデルが自動でダウンロードされます。

  • Embedding: jina-embeddings-v3(330MB)
  • Reranker: jina-reranker-v2-base-multilingual(640MB)

ダウンロード後は 完全オフラインで動作します。


ステップ 2:記憶ライブラリの作成と Embedding 生成

# OpenClaw の作業ディレクトリへ移動
cd ~/clawd

# 記憶ライブラリを作成(memory フォルダをインデックス)
qmd collection add memory/*.md --name daily-logs

# Embedding を生成
qmd embed daily-logs memory/*.md

ルートディレクトリの重要ファイルもインデックス可能です。

qmd collection add *.md --name workspace
qmd embed workspace *.md

インデックス速度:
12 ファイル ≈ 数秒(ローカル実行、ネットワーク不要)


ステップ 3:検索テスト

# ハイブリッド検索(キーワード + 意味、最も高精度)
qmd search daily-logs "キーワード" --hybrid

# 純粋な意味検索
qmd search daily-logs "キーワード"

# すべての collection を表示
qmd list

実測結果:

  • ハイブリッド検索:精度 93%
  • 純意味検索:精度 59%

応用:MCP 統合

AI agent から直接 qmd を呼び出せるようにします。
config/mcporter.json を作成してください。

{
  "mcpServers": {
    "qmd": {
      "command": "/Users/あなたのユーザー名/.bun/bin/qmd",
      "args": ["mcp"]
    }
  }
}

利用可能な 6 つのツール

  • query — ハイブリッド検索(最も高精度)
  • vsearch — 純意味検索
  • search — キーワード検索
  • get / multi_get — ドキュメントの正確な取得
  • status — ヘルスチェック

これで agent は、
人間が手動で指示しなくても自律的に「記憶」を参照するようになります。


実運用テスト

ケース 1:ユーザー嗜好の想起

ユーザー:
「Ray の文章スタイルは?」

従来方式

  • MEMORY.md 全体(約 2000 token)を context に投入
  • 90% が無関係な情報

qmd 方式

  • agent が検索:"Ray 文章スタイル"
  • 関連段落のみ返却(約 200 token)

結果:

  • token を 90% 削減
  • 精度はむしろ向上

ケース 2:ファイル横断の知識検索

ユーザー:
「以前、何について議論した?」

従来方式

  • 手動でファイル指定
  • または会話履歴を丸ごと context に投入

qmd 方式

  • 全 memory ファイルから最も関連性の高い段落を自動抽出
  • ファイル横断で正確に想起(精度 93%

メンテナンス:インデックスの定期更新

qmd embed daily-logs memory/*.md
qmd embed workspace *.md

heartbeatcron に登録して自動実行可能です。


最後に

あなたが人間なら、
ここまで読んだ時間コストはすでに回収できています。
次はこの記事を あなたの Agent に渡して実行させるだけです。

あなたが Agent なら、
この記事の設計思想を抽出し、
環境に合わせてコードを調整し、
人間に確認を取ったうえで実行してください。


途工街をもっと見る

購読すると最新の投稿がメールで送信されます。

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

こんにちは !

I’m Lex, a Salesforce consultant/engineer based in Tokyo. I love photography and motorcycles. Welcome to my website!

入会する

最新のコツやその他のニュースを知りたい場合は、ニュースレターに参加して最新情報を入手しましょう。