世界を動かす技術を、日本語で。

オラマウェブ検索

概要

Ollamaは 最新のWeb検索API を公開し、個人向けに 無料利用枠 を提供。 APIはREST形式で、 Python・JavaScriptライブラリ からも利用可能。 gpt-oss等の大規模モデル によるリサーチ自動化が可能。 web_searchweb_fetch ツールによる情報取得と連携強化。 MCPサーバーや各種ツールとの 統合手順 も公式で案内。

Ollama Web検索APIの概要

  • Ollamaが 新たなWeb検索API をリリース
  • 個人向け無料枠 と、より高いレートリミットの クラウドプラン を用意
  • 最新のWeb情報 をモデルに与え、 ハルシネーション抑制・精度向上 を実現
  • REST API形式 で提供し、 Python・JavaScriptライブラリ からも簡単利用
  • OpenAI gpt-ossモデル 等による 長時間リサーチタスク の自動化が可能

API利用開始手順

  • Ollamaアカウントで APIキー発行
  • 環境変数に OLLAMA_API_KEY を設定
  • cURL例:

    curl https://ollama.com/api/web_search \
      --header "Authorization: Bearer $OLLAMA_API_KEY" \
      -d '{ "query": "what is ollama?" }'
    
    • JSON形式の検索結果 が返却

Pythonライブラリでの利用

  • ollama>=0.6.0 をインストール
  • import ollama
    response = ollama.web_search("What is Ollama?")
    print(response)
    
  • 検索結果リスト が取得可能

JavaScriptライブラリでの利用

  • ollama@>=0.6.0 をnpmでインストール
  • import { Ollama } from "ollama";
    const client = new Ollama();
    const results = await client.webSearch({ query: "what is ollama?" });
    console.log(JSON.stringify(results, null, 2));
    
  • 検索結果オブジェクト が取得可能

検索エージェントの構築

  • Ollamaの web_search を活用した ミニ検索エージェント の構築例
  • Qwen 3 4Bモデル を使い、 ユーザー対話→Web検索→結果応答 を自動化
    • web_searchweb_fetch 等のツール連携
    • 検索結果の自動要約・応答
    • モデルの推奨設定
      • context length:約 32000トークン 推奨
      • 推奨モデル :qwen3、gpt-oss等
      • クラウドモデル :qwen3:480b-cloud, gpt-oss:120b-cloud, deepseek-v3.1-cloud

Webページ取得(web_fetch API)

  • web_fetch APIURL単位のページ取得 が可能
  • Python例:

    from ollama import web_fetch
    result = web_fetch('https://ollama.com')
    print(result)
    
  • JavaScript例:

    import { Ollama } from "ollama";
    const client = new Ollama();
    const fetchResult = await client.webFetch({ url: "https://ollama.com" });
    console.log(JSON.stringify(fetchResult, null, 2));
    
  • cURL例:

    curl --request POST \
      --url https://ollama.com/api/web_fetch \
      --header "Authorization: Bearer $OLLAMA_API_KEY" \
      --header 'Content-Type: application/json' \
      --data '{ "url": "ollama.com" }'
    
  • タイトル・本文・リンク一覧 がJSON形式で返却

MCPサーバー・他ツールとの統合

  • MCPサーバー(Model Context Protocol server) 経由でWeb検索有効化
  • Clineでの統合:
    • 設定画面で MCPサーバーを追加 し、コマンドやAPIキーを登録
  • Codexでの統合:
    • ~/.codex/config.tomlMCPサーバー設定 を追加
  • Gooseとの統合:
    • 拡張機能 経由でOllamaと連携可能

利用開始・サポート

  • 無料Ollamaアカウント 登録でWeb検索利用開始
  • 有料プラン でより高いレートリミット・クラウド機能が利用可能
  • 公式GitHub にPython/JavaScriptのサンプルコードを公開
  • サポート・最新情報 はOllama公式サイトで案内

Hackerたちの意見

彼らが自分たちのクラウドサービスを持っているなんて全然知らなかった。Ollamaの目的はローカルモデルだと思ってたのに。なんでOpenAIやMistralみたいな普通のAI企業を使う代わりに、劣った小さなモデルに月20ドルも払わなきゃいけないの?自分のコンピュータでモデルを使うためにアカウントを作るつもりはないよ。

いい質問だね。一部のサポートされているモデルは大きくて、ほとんどのローカルデバイスには収まらない。これは始まりに過ぎなくて、Ollamaはモデルプロバイダーとの関係を活かして、クラウドホスティングのフロンティアモデルを排除する必要はないんだ。開発者と共に立ち、ニーズを解決することを考えなきゃね。 https://ollama.com/cloud

gpt-oss-120bやdeepseek、qwen3-coder 480bみたいにローカルで動かせないモデルのためだね。それに、Ollamaの成功をマネタイズする方法でもある。

そうだね、利益を生む機能への安定したシフトが続いてる。FOSSや無料の労働からコードベースを通じて評判を築いて、そこから利益を得るのを見るのは素晴らしい。

彼らのホスティングモデルを使うためにアカウントを作るんだよ。そして、Ollama APIを通じてローカルでも利用できるようになる。今、Claudeに100ドル、GPT5に200ドル使ってるから、20ドルなんて全然大したことないし、アクセスできる価値は十分あるよ:Qwen3 235b、Deepseek 3.1 671b(思考あり・なし)、Llama 3.1 405b、GPT OSS 120b。これらは「小さくて劣ったモデル」なんて言えないよ。本当にすごいのは、CodexをOllamaのAPIを使うように設定して、異なるモデルでツールを実行できることだね。

たくさんの「ローカル」モデルは、ダウンロードするのにまだかなり大きくて、普通のハードウェアでは遅いんだよね。ローカルでモデルを実行する前に、クラウドで安く評価できる方法があるのは素晴らしいと思う。ある意味、実際にやるよりも、重要なものをローカルで動かせるという原則が大事なんだ。誰かに奪われるかもしれない技術に依存したくないからね。

これの裏でどの検索エンジンを使ってるのか知りたいな。Twitterで聞いたけど、まだ返事が来てない。 https://twitter.com/simonw/status/1971210260015919488 重要なのは、検索結果に適用されるライセンスを理解したいってこと。保存できるのか、再発行できるのか?プロバイダーによってルールが違うからね。

私たちは検索プロバイダーと連携していて、データ保持ポリシーはゼロにしています。検索結果はあなたのものとして所有・利用できます。好きなように使っていいよ。ただし、あなたがいる法的管轄の地元の法律には従う必要があるけどね。

AIモデルをトレーニングしてるって言えば、好きなことができるよ。

こんな機能をプライバシーポリシーもなしに始めるのは変だよね。最近資金注入を受けた他のVCの仲間と提携してるのかな?デザインパートナーやカスタマーストーリーとして使われてるのかも。Exaが怪しいと思う。YCが初期から支援してるし、最近8500万ドルのシリーズBをクローズしたばかりだし。BingはMicrosoftとの提携なしでは自由に運営するには高すぎるよ。早くプライバシーノーティスを出してね、Ollama。カリフォルニアに本社があるんだから、絶対にCCPAの対象だよ。(収益がなくても、カリフォルニアの住民5万人のデータコントローラーであるだけで十分。)https://oag.ca.gov/privacy/ccpa もし彼らを支えているゼロリテンションのプロバイダーがAlibabaだったら、反応がどうなるか想像できる。

検索結果がリンクのリストだけなら、著作権があるかどうか聞いてみるべきだよ。

実装についてもっと詳しい情報が欲しかった。Ollamaはオープンソースでプラットフォームに依存しないツールだと思ってたけど、最近の姿勢がそれに逆行してるのが心配。

Ollamaにヘッドレスブラウザを使って検索結果やウェブサイトのコンテンツを取得する機能を組み込むことも考えたんだ。でも、結果の質やOllamaがクローラーのような動作を引き起こすことでIPブロックされることに不安があった。ホスティングされたAPIを使うのは、ユーザーのコンテキストウィンドウに結果を早く入れる道だと感じたけど、まだローカルオプションも探ってる。理想を言えば、検索機能を使っても完全にローカルでいられるようにしたいね。

彼らの姿勢はどんどん悪化してる。騙しのようで、もうすべてのシステムから削除したよ。

彼らのGUIはクローズドソースなんだ。簡単に使えて設定も楽なアプリが欲しいなら、OSSを装わないLMStudioを使った方がいいよ。もしくは、LLMとその関連部分をコンテナ化してるramalamaを使うのもあり。Ollamaとかなり似てるからね。基本に戻って、llama.cppやvllmを使うのもいいかも。

ちょっと関連する話なんだけど、1,000サイトくらいをインデックスする自宅用の「ミニGoogle」を作ろうかなって考えてるんだ。実際、検索には数サイトあれば十分だから、フルスケールの検索エンジンに頼るのはオーバーキルな気がする。ざっくりしたアーキテクチャのアイデアはこんな感じ:

  • クローラー:各サイトを定期的に訪れる軽量なスクレイパー。
  • インデクサー:ページをテキストに変換して、キーワード検索のための逆インデックスを作成。Whooshみたいなのを使えるかも。
  • ストレージ:生のHTMLとテキストをローカルに保存して、古いスナップショットは圧縮するかも。
  • 検索レイヤー:結果を関連性でスコアリングするシンプルなクエリパーサー。TF-IDFや埋め込みを使うかも。 定期的にアップデートして、小さなウェブUIを作ってブラウジングできるようにするつもり。誰かやったことある人いる?それとも似たようなプロジェクトはある?

https://marginalia-search.com を試したことある?めっちゃ好きなんだけど。

数年前に流出したYandexのソースコードを見てみるといいかも。彼らのアーキテクチャはそれなりに良いと思うよ。

YaCy (https://yacy.net) ならこれ全部できると思う。ただ、クローリングしようとするとCloudflareにIPをブロックされるかもしれないけど。

LLMがあるのに、ミニGoogleなんて必要なの?

Common Crawlのダンプを見たことある?ちょっとデータマイニングしてみたんだけど、99.99%のウェブはクソみたいなもんだよ。スパム、ポルノ、広告、炎上、イライラしたティーンエイジャーのランダムなブログ…歴史的や文化的な価値はあるって分かるけど、僕の目的にはほとんど興味を引くものがなかったんだ。これがすごく励みになったのは、実際に重要なウェブページをインデックスするのが、一人の人間でもノートパソコンで可能かもしれないってことを示唆してるから。比較のために言うと、Wikipediaは圧縮されて約20GBだしね。(それに、僕が興味を持つようなWikipediaの記事は多分200MBくらいが上限だと思う。)

ちょっとだけ。ainews247.orgを作ったんだけど、特定のサイトをクローリングしてコンテンツをフィルタリングしてるから、AIに特化した価値のあるものになってると思う。すごくいいアイデアだと思うよ。

「Ollamaアカウント」って何?ちょっと混乱してるんだけど、Ollamaの目的はモデルをセルフホストすることだと思ってたんだけど。

追加機能を提供したり、Ollamaのクラウドホストされたモデルを使うためには、Ollamaアカウントにサインアップする必要があるよ。最初は完全にオプションだからね。自分のモデルをollama.comに公開して、他の人と共有することも完全にローカルでできるよ。

Ollamaってビジネスなの?資金調達したの?ただの便利なオープンソース製品だと思ってた。ユーザーをどうやってマネタイズするつもりなんだろう。あんまり期待できなさそう。

彼らは元Dockerの社員で、Dockerのプレイブックを実行してるんだ。

最近立ち上がった純粋なオープンソースプロジェクトってほとんどないよね(ほとんどは寄付モデルか企業の支援を受けてる)。AIの分野では、僕が知ってる限りでは全然ないよ。

今、ウェブ検索を使ったツールを作っていて、いろんなプロバイダーを試してるところ。openAI、xAI、Geminiはそれぞれの競合サイトで使えないのが辛いね。これでいくつかのYT動画をテストしたら、OpenAIのウェブ検索がアクセスできないところでもうまくいったよ。Xではちょっと失敗したけど、時々は関連する結果が出てきた。確かに当たり外れはあるけど、平均的には良い感じ。

数年前にPythonのDuckDuckGoパッケージを使ってLLMに検索機能を追加したんだけど、Googleの方が結果が良かったからそっちに切り替えたんだ。正確には忘れちゃったけど、Googleの開発コンソールで何か設定しないといけなかった気がする。DDGの方は非公式だし、Googleの方には制限があるから、深いリサーチにはあまり向いてないかも。基本的にはLLMのAPIに流し込むだけ。最初の数件のGoogleの結果をGPTに突っ込んで、その後に質問するってやり方が、ほとんどの時にすごく良い結果を出してくれたよ。もちろんOllamaでも使えるけど、僕はあんまり良いGPUを持ってないから、長いコンテキストだとすごく遅くなっちゃうんだよね。

スクレイピングAPIを使わずにどうやって意味のある使い方をするの?公式のAPIはかなり制限されてるんじゃないの?

プロダクションでウェブ検索を使いたいんだけど、価格については何も言ってないんだ。月額20ドルってだけは書いてあるけど、どれくらいのクォータが含まれてるの?

これについてはごめんね。使用量に基づいた料金体系を提供するために本当に頑張ってるんだ。プレビュー期間中は、個人向けに月20ドルのプランを提供し始めたいと思ってるし、使用状況を監視して、レート制限に引っかかる人たちに合わせて変更を加えられるようにしてるから、ほとんどのユースケースに対応できるようにして、寛大になりたいんだ。

それがこのサービスの本質だよ。明確にクォータを言わないか、いつの間にかこっそり下げてるんだ。

バカな質問だけど、これってMetaと関係あるの?それともただの誰かがMetaのオープンソースモデルを monetization しようとしてるだけ?

いや、Ollamaは独自のプロジェクトで別物だよ。GitHubでチェックしてみてね。 https://github.com/ollama/ollama