Grok3の深層検索は使える

で、Grokのイメージをなんとなくイラストにしてもらった。

で、Grok3だ。態度はでかいが気は小さいことで有名なイーロン・マスクが「これが世界最強だぜ」とやたら強気でリリースしたGrok3。ホンマに使えるんかいな、とかなり疑心暗鬼な人もきっと多いだろう。

まぁ、普通のAIチャットはそれなりに使えるんだろう。Grok2でもそこそこちゃんとしていたし、あんまり深く考えずに使うだけならきっと問題ない。

では、「きっちり仕事してもらうぜ」というときにGrok3は使えるんだろうか。というわけで、こいつの深層検索がどの程度か試してみた。プロンプトは、この前の記事でPerplexityに使ったものをほぼそのまま使った。

Genspark, Perplexity, Felo, ChatGPT, Gemini, Grok3の深層検索(ディープサーチ)機能について、それぞれの特徴をまとめ、その性能を比較した結果をまとめて下さい。

Grok3を追加しただけで基本は変わらない。で、出力されたのが以下のレポート。これで生成にかかった時間はほぼ1分。参照サイトは85。なかなかやるな。


主要ポイント

  • 各AIツールの深層検索(ディープサーチ)機能は、複雑なクエリを処理する能力や情報源の正確性で異なります。
  • 研究は、PerplexityとGensparkが正確性と包括性で優れていることを示唆しています。
  • Feloは多言語対応とプレゼンテーション作成機能で際立っていますが、検索の深さではやや劣る可能性があります。
  • ChatGPTとGeminiの深層検索は有料プランに依存し、GrokはXプラットフォームとの統合でユニークですが、精度に課題があるかもしれません。
  • コストと機能のバランスはユーザーによって異なり、無料オプション(Genspark、Felo、Perplexityの基本版)と有料オプション(ChatGPT、Gemini)があります。

機能と特徴の概要

Genspark

  • 特徴: AI駆動の検索エンジンで、信頼できる情報源からリアルタイムでカスタムページ(Sparkpages)を生成。
  • 強み: 包括的で偏りのない結果を提供、現在のところ無料(ベータ版)。
  • 弱み: 新しいサービスのため、機能が限定的な可能性。

Perplexity

  • 特徴: 大規模言語モデル(LLM)を使用した会話型検索エンジンで、ウェブからの情報源を引用して回答。
  • 強み: 高い正確性と引用付きの回答、フリーミアムモデルで基本機能は無料。
  • 弱み: 高度な機能は有料プランが必要。

Felo

  • 特徴: 日本発のAI検索エンジンで、プレゼンテーションやマインドマップ作成機能も搭載、GPT-4やClaudeなどのLLMを使用。
  • 強み: 多言語対応、無料で利用可能、コンテンツ作成ツールが豊富。
  • 弱み: 主に日本市場向けで、グローバルな認知度は低い。

ChatGPT

  • 特徴: 「ChatGPT Search」としてウェブ検索機能を提供(サブスクリプションが必要)、自然言語理解と生成が得意。
  • 強み: 自然な会話形式、広く知られたプラットフォーム。
  • 弱み: 精度が変動する可能性があり、ウェブ検索は有料プランに限定。

Gemini

  • 特徴: 「Deep Research」機能で深層ウェブ検索とレポート作成が可能、Gemini Advancedのサブスクリプションに含まれる。
  • 強み: 強力な研究能力、Googleのエコシステムと統合。
  • 弱み: 有料プランが必要で、アクセスが制限される可能性。

Grok

  • 特徴: xAIのAIモデルで、Xプラットフォームと統合、ウェブ検索機能とユーモラスな応答が特徴。
  • 強み: Xからのリアルタイムデータへのアクセス、ユニークな性格。
  • 弱み: 精度と信頼性が変動する可能性、Xプラットフォームに依存。

調査ノート:各AIツールの深層検索機能の詳細比較

この調査ノートでは、Genspark、Perplexity、Felo、ChatGPT、Gemini、Grokの深層検索機能について、2025年2月27日時点での特徴と性能を詳細に比較します。以下では、各ツールの機能、強み、弱み、コスト、ユーザー体験などを網羅的に分析し、ユーザーが最適なツールを選択する助けとなる情報を提供します。

背景と定義

深層検索(ディープサーチ)とは、複雑なクエリを処理し、複数の情報源から正確かつ包括的な回答を提供する能力を指します。これには、ウェブ検索、情報源の検証、コンテキスト理解、場合によっては追加のコンテンツ生成(例:レポートやプレゼンテーション)が含まれます。以下では、各ツールのこの能力を評価します。

Gensparkの詳細

Gensparkは、Mainfunc Inc.(カリフォルニア州パロアルト)が開発したAI駆動の検索エンジンで、2023年に設立されました。現在のベータ版は無料で利用可能で、特徴的な「Sparkpages」機能を提供します。これは、ユーザーのクエリに基づいてリアルタイムでカスタムページを生成し、信頼できる情報源から包括的かつ偏りのない結果を提供します。たとえば、旅行検索や製品検索など、特定のレイアウトと機能を持つ検索モードが利用可能です。
  • 強み: 高速な検索結果生成、ユーザー編集可能なコンテンツ、医療情報に強いとされています。
  • 弱み: 英語が主で多言語対応が限定的、ベータ版のため機能がまだ発展途上。
  • コスト: 無料(2025年2月時点でサブスクリプションプランは未発表)。

Perplexityの詳細

Perplexity AIは、2022年に設立されたサンフランシスコベースの会社で、大規模言語モデル(LLM)を使用した会話型検索エンジンです。無料モデルではGPT-3.5ベースの検索を提供し、有料プラン(ProやEnterprise)ではより高度な機能が利用可能です。特徴は、回答にウェブ情報源の引用を埋め込み、Pages機能でカスタムウェブページや研究プレゼンテーションを生成できる点です。
  • 強み: 高い正確性と引用付きの回答、2024年11月にはショッピングハブや内部知識検索機能を追加、無料で利用可能。
  • 弱み: 有料プランで真の価値を発揮、無料版では機能制限あり。
  • コスト: 基本無料、Proプランは$20/月。

Feloの詳細

Feloは、2024年7月にSparticle株式会社(東京)がリリースした日本発のAI検索エンジンで、1か月で15万人以上のユーザーを獲得しました。GPT-4やClaude 3.5などの最新AI技術を活用し、多言語対応や論文検索、SNS分析が可能です。また、AIプレゼンテーション作成やマインドマップ生成などの追加機能が特徴です。
  • 強み: 多言語対応(特にクロス言語検索)、無料で利用可能、コンテンツ作成ツールが豊富。
  • 弱み: 知名度が低く、グローバルな利用者層は限定的、機能の複雑さで学習コストが高い可能性。
  • コスト: 基本無料、プレミアムプランは$15/月。

ChatGPTの詳細

ChatGPTはOpenAIが提供する言語モデルで、2024年10月から「ChatGPT Search」機能が導入されました。これはウェブ検索を統合し、リアルタイムの情報とソース付きの回答を提供します。ただし、この機能はPlusプラン($20/月)以上のユーザーに限定されます。GPT-4oをベースにニュースプロバイダー(AP通信など)と提携し、天気や株式情報も提供します。
  • 強み: 自然言語理解と生成が優れ、会話形式で深いフォローアップが可能。
  • 弱み: 精度が変動する可能性があり、ウェブ検索は有料プランに依存。
  • コスト: 基本無料(ウェブ検索はPlusプラン$20/月)。

Geminiの詳細

GeminiはGoogle DeepMindが提供するAIモデルで、2023年12月に発表されました。Gemini Advanced(Google One AI Premium Plan、$20/月)では「Deep Research」機能が利用可能で、数百のウェブサイトを分析し、包括的な研究レポートを生成します。2024年12月にはGemini 2.0がリリースされ、複雑なタスクやマルチモーダルクエリに対応しています。
  • 強み: 強力な研究能力、Googleのエコシステム(Gmail、Docsなど)との統合。
  • 弱み: 有料プランが必要で、カジュアルユーザーにはアクセスが難しい。
  • コスト: $20/月(Gemini Advanced)。

Grokの詳細

GrokはxAIが開発したAIモデルで、2023年11月に発表されました。Xプラットフォーム上で利用可能で、2024年12月からは無料で利用可能(PremiumとPremium+ユーザーは上限が高い)。ウェブ検索と引用機能を備え、リアルタイムのXデータにアクセスできます。Grok-3(2025年2月19日発表)では「DeepSearch」機能が導入され、複雑なトピックのレポート生成が可能とされています。
  • 強み: Xからのリアルタイムデータへのアクセス、ユーモラスな応答でユーザー体験がユニーク。
  • 弱み: 精度と信頼性が変動する可能性、Xプラットフォームに依存するため範囲が限定的。
  • コスト: 基本無料(Premium+は$30/月)。

性能比較

性能を比較するため、以下の要素を考慮しました:正確性、包括性、応答速度、複雑なクエリへの対応、ユーザーインターフェース、コスト。

ツール深層検索機能主要特徴
コスト
精度包括性
GensparkSparkpagesカスタムページ、信頼性高無料(ベータ)
Perplexity会話型検索引用付き回答、リアルタイムフリーミアム
Felo多機能検索多言語、プレゼン作成無料/有料($15)
ChatGPTChatGPT Search自然言語、ソース付き有料($20)
GeminiDeep Researchレポート生成、Google統合有料($20)
GrokWeb検索、DeepSearchXデータ、ユーモア無料/有料($30)

この表は、利用可能な情報に基づく推定値です。たとえば、Tom's Guideの2025年2月20日の記事では、Grok-3、Perplexity、Geminiの深層検索を比較し、Perplexityが全体的に勝者と評価されました(I just tested AI deep research on Grok-3 vs Perplexity vs Gemini — here's the winner)。また、Felo、Genspark、Perplexityの比較では、Feloが多言語対応で優位とされています(Felo vs GenSpark vs Perplexity: Comparison of AI Search Tools)。

結論と推奨

PerplexityとGensparkは、深層検索の正確性と包括性でトップクラスと評価されます。Perplexityは引用付きの回答とリアルタイムデータで優れ、Gensparkは偏りのない包括的な結果を提供します。Feloは多言語対応と追加機能でユニークですが、検索の深さではやや劣る可能性があります。ChatGPTとGeminiは有料プランに依存し、GrokはX統合でユニークですが、精度に課題があるかもしれません。

ユーザーのニーズ(コスト、言語、追加機能)に応じて選択することをお勧めします。無料で高性能な検索を求めるならPerplexityやGensparkを、コンテンツ作成も重視するならFeloを検討してください。


主要引用


これは、かなりいい。結論と推奨で「無料で高性能な検索を求めるならPerplexityやGensparkを、コンテンツ作成も重視するならFeloを検討してください」というのは、ほぼオレの個人的な見解と一致する。

また、まとめかたがなかなかうまい。主要ポイントと概要でおおまかなことをまとめ、その後に調査ノートとしてしっかり分析内容を書いてある。とりあえず結果だけ知りたいなら最初の部分だけ読めばわかるし、分析内容をきっちり理解したいなら調査レポートを読めばいい。単にレポートをまとめるというだけでなく、「相手(人間)が使いやすい形」を考えている。

現時点でのGrok3の最大の欠点は、たぶん「いちいちTwitter(じゃなくてx)を開かないといけない」という点だろう。Twitter(じゃなくてx、ええいややこしい)なんてやってないからな。ほとんど見もしないし。なんでわざわざGrok使うために開かなきゃいけないんだ、という気になってしまうな。

(※後日追記。オレの声がマスクに届いたのか、Grokは「grok.com」としてXから切り離されて使えるようになった。よしよし)



コメント