DCIとは？grepとシェルで直接コーパスを探索するエージェント検索の新手法

埋め込みモデルやベクトルインデックスを使わずgrepやシェルで生コーパスを直接探索するDCI（Direct Corpus Interaction）を提案した
BRIGHTとBEIRの複数データセットにおいてスパース・密ベクトル・リランク手法を大幅に上回り、BrowseComp-Plusでも高精度を達成
事前インデックスが不要でコーパスの変化に即座に対応できる設計のため、実装コストが低く実用的なagentic RAGの代替として機能する

RAG設計の根本的な問い

近年のAI応用において、LLMに外部知識を取り込む仕組みとしてRAG（Retrieval-Augmented Generation）が広く採用されています。従来のRAGは「埋め込みモデルでテキストをベクトル化し、類似度検索でTop-kを取り出す」という工程を前提としていますが、この設計には根本的な限界があります。

固定した類似度インターフェースを通じてコーパスにアクセスする構造では、正確な語彙的制約の充足、複数の弱い手がかりの組み合わせ、局所的な文脈確認、多段階の仮説修正といった操作が困難です。検索ステップで弾かれた証拠は、いくら推論能力が高くても後から回収できません。

2026年5月にarXivで公開された論文「Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction」は、この前提を根本から問い直します。Zhuofeng Liら19名の研究者によって執筆され、HuggingFace Daily Papersで2位を獲得するほど注目を集めました。

DCIとはどのような手法か

本論文が提案するDCI（Direct Corpus Interaction）は、LLMエージェントが埋め込みモデルやベクトルインデックス、検索APIを一切使わず、生のコーパスにターミナルツールで直接アクセスする手法です。具体的にはgrep（テキスト検索コマンド）、ファイル読み込み、シェルスクリプト、軽量スクリプトといった汎用ツールを組み合わせて情報を探索します。

従来のRAGが「質問→埋め込み→類似度検索→Top-k取得→回答生成」という直線的なパイプラインであるのに対して、DCIではエージェントが自ら検索戦略を立て、中間結果を確認しながら繰り返しコーパスに問い合わせます。仮説を立てて検証し、必要に応じてクエリを修正するという、人間のリサーチプロセスに近い動作です。

実装面での大きな利点は、オフラインでのインデックス構築が不要な点です。新たな文書が追加されてもコーパスが即座に利用可能になり、インデックス更新のコストや遅延が生じません。BrowseCompで高精度を達成した検索エージェントOpenSeeker-v2でもエージェント的な検索戦略の有効性が示されていますが、DCIはインターフェース自体を再設計する点でさらに踏み込んだアプローチです。

図1: 従来のRAGパイプライン（左）とDCIによるエージェント的コーパス探索（右）の比較

実験結果と性能比較

評価はIR（情報検索）ベンチマークとエンドツーエンドのエージェント検索タスクの両軸で実施されました。情報検索の難易度が高いことで知られるBRIGHTとBEIRの複数データセットにおいて、DCIはスパース検索（BM25など）、密ベクトル検索（Bi-encoder系）、リランキング手法を含む強力なベースラインを大幅に上回る結果を示しました。

エンドツーエンドの評価では、Webスケールの調査課題を扱うBrowseComp-Plusと多段階推論が必要なマルチホップQAの両タスクで高い精度を達成しました。いずれも従来の意味的検索器（セマンティックリトリーバー）に一切依存しないという条件下での結果です。

この結果が示すのは、検索の質がLLMの推論能力だけに依存するのではなく、モデルがコーパスとやり取りするインターフェースの解像度にも大きく左右されるという知見です。類似度という単一の尺度に圧縮された固定インターフェースより、自由度の高いターミナルアクセスの方がエージェント的なタスクに適していることを、定量的に示した点が本研究の核心といえます。

限界と今後の展望

DCIにはいくつかの課題もあります。シェルコマンドやgrepを有効に活用するには、エージェントとなるLLMがそれなりの推論能力と検索戦略の立案力を持つ必要があります。モデルが十分でない場合、ツール呼び出しの試行錯誤がトークンと実行時間のコストを増加させる可能性があります。

また、大規模なコーパスに対してgrepを繰り返し実行する計算コストは、最適化されたベクトルインデックスより高くなり得ます。ローカルや小規模コーパスでは有効な手法も、Webスケールへの適用には追加の工夫が求められます。

論文は「DCIはインターフェース設計空間の一端を示したにすぎない」とも述べており、ターミナルツールとセマンティック検索を組み合わせたハイブリッドアーキテクチャや、コーパス特性に応じた動的なインターフェース選択など、今後の研究への方向性を示しています。事前インデックスなしで既存手法を超えたこの結果は、agentic RAGの設計を再考するきっかけとして、研究コミュニティに継続的な影響を与えるでしょう。