现代检索系统——无论是基于词法的还是语义的——均通过一个固定的相似性接口来暴露语料库,将所有访问压缩为推理前的单一“top-k”检索步骤。这一抽象设计虽具效率优势,但对于具备自主行为能力的搜索代理(agentic search)而言,却成为性能瓶颈:精确的词法约束、稀疏线索的逻辑组合、局部上下文校验,以及多步假设的迭代精化,均难以仅凭调用现成的标准检索器来实现;而早期被过滤掉的证据,也无法通过下游更强的推理能力予以恢复。代理型任务进一步加剧了这一局限性,因为它们要求智能体协调多个步骤,包括发现中间实体、整合微弱线索,以及在观察到部分证据后动态调整搜索计划。为应对这一局限,我们提出了“直接语料库交互”(Direct Corpus Interaction, DCI)范式:智能体不依赖任何嵌入模型、向量索引或检索API,而是直接利用通用终端工具(例如 grep、文件读取、Shell 命令、轻量级脚本)对原始语料库进行搜索。该方法无需离线索引构建,且能自然适配持续演化的本地语料库。在信息检索基准测试及端到端代理型搜索任务中,这一简洁架构在多个 BRIGHT 和 BEIR 数据集上显著超越了强效的稀疏检索、稠密检索及重排序基线模型;同时,在 BrowseComp-Plus 和多跳问答任务中亦取得了优异准确率,且全程未使用任何传统语义检索器。我们的结果表明:随着语言智能体能力的持续增强,检索质量不仅取决于其推理能力,更取决于模型与语料库交互所采用接口的“分辨率”(即细粒度控制能力);而 DCI 正是为此类代理型搜索开辟了一个更为广阔、更具延展性的接口设计空间。