
新智慧报道主编:庆庆【新智慧导论】谷歌、RAG被判死刑!曾经需要无数工程师参与的技术链现在只剩下一行 API 调用。 Gemini 文件搜索将搜索、分块、索引和浏览集成到其模型中。开发者不再需要了解流程,只需要上传文件即可。当自动化吸收智能时,工程师第一次意识到他们已经成为其中的一部分。近年来,RAG 一直是工程师值得信赖的来源。他们手动切片、生成向量并创建索引,以将检索到的内容准确地拼写成提示。这是一系列细致而繁琐的工程任务。只有真正了解这些流程的人才敢说自己可以使用大型模型。但现在这种自豪感已经被一组 API 所驱散。 Gemini 文件搜索启动并运行后,您可以上传 PDF 或 JSON,模型将自动完成源分段、搜索、引用,甚至附件。文件搜索抽象了整个搜索过程。这句话就像一把尖刀,斩断了人类与系统之间最后的联系。人工智能不再需要教工程师如何搜索信息,工程师开始通过自己的发明来优化自己。从流程到功能:谷歌一举打破了RAG工程链。 Gemini 文件搜索发布后,RAG 从工程系统转变为集成 API 功能。当您上传文件时,模型会自动完成分割、嵌入(矢量化)、索引、检索和引用,所有这些都在同一个界面中进行。无需创建自己的向量库,也无需维护搜索逻辑。同时还开放了多格式支持。直接解析并嵌入PDF、DOCX、TXT、JSON和常用代码文件,让您快速构建统一的知识库。这使得开发人员能够快速创建无需对文件类型或结构进行额外调整即可获得完整的知识库。在更新说明中,这被定义为直接集成到Gemini API中的完全托管的RAG系统,并且获取过程被完全抽象。开发者不再需要设计分片策略或索引结构;系统在后台自动完成各个环节。 Gemini 文件搜索工作流程:上传文件 → 自动生成嵌入 → 调用 Gemini 搜索并生成答案 → 生成带有引文的结果。价格已更改为“Light Entry”。在查询期间存储和生成嵌入是免费的。只有第一个指数的收费为每百万代币 0.15 美元,因此实施和扩展的边际成本接近于零。这意味着开发知识搜索的成本几乎降为零,并且RAG的技术限制也被平台吸收了。文件搜索逻辑:RAG内置API fi的核心le搜索不是是否可以搜索到,而是隐藏整个搜索字符串。以前,如果您想要一个模型根据外部数据回答问题,您必须自己创建 RAG 流程。首先将文件切成小块,然后使用嵌入。 ing模型将每个块转换为向量并将其存储在向量数据库中。当用户提出问题时,系统会检索最相关的片段,并将结果插入到消息中以生成响应。 Ask the Manual 演示应用程序利用了新的 Gemini API 文件搜索工具。整个过程需要数据库维护、索引管理、参数调优、快速合并等。每一步都取决于工程师。所有这些现在都在 Gemini API 下。当您上传文件时,系统会自动完成分片、嵌入和索引。当你提出问题时,只需调用相同的generateContent接口即可。 Gemini内部完成语义搜索和上下文插入并自动化通常会在响应中生成引用。甚至使用特殊的gemini-embedding-001模型来确保搜索和生成的语义空间完全一致。上传有关现代 i10 的文档并询问“什么是现代 i10?”双子座搜索相关段落,创建明智的回应,并显示有支持这些答案的来源。更重要的是,搜索文件重写了开发逻辑。开发人员不再需要部署额外的数据库或维护恢复通道。整个过程在一次调用中完成。这意味着RAG从一个独立的系统变成了一个参数。以前需要数百行代码的流程现在可以在一行中配置。官方的调用示例是:)当所有的检索、存储、插入、引用都自动完成时,工程师不再需要了解系统是如何找到答案的。文件搜索将一组知识转变为 RAGat 必须被学习到被调用的函数。在那一刻,技术不再是一种能力,而是一种选择。对于流离失所的工程师来说,启动文件搜索不仅是工具的升级,更是角色的转变。这提供了构建系统本身、自动拆分、索引、检索和引用的能力。过去,理解这些逻辑就是工程师的价值。现在这种理解完全被隐藏了。在抢先体验中,我们对 Beam (Phaser Studio) 进行了最直观的更改。搜索连接到内容生产线的文件以检索模板、组件和设计文档。每天有数千个查询跨越六个语料库,结果在不到 2 秒的时间内合并。 CTO Richard Davey 表示:“过去几天的工作现在可以在几分钟内产生结果。”这不仅提高了生产力,也意味着工程师不再拥有解释系统媒体的权利。当平台控制搜索策略时搜索逻辑,甚至数据结构,项目不再是构建系统,而是调用它们。从表面上看,这只是少了几百行代码。但从内部来看,这正是知识密度被平台吸收的时刻。当复杂性被隐藏时,人就变得可替代。权力转移:从工程师到平台 文件搜索的出现实际上并没有改变开发体验,而是改变了权力结构。 ——懂系统的人将从工程师走向平台。在传统的RAG流程中,工程师控制系统。他们可以决定如何对其进行分段、如何对其进行索引、如何对其进行检索,并且他们可以解释为什么他们的模型给出了特定的答案。这种控制感来自于对每个步骤逻辑的可见性。文件搜索将可见的工程步骤嵌入到不可见的 API 中。搜索策略、索引结构和引用规则都托管在 nube 中。发展用户只能看到响应,看不到过程。这意味着知识注入的力量集中了。该平台确定模型的响应基于哪些段落、忽略哪些证据以及如何评估搜索结果。工程师不再“构建系统”,而是“调用系统”。这并非特例。 OpenAI 的自定义 GPT、Anthropic 的控制台和 Gemini 的文件搜索将复杂性降低到平台边缘,使开发更轻松,并为您提供更多控制。每一个抽象都是权力的集中。文件搜索的诞生标志着人工智能开发零配置时代的开始。人们不再需要理解模型,他们可以简单地调用它。该平台不再提供功能,而是直接提供结果。这个变化并没有涉及任何戏剧性的冲突,但是技术的限制却彻底改变了。当系统构建自己的系统时,个人的理解就会被信任所取代平台。文件搜索不会“杀死”RAG,它们只是将它们变成系统的命脉。复杂性被隐藏,权力被集中。工程师要做的就是在更高层次的封装上寻找新的切入点。参考资料:https://blog.google/technology/developers/file-search-gemini-api/https://x.com/frxiaobei/status/1990091775382602021?s=20https://Medium.com/%40abdulkadir9929/gemini-apis-new-file-search-tool-built-in-rag-for-everyone-e990c054dcff 关注秒ASI ? 一键点赞、转发、观看? 点亮星星,锁定新智慧快速助推!
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布。它是一个社交媒体平台,仅提供信息化存储服务。