Amazon Bedrock 知識庫

有了 Amazon Bedrock 知識庫,您可以從公司的私人資料來源向 FM 和代理程式提供 RAG 內容資訊,進而提供更相關、準確和自訂的回應

全受管的端對端 RAG 工作流程支援

為了向基礎模型 (FM) 提供最新且專有的資訊,組織採用檢索增強生成 (RAG) 技術,從公司資料來源擷取資料,使用該資料擴充提示,以提供更相關且更準確的回應。Amazon Bedrock 知識庫是一項完全受管的功能,可協助您實現從擷取到檢索和提示擴充的整個 RAG 工作流程,而無需建立資料來源的自訂整合和管理資料流程。或者,您可以提出問題並彙總單一文件中的資料,而無需設定向量資料庫。您還可以內建對話內容管理功能,使您的應用程式能夠輕鬆支援多輪交談。

知識庫概述的正式描述

安全連接 FM 和代理程式到資料來源

指向專有資料的位置後,Amazon Bedrock 知識庫會自動擷取文件。您可以從網頁和 Amazon Simple Storage Service (Amazon S3)、Confluence (預覽)、Salesforce (預覽)、SharePoint (預覽) 等儲存庫中擷取內容。一旦擷取內容,Amazon Bedrock 知識庫將內容分割成文字區塊,將文字轉換為嵌入,並將嵌入式儲存在向量資料庫中。
Amazon Bedrock 知識庫還可以管理工作流程的複雜性,例如內容比較、失敗處理、輸送量控制、加密等。如果您尚未擁有現有的向量資料庫,Amazon Bedrock 會為您建立 Amazon OpenSearch Serverless 向量存放區。或者,您也可以在其中一個支援的資料庫中指定現有向量存放區,包括 Amazon OpenSearch Serverless、Pinecone 和 Redis Enterprise Cloud、Amazon Aurora 和 MongoDB。

建立知識庫和設置資料來源的螢幕

自訂 Amazon Bedrock 知識庫以在執行時期提供準確的回應

現在,您可以微調檢索和擷取,以在各個使用案例中獲得更好的準確性。利用進階解析選項來了解含複雜內容 (例如表格) 的非結構化資料 (例如 PDF、掃描影像)。使用進階資料分塊選項 (例如自訂資料群集),您可以將自己的資料群集代碼編寫為 Lambda 函數,甚至可以使用來自 LangChain 和 LlamaIndex 等架構的現成元件。如果您想,也可以使用我們內建的資料群集策略,包括預設資料群集、固定大小、無資料群集、分層資料群集或語意資料群集。在擷取時,請利用查詢重新配置來提高系統了解複雜查詢的能力。

bedrock 資料群集剖析組態螢幕擷取畫面

擷取相關資料和增強提示

您可以使用擷取 API 從知識庫擷取使用者查詢的相關結果。RetrieveAndGenerate API 更進一步,直接使用擷取的結果來增強 FM 提示並返回回應。您還可以將 Amazon Bedrock 知識庫新增至 Amazon Bedrock 代理程式,提供代理程式上下文內容。

檢索和生成 API

提供來源歸因

所有從 Amazon Bedrock 知識庫中擷取的資訊均附有引用,以提高透明度並將幻覺最小化。

使用者與代理程式進行對話的聊天視窗