本文將介紹如何在部署RAG服務時關聯RDS PostgreSQL引擎執行個體,以及對RAG對話系統的基礎功能和RDS PostgreSQL的特色功能進行說明。
背景資訊
EAS簡介
EAS(Elastic Algorithm Service)是PAI的模型線上服務平台,支援將模型部署為線上推理服務和AI-Web應用。EAS提供了彈性擴縮容和藍綠部署等功能,可以支撐您以較低的資源成本擷取高並發且穩定的線上演算法模型服務。此外,EAS具備資源群組管理和版本控制等功能,並且有完整營運監控體系等能力。更詳細的內容介紹,請參見EAS模型服務概述。
RAG簡介
隨著AI技術的飛速發展,產生式人工智慧在文本產生、映像產生等領域展現出了令人矚目的成就。然而,在廣泛應用大語言模型(LLM)的過程中,一些固有局限性逐漸顯現:
領域知識局限:大語言模型通常基於大規模通用資料集訓練而成,難以針對專業垂直領域提供深入和針對性處理。
資訊更新滯後:由於模型訓練所依賴的資料集具有靜態特性,大模型無法即時擷取和學習最新的資訊與知識進展。
模型誤導性輸出:受制於資料偏差、模型內在缺陷等因素,大語言模型可能會出現看似合理實則錯誤的輸出,即所謂的“大模型幻覺”。
為克服這些挑戰,並進一步強化大模型的功能性和準確性,檢索增強產生技術RAG(Retrieval-Augmented Generation)應運而生。這一技術通過整合外部知識庫,能夠顯著減少大模型虛構的問題,並提升其擷取及應用最新知識的能力,從而實現更個人化和精準化的LLM定製。
RDS PostgreSQL簡介
阿里雲關係型資料庫RDS(Relational Database Service)支援PostgreSQL引擎。PostgreSQL的優點主要集中在對SQL規範的完整實現以及豐富多樣的資料類型支援,包括JSON資料、IP資料和幾何資料等。除了完美支援事務、子查詢、多版本控制(MVCC)、資料完整性檢查等特性外,RDS PostgreSQL還整合了高可用和備份恢複等重要功能,減輕您的營運壓力。更多關於RDS PostgreSQL的進階功能介紹,請參見RDS PostgreSQL。
使用流程
EAS自建了RAG系統化解決方案,提供了靈活可調的參數配置,您可以通過WebUI或者API調用RAG服務,定製自己專屬的對話系統。RAG技術架構的核心為檢索和產生:
在檢索方面,EAS支援多種向量檢索庫,包括開源的Faiss、Elasticsearch、Hologres、OpenSearch以及RDS PostgreSQL。
在產生方面,EAS支援豐富的開源模型,例如通義千問、Llama、Mistral、百川等,同時支援ChatGPT調用。
本方案以RDS PostgreSQL為例,為您介紹如何使用EAS與RDS PostgreSQL構建一個大模型RAG對話系統。具體流程如下:
首先建立RDS PostgreSQL執行個體,並準備部署RAG服務關聯該執行個體時依賴的配置項。
在EAS模型線上服務平台部署RAG服務,並關聯RDS PostgreSQL執行個體。
您可以在RAG對話系統中串連RDS PostgreSQL,上傳企業知識庫檔案,並進行知識問答。
前提條件
已建立Virtual Private Cloud、交換器和安全性群組。具體操作,請參見搭建IPv4專用網路和建立安全性群組。
注意事項
本實踐受制於LLM服務的伺服器資源大小以及預設Token數量限制,能支援的對話長度有限,旨在協助您體驗RAG對話系統的基本檢索功能。
準備向量檢索庫RDS PostgreSQL
步驟一:建立RDS PostgreSQL執行個體和資料庫
建立RDS PostgreSQL執行個體。
在購買頁面,配置以下關鍵參數,其他參數配置說明,請參見建立RDS PostgreSQL執行個體。
引擎:選擇PostgreSQL。
VPC:選擇已建立的專用網路。
高許可權帳號:在更多配置地區,配置高許可權帳號。選擇立即設定,並設定資料庫帳號和密碼。
按照控制台操作指引完成支付和開通操作。
建立資料庫。
單擊已建立的執行個體名稱,在左側導覽列單擊資料庫管理,並單擊建立資料庫。
在建立資料庫配置面板中,配置資料庫(DB)名稱,授權帳號選擇已建立的高許可權帳號,其他參數配置說明,請參見建立帳號和資料庫。
參數配置完成後,單擊建立。
步驟二:準備配置項
查詢資料庫連接地址。
在RDS PostgreSQL執行個體詳情頁面的左側導覽列,選擇資料庫連接,並查看資料庫內網地址、外網地址,以及相應的連接埠號碼。

使用內網地址:RAG服務需要和資料庫在同一個VPC下。
使用外網地址:當EAS通過外網地址訪問RDS PostgreSQL時,EAS需要具備訪問公網的能力。同時,為確保PostgreSQL執行個體能夠接收來自EAS執行個體的公網請求,您需要為PostgreSQL開通外網地址,並將相關EIP地址或0.0.0.0/0加入白名單。具體操作步驟如下:
為RDS PostgreSQL開通外網地址。具體操作,請參見開通或關閉外網地址。
為EAS開通公網訪問能力,您需要為後續部署RAG服務時添加的VPC綁定NAT Gateway和Elastic IP Address(EIP)。具體操作,請參見使用公網NAT GatewaySNAT功能訪問互連網。
說明RAG服務可以使用與RDS PostgreSQL相同的VPC,也可以使用其他VPC。
將0.0.0.0/0或上述Elastic IP Address(EIP)地址添加為RDS PostgreSQL執行個體外網地址白名單。具體操作,請參見設定白名單。
查詢高許可權帳號和密碼。
在RDS PostgreSQL執行個體詳情頁面的左側導覽列,選擇帳號管理。在該頁面查看已建立的高許可權帳號,相應密碼在建立執行個體時設定,如果忘記可單擊重設密碼進行修改。
部署RAG服務並關聯RDS PostgreSQL執行個體
登入PAI控制台,選擇工作空間,並單擊進入EAS。
在模型線上服務(EAS)頁面,單擊部署服務,然後在情境化模型部署地區,單擊大模型RAG對話系統部署。

在部署大模型RAG對話系統頁面,配置以下關鍵參數,其他參數配置說明,請參見步驟一:部署RAG服務。
參數
描述
基本資料
版本選擇
選擇LLM一體化部署。
RAG版本
選擇pai-rag:0.3.4。
模型類別
選擇qwen1.5-1.8b。
資源資訊
部署資源
系統會根據已選擇的模型類別,自動推薦適合的資源規格。更換至其他資源規格,可能會導致模型服務啟動失敗。
向量檢索庫設定
版本類型
選擇RDS PostgreSQL。
主機地址
配置為RDS PostgreSQL執行個體的內網地址或外網地址。
連接埠
配置為RDS PostgreSQL執行個體的連接埠號碼,例如5432。
資料庫
請輸入已建立的資料庫名稱。
表名稱
請輸入新的表名稱或已存在的表名稱。對於已存在的表,表結構應符合PAI-RAG要求,例如您可以填寫之前通過EAS部署RAG服務時自動建立的表名稱。
帳號
請輸入已建立的高許可權帳號。
密碼
請輸入高許可權帳號對應的密碼。
OSS地址
請選擇當前地區下已建立的OSS儲存目錄。通過掛載OSS路徑實現知識庫管理員。
專用網路
Virtual Private Cloud
當主機地址使用內網地址時,RAG服務需要配置與RDS PostgreSQL執行個體一致的專用網路。
當主機地址使用外網地址時,RAG服務需要配置專用網路,您需要確保該專用網路具有公網訪問能力,詳情請參見使用公網NAT GatewaySNAT功能訪問互連網。同時您需要將綁定的Elastic IP Address或
0.0.0.0/0添加為RDS PostgreSQL執行個體的公網訪問白名單,詳情請參見設定白名單。
交換器
安全性群組名稱
參數配置完成後,單擊部署。
使用RAG對話系統
1、檢查向量檢索庫配置
RAG對話系統的基本使用方法如下,更多詳細介紹,請參見大模型RAG對話系統。
單擊目標RAG服務名稱,然後在頁面右上方單擊查看Web應用。
檢查向量檢索庫PostgreSQL配置是否正確。
系統已自動設定知識庫default,並自動識別應用了部署RAG服務時配置的向量檢索庫設定。在向量資料庫配置地區,檢查PostgreSQL配置是否正確,可修改對應配置項為正確配置,然後單擊更新知識庫。
2、上傳企業知識庫檔案
在知識庫頁簽的檔案管理Tab頁上傳知識庫檔案。
知識庫上傳完成後,系統會自動按照PAI-RAG格式將檔案儲存體到向量檢索庫。對於同名知識庫檔案,除了FAISS外,其他向量檢索庫將會覆蓋原有檔案。支援的檔案類型為.html、.htm、.txt、.pdf、.pptx、.md、Excel(.xlsx或.xls)、.jsonl、.jpeg、.jpg、.png、.csv或Word(.docx),例如rag_chatbot_test_doc.txt。
3、進行知識問答
在對話頁簽,選擇知識庫名稱、使用意圖(使用更多工具選擇查詢知識庫)進行知識問答。
RDS PostgreSQL特色功能支援
訪問RDS執行個體列表,切換到執行個體所在地區,然後單擊執行個體名稱,進入執行個體詳情頁面。
在左側導覽列選擇資料庫管理,然後單擊目標資料庫操作列下的SQL查詢。
輸入資料庫帳號和資料庫密碼,即您在建立RDS PostgreSQL時設定的高許可權帳號和密碼,然後單擊登入。
登入成功後,在已登入資料庫執行個體中查詢匯入的知識庫列表。

相關文檔
針對AIGC和LLM的典型前沿情境,EAS提供了簡化的部署方式。您可以很方便地一鍵拉起服務,包括ComfyUI部署、Stable Diffusion WebUI部署、ModelScope模型部署、HuggingFace模型部署、Triton部署以及TFserving部署等。詳情請參見EAS情境化部署說明。
RAG服務WebUI介面提供了豐富的推理參數配置選項,以滿足多樣化需求。此外,RAG服務也支援通過API介面進行調用。具體實現細節以及參數配置說明,請參見大模型RAG對話系統。
大模型RAG對話系統還支援與其他向量檢索庫進行關聯,例如OpenSearch或Elasticsearch等。詳情請參見基於EAS&Elasticsearch搭建RAG檢索增強對話系統或基於EAS&OpenSearch搭建RAG檢索增強對話系統或。