×
Community Blog Alibaba Cloud Model Studio 및 AnalyticDB for PostgreSQL로 Compute Nest에서 검색 증강 생성(RAG) 서비스 구축

Alibaba Cloud Model Studio 및 AnalyticDB for PostgreSQL로 Compute Nest에서 검색 증강 생성(RAG) 서비스 구축

이 문서에서는 Alibaba Cloud Model Studio, Compute Nest 및 AnalyticDB for PostgreSQL을 사용하여 검색 증강 생성(RAG) 서비스를 설정하는 단계별 가이드를 제공합니다.

작성: Farruh

이 튜토리얼에서는 Alibaba Cloud Model Studio, Compute Nest 및 AnalyticDB for PostgreSQL을 사용하여 검색 증강 생성(RAG) 서비스를 설정하는 단계별 가이드를 제공합니다. Model Studio를 사용하면 Qwen과 같은 최고 수준의 생성형 AI 모델을 활용하여 AI 애플리케이션을 손쉽게 개발, 배포, 관리할 수 있습니다. 이러한 설정은 기업 내에서 안전하고 효율적인 데이터 처리를 보장하여 AI 기능을 향상시키고 자연어 쿼리를 원활하게 수행할 수 있도록 합니다.

소개

Alibaba Cloud Model Studio는 생성형 AI 애플리케이션 개발을 위한 포괄적인 플랫폼을 제공합니다. Compute Nest 및 AnalyticDB for PostgreSQL을 사용하면 안전하고 효율적인 검색 증강 생성(RAG) 서비스를 구축하여 기업 내 AI 역량을 강화할 수 있습니다.

Alibaba Cloud Model Studio 개요

model_studio_features
이 다이어그램에 표시된 기능은 순차적으로 출시될 예정입니다.

Model Studio란?

Alibaba Cloud Model Studio는 생성형 AI 모델의 개발, 배포, 관리를 간소화하는 것을 목표로 하는 엔드투엔드 플랫폼입니다. Model Studio는 Qwen-Max, Qwen-Plus, Qwen-Turbo, Qwen 2 시리즈와 같은 업계 최고의 기본 모델에 액세스할 수 있으며, 모델 미세 조정, 평가, 배포 및 엔터프라이즈 시스템과의 통합을 위한 도구를 제공합니다.

Model Studio의 주요 기능

1.  선도적인 파운데이션 모델(FM)에 대한 간편한 액세스:

  • Qwen-Max, Qwen-Plus, Qwen-Turbo, Qwen 2 시리즈와 같은 모델은 향상된 AI 기능으로 애플리케이션을 강화합니다.

2.  내장된 모델 추론 및 평가 워크플로:

  • 감독 미세 조정(SFT) 및 로우랭크 적응(LoRA) 지원.
  • 모델 압축, 추론 가속화 및 다차원 평가 도구.
  • 원클릭 모델 배포.

3.  간소화된 생성형 AI 애플리케이션 개발:

  • 애플리케이션 개발을 위한 시각적 워크플로.
  • 템플릿 기반 프롬프트 엔지니어링.
  • 비즈니스 시스템과의 통합을 위한 광범위한 API.

4.  포괄적인 보안 조치:

  • 데이터 보안을 위한 격리된 VPC 네트워크.
  • 콘텐츠 거버넌스 및 휴먼 인 더 루프 개입을 위한 도구로 책임감 있는 AI 관행 보장.

5.  서드파티 모델:

  • Q&A, 글쓰기, NL2SQL(Natural Language to SQL) 기능에서 선보인 Tongyi와 같은 서드파티 모델에 대한 지원.

6.  데이터 관리:

  • 데이터 세트 정리 및 관리.
  • 향상된 검색 및 데이터 액세스를 위한 검색 증강 생성(RAG).

7.  산업별 모델:

  • 의료, 금융, 법률 서비스 등의 부문을 위한 사용자 지정 모델.

8.  API 및 SDK:

  • 빠른 통합 및 에이전트 개발을 위한 어시스턴트 API 및 SDK 제품군.

전제 조건

시작하기 전에 다음이 필요합니다.

  • 활성 Alibaba Cloud 계정.
  • 클라우드 서비스 및 AI 모델에 익숙합니다.

1단계: Alibaba Cloud 계정 설정

아직 가입하지 않았다면 Alibaba Cloud 계정에 가입합니다: 가입하기.

2단계: Compute Nest 접속

Compute Nest로 이동하여 생성형 AI 서비스를 찾습니다: Compute Nest

model_studio_rag

3단계: 인스턴스 및 파라미터 설정하기

인스턴스에 필요한 파라미터를 구성합니다.

  1. 서비스 인스턴스 이름: 인스턴스에 의미 있는 이름을 입력하십시오.
  2. ECS(Elastic Computing Services) 파라미터: 빠른 문서 처리를 위해 ecs.c6.2xlarge를 선택하는 것이 좋습니다.
  3. 인스턴스 암호: 인스턴스에 대한 보안 암호를 생성합니다.

인스턴스 파라미터

4단계: AnalyticDB for PostgreSQL 설정

AnalyticDB for PostgreSQL 인스턴스 구성:

  1. 인스턴스 사양: 데이터 볼륨에 따라 적합한 사양을 선택합니다.
  2. 세그먼트 스토리지 크기: 필요에 따라 조정합니다.
  3. DB 사용자 이름: 기본값인 kbsuser 또는 사용자 이름을 직접 선택합니다.
  4. DB 암호: 강력한 암호를 만드십시오("@" 같은 기호는 사용하지 마십시오).

adbpg

5단계: WebUI 자격 증명 구성하기

RAG 서비스를 관리하고 상호 작용할 수 있도록 웹 UI 자격 증명을 구성합니다.

  1. 사용자 이름: 기본값인 admin이나 다른 사용자 이름을 선택합니다.
  2. 암호: 강력하고 안전한 암호를 만드십시오.

webui

6단계: Model Studio API 키 추가

Model Studio API 키를 추가하여 인증하고 서비스 간 통신을 원활하게 하십시오.

API 키: Model Studio 설정에서 얻은 API 키를 입력합니다.

model_studio_api

다음은 Model Studio API 키 획득 방법에 대한 가이드입니다.

7단계: 네트워크 구성

안전하고 안정적인 연결을 보장하기 위해 적절한 네트워크 설정을 선택합니다.

기존 인프라 구성 선택

1.  새 VPC(Virtual Private Cloud)를 생성할지 아니면 기존 VPC를 사용할지 선택합니다.

  • WhetherCreateVpc: 새 VPC가 필요한 경우 Create를 선택합니다.

2.  VPC ID: 기존 VPC의 ID를 입력하거나 새로 생성합니다.

3.  VSwitch ID: 기존 VSwitch의 ID를 선택하거나 새로 생성합니다.

4.  태그 및 리소스 그룹:

  • 태그: 생성된 리소스에 붙일 태그를 지정합니다.
  • 태그 키: 태그 키를 선택합니다.
  • 태그 값: 태그 값을 선택합니다.
  • 리소스 그룹: 생성된 서비스 인스턴스가 속할 리소스 그룹을 선택합니다.
  • 리소스 그룹 생성: 리소스 그룹 생성의 방법을 따르십시오.

설정을 구성한 후 다음: 주문 확인을 클릭합니다.

network_resources

이 단계를 수행하면 WebUI 자격 증명 및 네트워크 설정이 올바르게 구성되어 Alibaba Cloud Model Studio RAG 서비스를 효과적으로 지원할 수 있습니다.

이러한 파라미터를 설정한 후 다음: 주문 확인을 클릭합니다.

confirm_order

7단계: Web UI용 Gradio 통합하기

Gradio를 사용하여 서비스와 상호 작용할 수 있는 웹 인터페이스를 만듭니다.

  1. Gradio 설정: 설치 및 구성은 Gradio의 참고자료를 따라 하십시오.
  2. 서비스 통합: Gradio를 백엔드 서비스(Model Studio API 엔드포인트 및 AnalyticDB for PostgreSQL)에 연결합니다.

8단계: RAG 서비스 배포

모든 구성을 검토하고 서비스 약관에 동의합니다. 지금 생성을 클릭하여 RAG 서비스를 배포합니다.

Deploy Service

RAG 서비스 사용하기

일반적인 질문 답변

사용자는 Gradio 웹 인터페이스를 통해 질문을 할 수 있으며, Model Studio API는 입력에 따라 응답을 제공합니다.

Service Usage

검색 증강을 위한 문서 업로드

사용자는 벡터 데이터베이스에 저장될 문서를 업로드하여 모델의 검색 기능을 향상시킬 수 있습니다.

서비스 수정

권한이 부여된 사용자는 ECS 인스턴스에 액세스하여 서비스에 필요한 변경 또는 업데이트를 수행할 수 있습니다.

추가 리소스

RAG 서비스를 더 자세히 살펴보고 최적화하려면 다음 리소스를 확인하십시오.

관련 튜토리얼:

결론

이 튜토리얼에서는 Alibaba Cloud Model Studio, Compute Nest 및 AnalyticDB for PostgreSQL을 사용하여 검색 증강 생성(RAG) 서비스를 구축하는 포괄적인 프로세스를 안내합니다. Qwen을 포함한 Model Studio의 강력한 생성형 AI 모델 제품군을 활용하면 기업 내에서 AI 애플리케이션의 개발, 배포, 관리를 간소화할 수 있습니다. 이 설정은 자연어 쿼리부터 문서 검색 개선에 이르기까지 안전하고 확장 가능하며 효율적인 상호 작용을 보장합니다. 이 단계를 따르면 고급 AI 기능을 활용하여 조직 내 데이터 관리 및 활용을 혁신할 수 있습니다. 지속적인 최적화와 지원을 받으려면 제공된 추가 리소스 및 관련 튜토리얼을 살펴보십시오.


이 문서는 영어로 작성되었습니다. 원본 문서는 여기에서 확인하십시오.

0 0 0
Share on

Regional Content Hub

67 posts | 2 followers

You may also like

Comments