全部产品
Search
文档中心

向量检索服务 Milvus 版:通过Skill进行集群管理与业务验证

更新时间:May 06, 2026

借助 alibabacloud-milvus-manage Skill,用户可通过自然语言指令直接完成集群创建、状态查看及公网访问配置,管理 Collection,执行文本/标量/向量搜索、BM25 全文检索与多路混合搜索,以及实现图片入库与以文搜图、音视频联合入库与跨模态检索等核心功能。

前提条件

  • 已安装 alibabacloud-milvus-manage Skill。获取地址:

  • 支持在以下客户端中安装Skill:

  • 已配置阿里云 CLI,并完成身份认证。执行 aliyun configure list 可查看当前配置。

  • 已准备 VPC 和 VSwitch(Skill 执行时会自动引导选择已有网络资源)。

  • 已创建 Milvus 服务关联角色(SLR)。首次使用 Milvus 时需要创建 AliyunServiceRoleForCloudMilvus 和 AliyunServiceRoleForMilvus。

使用场景

alibabacloud-milvus-manage Skill 覆盖 8 个端到端验证场景,分为集群管理和业务验证两类。

场景一:集群管理

创建集群

在 Skill 客户端中输入自然语言指令,即可创建 Milvus 实例。Skill 会自动完成 VPC/VSwitch 选择、组件规格配置和实例创建。

Skill 输入示例:

/alibabacloud-milvus-manage 在杭州j可用区创建一个2.6版本的milvus实例,密码使用<自定义密码>

执行效果:

// Skill 自动完成 VPC/VSwitch 选择、组件规格配置后,调用创建 API
// 返回结果:
{"success": true, "data": {"instanceId": "c-xxxxxxxxxxxx****", "orderId": "28456242743****"}}

// 创建参数:
// - 地域: cn-hangzhou, 可用区: cn-hangzhou-j
// - 版本: 2.6, 规格: standalone_pro, 4 CU
// - 计费方式: PayAsYouGo

查看实例状态

实例创建后,通过 Skill 查看实例的运行状态、连接地址和规格信息。

Skill 输入示例:

/alibabacloud-milvus-manage 查看创建情况

执行效果:

// Skill 调用 list API 和 detail API 查询实例状态

实例列表:
c-xxxxxxxxxxxx**** | milvus-skill-test | status=running | v=2.6

实例详情:
- 内网地址: c-xxxxxxxxxxxx****-internal.milvus.aliyuncs.com
- 端口: 19530
- 总 CU 数: 4
- 实例状态: running(创建后约 3 分钟从 creating 变为 running)

开启公网访问

为实例开启公网访问并配置 IP 白名单,用于本地开发或测试连接。

Skill 输入示例:

/alibabacloud-milvus-manage 给集群开启公网访问,添加本机ip

执行效果:

// Skill 自动获取本机 IP 并调用 updatePublicNetworkStatus API

公网访问已开启:
- 公网地址: c-xxxxxxxxxxxx****.milvus.aliyuncs.com:19530
- 白名单: <本机公网IP>/32

查询 Collection 列表

连接实例并查询所有 Collection 的基本信息和样例数据。

Skill 输入示例:

/alibabacloud-milvus-manage 查询所有collection,每个展示3条数据

执行效果:

// Skill 使用 pymilvus 连接实例,查询 collection 列表

连接方式: MilvusClient(uri='http://c-xxxxxxxxxxxx****.milvus.aliyuncs.com:19530', token='root:***')

Collection 列表: [](新实例暂无 Collection,符合预期)

场景二:业务验证

文本入库与搜索验证

将文本数据导入 Milvus,验证标量搜索、向量搜索和 Hybrid 搜索功能。Skill 会自动创建 Collection(包含 AI Function 自动生成 embedding),插入数据后执行多种搜索方式。

Skill 输入示例:

/alibabacloud-milvus-manage 我有一个 <数据文件路径>/articles.jsonl
文件,每行包含 title、content、embedding 字段,帮我导入到 article_db collection
里,如果没有的话创建它。导入完后,根据文件中内容随机构造一下标量搜索和向量搜索功能进行测试

<数据文件路径> 替换为实际的 JSONL 文件路径。文件每行为一个 JSON 对象,包含 titlecontent 字段。

执行效果:

// Skill 自动创建 article_db collection(含 AI Function: text-embedding-v3, 768 维)
// 插入 10 条文章数据(仅传文本,embedding 自动生成)

Collection 创建成功: article_db
  Fields: id, title, content, embedding
  AI Function: text-embedding-v3 (dim=768)

数据插入: 10 条

Skill 自动执行以下搜索验证:标量搜索(基于字段值的精确匹配或模糊匹配,如 title like "%向量%")、向量搜索(基于语义相似度的 ANN 检索)和 Hybrid 搜索(向量搜索 + 标量过滤条件)。

说明

建议采用 Milvus AI Embedding 功能进行向量数据处理与搜索。

  • 版本要求:Milvus 实例版本需为 2.6 及以上。

  • 替代方案:若当前实例版本不支持该功能,请提供已预处理好的向量数据。

// 标量搜索: title like "%向量%"
结果: 找到 "向量数据库入门"

// 向量搜索: "什么是机器学习和深度学习"
结果:
  top1: "机器学习算法总结"       (distance=0.7125)
  top2: "自然语言处理技术"       (distance=0.5164)
  top3: "向量数据库入门"         (distance=0.4779)

// Hybrid 搜索: "数据库技术" + filter='content like "%向量%"'
结果:
  top1: "向量数据库入门"         (distance=0.6001)
  top2: "Milvus使用最佳实践"     (distance=0.5276)

全文检索与混合搜索

创建同时配置 BM25 全文检索和 text-embedding-v3 语义向量的 Collection,验证多种搜索方式的组合效果。Milvus 2.6 的 AI Function 支持同时配置 BM25 和 embedding,插入时只需传原始文本,两种向量自动生成。

Skill 输入示例:

/alibabacloud-milvus-manage 我要在 Milvus 里做中文全文检索,需要建一个新的表,需要 title
和 content 两个文本字段,用 BM25 做全文检索,再加一个 text-embedding-v3 做语义搜索,维度
1024。创建好后插入文件中所有数据,然后分别用文件中的内容向量搜索,标量搜索,全文、
embedding的混合搜,全文、标量、向量的混合搜

执行效果:

// Skill 创建 hybrid_search_test collection
// 同时配置 BM25 Function(chinese analyzer)和 text-embedding-v3 AI Function(1024 维)
// 插入 10 条文章数据(仅传文本,BM25 稀疏向量和 embedding 稠密向量均自动生成)

Collection 创建成功: hybrid_search_test
  BM25 Function: content_sparse (chinese analyzer)
  AI Function: text-embedding-v3 (dim=1024)

数据插入: 10 条

Skill 自动执行五种搜索验证:向量搜索(基于 text-embedding-v3 的语义检索)、标量搜索(基于字段值的模糊匹配)、BM25 全文检索(基于 BM25 算法的关键词检索)、全文+embedding 混合搜索(BM25 和向量搜索通过 RRFRanker 融合)以及三路混合搜索(BM25 + 标量过滤 + 向量 ANN 通过 RRFRanker 融合)。

// 向量搜索: "如何构建语义搜索系统"
结果:
  top1: "向量数据库入门"         (distance=0.5575)
  top2: "Milvus使用最佳实践"     (distance=0.5402)

// 标量搜索: content like "%Milvus%"
结果: 找到 "向量数据库入门" 和 "Milvus使用最佳实践"

// BM25 全文检索: "向量数据库语义搜索"
结果:
  top1: "向量数据库入门"         (BM25 score=13.3037)

// 全文+embedding 混合搜索 (RRFRanker): "深度学习和神经网络"
结果:
  top1: "机器学习算法总结"       (score=0.0328)

// 三路混合搜索 (BM25 + 标量过滤 + 向量 ANN, RRFRanker):
//   BM25="索引检索向量", filter='title 含 Milvus 或向量', ANN="数据库索引和检索技术"
结果:
  top1: "向量数据库入门"         (score=0.0325)
  top2: "Milvus使用最佳实践"     (score=0.0325)

图片入库与搜索

将图片数据导入 Milvus,通过 qwen3-vl-embedding 多模态模型自动生成 embedding,验证文搜图功能。本示例中使用的图片,可从此处下载。

Skill 输入示例:

/alibabacloud-milvus-manage 把 <图片目录路径>/banana
目录的图片全部入库,最后用"黄色香蕉"搜索试试

<图片目录路径> 替换为实际的图片目录路径。Milvus 服务端需要能够访问图片 URL,建议将图片上传到同地域 OSS 并使用签名 URL。

执行效果:

// Skill 创建 multimodal_test collection
// 使用 qwen3-vl-embedding 多模态模型自动生成 embedding
// 上传图片到同地域 OSS,通过签名 URL 传入 Milvus

Collection 创建成功: multimodal_test
  Fields: id, file_path, file_type, description, mm_value, embedding
  AI Function: qwen3-vl-embedding

数据插入: 6 条(3 张香蕉图 + 2 张猫图 + 1 个飞机视频)

// 文搜图: "黄色香蕉"
结果:
  top1: banana/img2  (distance=0.5005)
  top2: banana/img3  (distance=0.4953)
  top3: banana/img1  (distance=0.4882)

// 文搜图: "可爱的猫"
结果:
  top1: cat2         (distance=0.5265)
  top2: cat1         (distance=0.4893)

跨模态搜索

将图片和视频联合入库,验证图搜图和图搜视频的跨模态检索能力。

Skill 输入示例:

/alibabacloud-milvus-manage 先把 tiger_cat目录下选2个文件 以及 飞机1.mp4 这三个文件入库,
然后用 tiger_cat 下任意一个文件搜索相似的产品图片,返回前 3 个。再用图片搜索相似视频

执行效果:

// 图搜图: 用 cat1 图片 URL 搜索相似图片
结果:
  top1: cat1         (distance=0.9996)
  top2: cat2         (distance=0.9476)
  top3: banana/img1  (distance=0.7483)

// 图搜视频: 用 cat1 图片 URL + filter='file_type=="video"'
结果:
  top1: airplane.mp4 (distance=0.7180)