本文介绍在线迁移过程中使用的参数。
阿里云OSS
- 域名(旧版为OSS Endpoint)OSS的域名(Endpoint)支持如下四种格式:
当使用其它数据源时,OSS会使用内网上传。以下格式均为非法:序号 格式 说明 1 http://oss-cn-hangzhou.aliyuncs.com 使用公网,以HTTP方式上传或下载数据。 2 http://oss-cn-hangzhou-internal.aliyuncs.com 使用内网,以HTTP方式上传或下载数据。 3 https://oss-cn-hangzhou.aliyuncs.com 使用公网,以HTTPS方式上传或下载数据。 4 https://oss-cn-hangzhou-internal.aliyuncs.com 使用内网,以HTTPS方式上传或下载数据。 关于OSS的Endpoint详细列表,请参见访问域名。
- 存储桶(Bucket)(旧版为OSS Bucket)
请填写正确的存储空间名称,前缀和后缀不带空格、换行、制表符等非法字符。
- 前缀(旧版为OSS Prefix)
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如
docs/
。 - AccessKeyId(旧版为Access Key Id)和SecretAccessKey(旧版为Access Key Secret)
访问密钥,简称为AK和SK。迁移服务的AK和SK可以是阿里云账号、RAM用户的密钥,不能是临时用户的密钥。更多信息,请参见访问控制。目前尚不支持服务费授权。
如果OSS作为迁移服务的数据源,RAM用户可以使用以下Policy授权:如果OSS作为迁移服务的目标,RAM用户可以使用以下Policy授权:您可以为迁移服务创建特定RAM用户,生成专用的AK和SK,迁移任务完成后删除相应的AK和SK。
- (仅旧版支持)迁移存储量和迁移文件个数
存储空间下的存储量和文件数可以通过OSS管理控制台查看。
AWS S3
- 域名(旧版为Endpoint)迁移服务支持以下区域及Endpoint格式,其它的格式均不支持。协议支持HTTPS和HTTP的域名。
RegionName Region Endpoint US East(Ohio) us-east-2 - http://s3.us-east-2.amazonaws.com(推荐)
- http://s3-us-east-2.amazonaws.com
US East(N. Virginia) us-east-1 - http://s3.us-east-1.amazonaws.com(推荐)
- http://s3-us-east-1.amazonaws.com
US West(N.California) us-west-1 - http://s3.us-west-1.amazonaws.com(推荐)
- http://s3-us-west-1.amazonaws.com
US West(Oregon) us-west-2 - http://s3.us-west-2.amazonaws.com(推荐)
- http://s3-us-west-2.amazonaws.com
Canada(Central) ca-central-1 - http://s3.ca-central-1.amazonaws.com (推荐)
- http://s3-ca-central-1.amazonaws.com
Asia Pacific(Seoul) ap-northeast-2 - http://s3.ap-northeast-2.amazonaws.com(推荐)
- http://s3-ap-northeast-2.amazonaws.com
Asia Pacific(Osaka-Local) ap-northeast-3 - http://s3.ap-northeast-3.amazonaws.com(推荐)
- http://s3-ap-northeast-3.amazonaws.com
Asia Pacific(Singapore) ap-southeast-1 - http://s3.ap-southeast-1.amazonaws.com(推荐)
- http://s3-ap-southeast-1.amazonaws.com
Asia Pacific(Sydney) ap-southeast-2 - http://s3.ap-southeast-2.amazonaws.com(推荐)
- http://s3-ap-southeast-2.amazonaws.com
Asia Pacific(Tokyo) ap-northeast-1 - http://s3.ap-northeast-1.amazonaws.com(推荐)
- http://s3-ap-northeast-1.amazonaws.com
China(Beijing) cn-north-1 http://s3.cn-north-1.amazonaws.com.cn China(Ningxia) cn-northwest-1 http://s3.cn-northwest-1.amazonaws.com.cn EU(Frankfurt) eu-central-1 - http://s3.eu-central-1.amazonaws.com(推荐)
- http://s3-eu-central-1.amazonaws.com
EU(Ireland) eu-west-1 - http://s3.eu-west-1.amazonaws.com(推荐)
- http://s3-eu-west-1.amazonaws.com
EU(London) eu-west-2 - http://s3.eu-west-2.amazonaws.com (推荐)
- http://s3-eu-west-2.amazonaws.com
EU(Paris) eu-west-3 - http://s3.eu-west-3.amazonaws.com (推荐)
- http://s3-eu-west-3.amazonaws.com
South America(São Paulo) sa-east-1 - http://s3.sa-east-1.amazonaws.com(推荐)
- http://s3-sa-east-1.amazonaws.com
- 存储桶(Bucket)(旧版为Bucket)
请填写正确的存储空间名称,前缀和后缀不带空格、换行、制表符等非法字符。
- 前缀(旧版为Prefix)
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如
docs/
。 - AccessKeyId(旧版为Access Key Id)和SecretAccessKey(旧版为Secret Access Key)
请在AWS控制台的IAM页面,创建用户并授予
AmazonS3ReadOnlyAccess
权限,然后再创建访问密钥。迁移完成后删除用户。 - 迁移存储量和迁移文件个数
请认真评估,确保与实际值相符。
Azure Blob
- 存储账户、密钥、连接字符串
- 容器
容器即Azure中的container。
- 前缀
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如
docs/
。 - 迁移存储量和迁移文件个数
腾讯云COS
- 域名(旧版为所属地区)COS支持以下地域,所属地区请填写地域简称。更多信息,请参见地域和访问域名。
- 中国内地地域
地域 地域简称 中国内地 公有云地域 北京一区 ap-beijing-1 北京 ap-beijing 南京 ap-nanjing 上海 ap-shanghai 广州 ap-guangzhou 成都 ap-chengdu 重庆 ap-chongqing 金融云地域 深圳金融 ap-shenzhen-fsi 上海金融 ap-shanghai-fsi 北京金融 ap-beijing-fsi - 中国香港及海外地域
地域 地域简称 亚太 公有云地域 中国香港 ap-Hong Kong(China) 新加坡 ap-singapore 孟买 ap-mumbai 雅加达 ap-jakarta 首尔 ap-seoul 曼谷 ap-bangkok 东京 ap-tokyo 北美 硅谷(美西) na-siliconvalley 弗吉尼亚(美东) na-ashburn 多伦多 na-toronto 南美 圣保罗 sa-saopaulo 欧洲 法兰克福 eu-frankfurt 莫斯科 eu-moscow
- 中国内地地域
- 存储桶(Bucket)(旧版为Bucket)
COS Bucket(存储桶)名称由
自定义名称-APPID
构成。例如空间名称为example-1234567890
。迁移服务的Bucket项为example
。 - 前缀(旧版为Prefix)
迁移指定目录下的文件,即指定前缀的文件。请以正斜线(/)开头,以正斜线(/)结尾,例如
/docs/
。 - (仅旧版支持)APPID请在腾讯云对象存储控制台账号信息页面查看,如下图所示。
- AccessKeyId(旧版为Secret Id)和SecretAccessKey(旧版为Secret Key)
请在腾讯云对象存储控制台,选择 。在访问控制页面,查看或新建密钥。推荐您为迁移服务新建密钥,迁移完成后删除。
- (仅旧版支持)迁移存储量和迁移文件个数
七牛云
- 域名(旧版为Endpoint)Endpoint即
http://域名
,示例如下。http://oy4jki81y.bkt.clouddn.com http://78rets.com1.z0.glb.clouddn.com http://cartoon.u.qiniudn.com
说明 以上三种格式的Endpoint都是有效的,其它格式均无效。 - 存储桶(Bucket)(旧版为Bucket)
即七牛云对象存储的存储空间。
- 前缀(旧版为Prefix)
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,如
docs/
。 - Access Key和Secret Key在七牛云管理控制台,选择 ,查看AK和SK,即Access Key和Secret Key。说明 请使用状态为使用中的有效AK和SK。
- (仅旧版支持)迁移存储量和迁移文件个数
百度云BOS
- Endpoint目前支持华北-北京、华南-广州和华东-苏州三个区域。迁移服务使用的Endpoint请参见下表。
区域 服务域名 访问协议 Endpoint 北京 bj.bcebos.com http或https http://bj.bcebos.com 广州 gz.bcebos.com http://gz.bcebos.com 苏州 su.bcebos.com http://su.bcebos.com 登录百度云对象存储BOS控制台,单击Bucket列表,选择Bucket名称后,可在概览界面查看Bucket的区域。
- Prefix
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如
docs/
。 - Access Key ID和Secret Access Key
登录百度云对象存储BOS控制台,选择 查看。
- 迁移存储量和迁移文件个数
登录百度云对象存储BOS控制台,单击Bucket列表,选择Bucket名称后,可在概览页面查看Bucket的存储量。文件个数请认真评估,尽量准确。
HTTP HTTPS
新版
- 列表路径
HTTP/HTTPS列表文件包括2类文件,1个manifest.json文件和1个或多个example.csv.gz文件,example.csv.gz为CSV压缩后的列表文件,单个example.csv.gz文件大小不超过50 MB,manifest.json为对CSV文件进行列配置的文件,支持上传至OSS或者AWS S3。
- 创建CSV列表文件在本地创建CSV格式的列表文件。列表文件最多支持8项,项与项之间用英文逗号(,)分隔;每行一个文件,文件之间用
\n
换行。各项的含义如下表所示。重要 Key和Url为必填项,其余项可以不填写。- 必填项
名称 是否必填 说明 Url 是 在线迁移服务使用该链接的Get请求下载文件内容,Head请求获取文件元数据。 说明 Url需确保可以直接使用 [curl --HEAD "$url"]、[curl --GET "$url"] 等命令正常访问。Key 是 迁移后的Object Name为prefix+文件名。 例如创建的本地列表文件名称为example.csv,格式为CSV,列表文件内容如下所示。
其中Url、Key项必须要做编码处理,编码后可避免冲突和歧义导致的迁移失败,编码后的列表内容如下。http://docs-aliyun.cn-hangzhou.oss.aliyun-inc.com/docs/my.log,docs/my.docir/example.log,,,,,,, http://docs-aliyun.cn-hangzhou.oss.aliyun-inc.com/docs/my.doc,docs/my.docir/example.txt,,,,,,,
http%3A%2F%2Fdocs-aliyun.cn-hangzhou.oss.aliyun-inc.com%2Fdocs%2Fmy.log, docs%2Fmy.docir%2Fexample.log,,,,,,, http%3A%2F%2Fdocs-aliyun.cn-hangzhou.oss.aliyun-inc.com%2Fdocs%2Fmy.doc, docs%2Fmy.docir%2Fexample.txt,,,,,,,
说明- Url项的编码原则:在
curl
等命令行工具可正常访问的基础上,再进行一次URL编码。 - Key项的编码原则:在您期望该文件在OSS上的ObjectName基础之上,再进行一次URL编码。
Python编码参考示例如下所示。
# -*- coding: utf-8 -*- import sys # 兼容Python2和3版本。 if sys.version_info.major == 3: from urllib.parse import quote_plus else: from urllib import quote_plus # url项需确保可以直接使用[curl --HEAD "$url"]、[curl --GET "$url"]命令正常访问。 # key项为迁移至OSS后的ObjectName(相对路径),当任务的目的端配置包含前缀(Prefix)时,OSS的完整ObjectName为Prefix+key。 raw_urls = [ # 格式:($url, $key)。 ("http://asciiweb.com/path/f1.txt?t=aef87e23c", "path/f1.txt"), ("http://unicodeweb.com/path/中国α%β.txt?t=aef87e23c", "path/中国α%β.txt"), ("http://urlencodedweb.com/path/%CE%B1%25%CE%B2.jpg?t=aef87e23c", "path/%CE%B1%25%CE%B2.jpg"), ("http://specialcharsweb.com/path/a%b, c\\d.txt?t=aef87e23c", "path/a%b, c\\d.txt") ] for item in raw_urls: url,key = item[0],item[1] enc_url = quote_plus(url) enc_key = quote_plus(key) # enc_url, enc_key即为HTTP清单csv中对应的Url、Key项,编码后可完全避免冲突和歧义导致的失败。 print("(%s, %s) -> (%s, %s)" % (url, key, enc_url, enc_key))
- Url项的编码原则:在
- 全部项
名称 是否必填 说明 Key 是 迁移后的Object Name为prefix+文件名。 Url 是 在线迁移服务使用该链接的Get请求下载文件内容,Head请求获取文件元数据。 Size 否 迁移文件的大小。 StorageClass 否 源Bucket的存储类型。 LastModifiedDate 否 待迁移文件的最后修改时间。 ETag 否 待迁移文件的ETag。 HashAlg 否 待迁移文件的Hash算法。 HashValue 否 待迁移文件的Hash值。 说明 以上示例中各项的顺序并非固定顺序,只需与manifest.json文件中fileSchema项顺序保持一致即可。
- 必填项
- 压缩CSV文件需要将CSV文件压缩为csv.gz文件,压缩方法如下:
- 压缩单个文件例如dir目录下有一个文件file1,需执行如下压缩命令:
gzip -r dir
压缩后得到说明 执行以上gzip
命令压缩文件,不会保留源文件,如需保留源文件压缩,请执行命令gzip -c 源文件 >源文件.gz
。file1.gz
文件。 - 压缩多个文件例如dir目录下有三个文件file1、file2和 file3,需执行如下压缩命令:
gzip -r dir
压缩后得到三个文件file1.gz、file2.gz和file3.gz。说明gzip
命令不会打包目录,而是将指定目录下所有子文件分别进行压缩。
- 压缩单个文件
- 创建manifest.json文件支持配置多个CSV文件,具体内容如下。
- fileFormat:指定列表文件格式为CSV
- fileSchema:对应CSV中文件项,请注意顺序。
- files:
- key:CSV文件在Bucket中的位置。
- mD5checksum:16进制的MD5字符串,不区分大小写。例如:91A76757B25C8BE78BC321DEEBA6A5AD,如果不填写该值,则不会做校验。
- size:列表文件大小。
示例如下。{ "fileFormat":"CSV", "fileSchema":"Key, Url, Bucket, Size, StorageClass, LastModifiedDate, ETag, HashAlg, HashValue ", "files":[{ "key":"dir/example1.csv.gz", "mD5checksum":"", "size":0 },{ "key":"dir/example2.csv.gz", "mD5checksum":"", "size":0 }] }
- 您可以选择将创建的2类列表文件上传到OSS或AWS S3。
- 将创建的2类列表文件上传到OSS的具体操作请参见简单上传。说明
- 列表文件上传到OSS后,在线迁移服务会下载列表文件,并根据指定的地址迁移文件。
- 新建任务时,请填写文件列表所在Bucket信息,列表路径的格式为
列表所在目录/manifest.json
,例如dir/manifest.json。
- 将创建的2类列表文件上传到AWS S3。说明
- 列表文件上传到AWS S3后,在线迁移服务会下载列表文件,并根据指定的地址迁移文件。
- 新建任务时,请填写文件列表所在Bucket信息,列表路径的格式为
列表所在目录/manifest.json
,例如dir/manifest.json。
- 将创建的2类列表文件上传到OSS的具体操作请参见简单上传。
- 创建CSV列表文件
- 列表域名
- OSS的Endpoint支持如下四种格式:
OSS的Endpoint详细列表,请参见访问域名。序号 格式 说明 1 http://oss-cn-hangzhou.aliyuncs.com 使用公网,以HTTP方式上传或下载数据。 2 http://oss-cn-hangzhou-internal.aliyuncs.com 使用内网,以HTTP方式上传或下载数据。 3 https://oss-cn-hangzhou.aliyuncs.com 使用公网,以HTTPS方式上传或下载数据。 4 https://oss-cn-hangzhou-internal.aliyuncs.com 使用内网,以HTTPS方式上传或下载数据。 - AWS S3的域名(Endpoint)请参见AWS S3。
- 列表AccessKeyId和列表SecretAccessKey迁移服务需要使用该AK和SK下载列表文件。
- 将列表文件上传至OSS时,输入阿里云账号的AccessKey ID和AccessKey Secret,或RAM用户的AccessKey ID和AccessKey Secret,需要授予GetObject权限。
- 将列表文件上传至AWS S3时,输入用于迁移的访问密钥。迁移完成后删除。
旧版
- 列表地址列表文件格式:列表文件有两列。
- 第一列是HTTP、HTTPS地址:地址中的特殊字符请进行URL编码。迁移服务用该链接的Get请求下载文件内容,Head请求获取文件元数据。
- 第二列是的文件名:迁移后的object name是prefix+文件名。两列用制表符
\t
分割。
\n
分割,格式如下所示。http://127.0.0.1/docs/my.doc docs/my.doc http://127.0.0.1/pics/my.jpg pics/my.jpg http://127.0.0.1/exes/my.exe exes/my.exe
列表地址格式:
迁移文件生成后,请上传到OSS。迁移服务会下载列表文件,并根据指定的地址迁移文件。列表地址的格式是oss://{bucket}/{列表文件},示例如下。oss://mybucket/httplist.txt
- 列表访问EndpointOSS的Endpoint支持如下四种格式:
OSS的Endpoint详细列表,请参见访问域名。序号 格式 说明 1 http://oss-cn-hangzhou.aliyuncs.com 使用公网,以HTTP方式上传或下载数据 2 http://oss-cn-hangzhou-internal.aliyuncs.com 使用内网,以HTTP方式上传或下载数据 3 https://oss-cn-hangzhou.aliyuncs.com 使用公网,以HTTPS方式上传或下载数据 4 https://oss-cn-hangzhou-internal.aliyuncs.com 使用内网,以HTTPS方式上传或下载数据 - 列表访问AK和列表访问SK
迁移服务需要使用该AK和SK下载列表文件。该AK和SK可以是阿里云账号的AK和SK,也可以是RAM用户的AK和SK,需要授予GetObject权限。
- 迁移存储量和迁移文件个数
请认真评估,确保与实际值相符。
又拍云USS
- 地址即对象存储SDK的接入点,REST API中的域名请参见下表。说明 如果您不能确定自己的网络类型,请使用http://v0.api.upyun.com。
网络类型 地址 说明 智能选路 http://v0.api.upyun.com 推荐使用 电信线路 http://v1.api.upyun.com 无 联通(网通)线路 http://v2.api.upyun.com 无 移动(铁通)线路 http://v3.api.upyun.com 无 - 服务名称
登录又拍云控制台,在云存储中查看。
- 迁移目录
迁移指定目录下的文件,请以正斜线(/)结尾,不要以正斜线(/)开头,例如docs/。
- 操作员名和操作员密码在云存储页面,选择待迁移的服务名称,进入 页面,并授权操作员,如下图所示。
- 迁移存储量和迁移文件个数
登录又拍云控制台,在 页面,查看Bucket的存储量和文件个数。请认真评估,尽量准确。
金山云KS3
- EndpointRegion(区域)与Endpoint(域名)的对应关系请参见Regions and Endpoints。说明 Bucket(存储空间)的Region,请在金山云管理控制台的 页面查看。
- Bucket
即金山云对象存储的空间。
- Prefix
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如
docs/
。 - Access Key ID和Secret Key
登录金山云管理控制台,在 页面,创建用户并授予
KS3FullAccess
权限,然后在用户页面新建密钥。在迁移完成后删除该用户。 - 迁移存储量和迁移文件个数
登录金山云管理控制台,在 页面,查看Bucket的存储量和文件个数。请认真评估,尽量准确。
华为云OBS
- Endpoint华为云存储支持的区域请参见下表。更多信息,请参见地区和终端结点。
区域名称 区域 Endpoint 协议类型 华北-北京四 cn-north-4 obs.cn-north-4.myhuaweicloud.com HTTPS、HTTP 华北-北京一 cn-north-1 obs.cn-north-1.myhuaweicloud.com 华东-上海二 cn-east-2 obs.cn-east-2.myhuaweicloud.com 华东-上海一 cn-east-3 obs.cn-east-3.myhuaweicloud.com 华南-广州 cn-south-1 obs.cn-south-1.myhuaweicloud.com 西南-贵阳一 cn-southwest-2 obs.cn-southwest-2.myhuaweicloud.com 亚太-曼谷 ap-southeast-2 obs.ap-southeast-2.myhuaweicloud.com 亚太-中国香港 ap-southeast-1 obs.ap-southeast-1.myhuaweicloud.com 亚太-新加坡 ap-southeast-3 obs.ap-southeast-3.myhuaweicloud.com 非洲-约翰内斯堡 af-south-1 obs.af-south-1.myhuaweicloud.com - Bucket
即华为云OBS桶的名称。
- Prefix
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如
docs/
。 - Access Key ID和Secret Access Key
登录华为云控制台,将鼠标移至右上角的账号上,在下拉列表中选择我的凭证。在左侧导航栏,选择访问密钥,单击新增访问密钥获取密钥。
- 迁移存储量和迁移文件个数
UCloud UFile
- 所属地域即地域(Region),支持地域请参见下表。更多信息,请参见地区和可用区列表。
地域名称 地域 北京一 cn-bj1 北京二 cn-bj2 中国香港 hk 广州 cn-gd 上海二 cn-sh2 洛杉矶 us-ca 新加坡 sg 雅加达 idn-jakarta 拉各斯 afr-nigeria 圣保罗 bra-saopaulo 迪拜 uae-dubai 胡志明市 vn-sng 台北 tw-tp 孟买 ind-mumbai 华盛顿 us-ws 法兰克福 ge-fra - 存储空间
即对象存储空间(Bucket)。
- Prefix
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如
docs/
。 - 公钥和私钥
登录UCloud控制台,在API密钥页面中,查看PublicKey和PrivateKey。
- 迁移存储量和迁移文件个数
登录UCloud控制台,在对象存储UFile页面中的存储空间详情的概览页面查看存储量。文件个数请认真评估,尽量准确。
GCP
在线迁移服务中GCP的参数说明如下所示。
- Bucket
即Google Storage中的存储分区名。
- Prefix
迁移指定目录下的文件,即指定前缀的文件,不包括文件名称为前缀的文件。请以正斜线(/)结尾,不要以正斜线(/)开头,例如docs/。
- Key File
- 登录GCP控制台。
- 在左侧导航栏,单击服务账号。
- 在服务账号页面,创建服务账号或选择目标服务账号,选择目标账号操作列的 。
- 在创建密钥页面中,选中JSON,单击确认。
- 浏览器会自动下载JSON密钥文件。请您在在线迁移服务的Key File中上传此JSON文件。
- 迁移存储量和迁移文件个数
请您根据实际迁移场景认真评估,确保与实际值相符,以免影响迁移效率。当指定Prefix迁移时,请填写此Prefix下的迁移存储量和迁移文件个数。