Topik ini menjelaskan cara menggunakan fitur sinkronisasi data DataWorks untuk memigrasikan data dari MaxCompute ke Object Storage Service (OSS).
Prosedur
Aktifkan layanan
Buat tabel di DataWorks
Login ke Konsol DataWorks dan pilih Wilayah di pojok kiri atas.
Pada panel navigasi kiri, klik Workspace.
Pada halaman Workspaces, temukan workspace target dan pada kolom Actions, pilih .
Pada halaman DataStudio, buat node MaxCompute SQL. Gunakan pernyataan berikut untuk membuat tabel bernama
transs.CREATE TABLE transs (name STRING, id STRING, gender STRING);
Impor data ke tabel
transsSimpan data sampel berikut ke komputer Anda sebagai file
CSV.qwe,145,F asd,256,F xzc,345,M rgth,234,F ert,456,F dfg,12,M tyj,4,M bfg,245,M nrtjeryj,15,F rwh,2344,M trh,387,F srjeyj,67,M saerh,567,MPada panel navigasi kiri, pilih .
Klik Go to Data Upload and Download.
Pada panel navigasi kiri, klik ikon upload
lalu klik Upload Data.
Buat file di OSS
Login ke Konsol Object Storage Service (OSS).
Pada panel navigasi kiri, klik Buckets.
Pada halaman Buckets, klik Create Bucket.
Buat file bernama
qwee.csvdi komputer Anda dan unggah ke OSS. Untuk informasi selengkapnya, lihat Upload objects. Pastikan nama bidang dalam file qwee.csv sesuai dengan nama bidang di tabel transs.
Tambahkan sumber data MaxCompute di DataWorks
Login ke Konsol DataWorks dan pilih Wilayah di pojok kiri atas.
Pada panel navigasi kiri, klik Workspace.
Pada halaman Workspaces, klik nama workspace target.
Pada halaman Workspace Details, klik Data Sources pada panel navigasi kiri.
Pada tab Data Source, klik Add Data Source, lalu pilih MaxCompute.
Pada halaman Add MaxCompute Data Source, konfigurasikan Basic Information.
Untuk informasi selengkapnya, lihat Configure a MaxCompute data source.
Tambahkan sumber data OSS di DataWorks
Untuk informasi selengkapnya, lihat Configure an OSS data source.
Konfigurasikan reader MaxCompute (ODPS) dan writer OSS
Login ke Konsol DataWorks dan pilih Wilayah di pojok kiri atas.
Pada panel navigasi kiri, pilih .
Pada bagian Select Workspace, klik Go To DataStudio.
Pada panel kiri DataStudio, klik ikon
lalu pilih .Untuk Data source, pilih OSS.
Untuk Data destination, pilih MaxCompute (ODPS).
Pada halaman konfigurasi node, konfigurasikan parameter-parameter berikut.
Data Source > Source: Pilih sumber data OSS yang baru ditambahkan.
Data Source-Destination: Pilih sumber data MaxCompute tujuan.
Untuk Data Source - Text Type: Pilih CSV.
Data Source > File Path: Jalur file input.
Destination-Table: Tabel MaxCompute tujuan.
Runtime Resource: Pilih kelompok sumber daya khusus.
Biarkan nilai default untuk parameter lainnya.
Anda juga dapat mengklik ikon
di atas bagian konfigurasi untuk beralih ke editor kode dan mengonfigurasi node menggunakan skrip. Kode berikut merupakan contoh:{ "order":{ "hops":[ { "from":"Reader", "to":"Writer" } ] }, "setting":{ "errorLimit":{ "record":"0" }, "speed":{ "concurrent":1, "dmu":1, "throttle":false } }, "steps":[ { "category":"reader", "name":"Reader", "parameter":{ "column":[ "name", "id", "gender" ], "datasource":"odps_first", "partition":[], "table":"Transs" }, "stepType":"odps" }, { "category":"writer", "name":"Writer", "parameter":{ "datasource":"Trans", "dateFormat":"yyyy-MM-dd HH:mm:ss", "encoding":"UTF-8", "fieldDelimiter":",", "fileFormat":"csv", "nullFormat":"null", "object":"qwee.csv", "writeMode":"truncate" }, "stepType":"oss" } ], "type":"job", "version":"2.0" }Klik Run.
Lihat data yang telah disinkronkan di Konsol OSS. Untuk informasi selengkapnya, lihat Download objects.