全部产品
Search
文档中心

E-MapReduce:Memulai

更新时间:Jul 06, 2025

Topik ini menjelaskan cara memulai menggunakan Alibaba Cloud Object Storage Service (OSS) atau OSS-HDFS.

Prasyarat

  • OSS telah diaktifkan. Untuk informasi lebih lanjut, lihat Aktifkan OSS.
  • Bucket OSS telah dibuat. Untuk informasi lebih lanjut, lihat Buat bucket.
  • Akun Anda memiliki izin untuk mengakses OSS.
    • Secara default, akun Anda memiliki izin yang diperlukan jika Anda menggunakan kluster E-MapReduce (EMR) di konsol EMR baru. Untuk informasi lebih lanjut, lihat Tetapkan peran ke akun Alibaba Cloud.
    • Secara default, akun Anda memiliki izin yang diperlukan jika Anda menggunakan kluster EMR di konsol EMR lama. Untuk informasi lebih lanjut, lihat Tetapkan peran.
    • Untuk informasi tentang cara memberikan izin yang diperlukan kepada pengguna yang tidak menggunakan kluster EMR, lihat Berikan akses ke OSS atau OSS-HDFS.
  • (Opsional) OSS-HDFS telah diaktifkan dan izin untuk mengakses OSS-HDFS telah diberikan. Kami merekomendasikan agar Anda mengaktifkan OSS-HDFS.
  • JindoSDK telah diterapkan.
    • Dalam kluster EMR, JindoSDK secara otomatis diterapkan.
      Catatan Untuk mengakses OSS-HDFS, Anda harus membuat kluster EMR V3.42.0 atau versi minor terbaru, atau EMR V5.8.0 atau versi minor terbaru.
    • Jika Anda tidak menggunakan kluster EMR, Anda harus menerapkan JindoSDK secara manual. Untuk informasi lebih lanjut, lihat Terapkan JindoSDK di lingkungan selain EMR.
      Catatan Untuk mengakses OSS-HDFS, Anda harus menerapkan JindoSDK 4.X atau versi terbaru.

Deskripsi jalur

Metode yang digunakan untuk mengakses OSS dan OSS-HDFS sama, tetapi titik akhir dalam jalur akses berbeda. Tabel berikut menjelaskan contoh jalur akses.

Sistem penyimpananContoh jalur rootDeskripsi
OSSoss://examplebucket.oss-cn-shanghai-internal.aliyuncs.com/Sebuah Bucket OSS bernama examplebucket dibuat di wilayah China (Shanghai). Anda dapat mengakses Bucket OSS tersebut menggunakan titik akhir internal.
Catatan Jika Anda tidak menetapkan alamat IP publik ke node dalam kluster EMR, Anda tidak dapat mengakses OSS menggunakan titik akhir publik. Ini menunjukkan bahwa Anda tidak dapat mengakses OSS lintas wilayah.
OSS-HDFSoss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/Sebuah Bucket OSS-HDFS bernama examplebucket dibuat di wilayah China (Shanghai).
Catatan Anda hanya dapat mengakses OSS-HDFS menggunakan alamat IP privat. Ini menunjukkan bahwa Anda tidak dapat mengakses OSS-HDFS lintas wilayah.

Metode akses

Anda dapat mengakses OSS atau OSS-HDFS melalui konsol OSS atau dengan menjalankan perintah Shell Hadoop, perintah CLI Jindo, atau Antarmuka Sistem Operasi Portabel (POSIX). Tabel berikut menjelaskan metode akses.
Metode aksesContohDeskripsi
Perintah Shell Hadoophadoop fs -ls oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/JindoOssFileSystem di JindoSDK adalah implementasi dari Hadoop FileSystem. Saat Anda menjalankan perintah Shell Hadoop, titik akhir dalam jalur digunakan untuk mengakses OSS atau OSS-HDFS. Untuk informasi lebih lanjut, lihat Gunakan perintah Shell Hadoop untuk mengakses OSS atau OSS-HDFS.
Perintah CLI Jindojindo fs -ls oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/Anda dapat menjalankan perintah CLI Jindo untuk mengakses OSS atau OSS-HDFS dengan cara yang mirip seperti Anda menjalankan perintah Shell Hadoop. Anda juga dapat menjalankan perintah CLI Jindo untuk melakukan operasi lainnya, seperti pengarsipan, caching, dan analisis kesalahan. Untuk informasi lebih lanjut, lihat Gunakan perintah CLI Jindo untuk mengakses OSS atau OSS-HDFS.
Perintah POSIXmkdir -p /mnt/oss jindo-fuse /mnt/oss -ouri=oss://examplebucket.cn-shanghai.oss-dls.aliyuncs.com/ ls /mnt/ossJindoFuse dapat melampirkan jalur OSS atau OSS-HDFS ke jalur lokal dengan memanggil API FUSE. Dengan cara ini, Anda dapat mengakses OSS atau OSS-HDFS dengan cara yang sama seperti Anda mengakses file lokal. Untuk informasi lebih lanjut, lihat Gunakan perintah POSIX untuk mengakses OSS atau OSS-HDFS.
Konsol OSSOSS consoleUntuk mengakses OSS atau OSS_HDFS, Anda dapat melakukan operasi berikut:
  1. Masuk ke Konsol OSS.
  2. Di panel navigasi di sebelah kiri, klik Bucket. Di halaman Bucket, temukan bucket yang diinginkan dan klik nama bucket tersebut.
  3. Klik tab OSS Object atau HDFS untuk mengakses OSS atau OSS-HDFS.