Apsara File Storage for HDFS adalah layanan penyimpanan file untuk sumber daya komputasi seperti Instance ECS Alibaba Cloud dan Container Service. Anda dapat mengelola serta mengakses data di Apsara File Storage for HDFS dengan cara yang sama seperti pada sistem file terdistribusi Hadoop, tanpa perlu memodifikasi aplikasi analitik data besar Anda. Layanan ini menawarkan kapasitas tak terbatas, penskalaan performa, namespace unik, berbagi multipihak, keandalan tinggi, dan ketersediaan tinggi.
Skenario
Apsara File Storage for HDFS cocok untuk skenario yang memerlukan throughput tinggi, seperti analitik data besar dan pembelajaran mesin. Layanan ini mendukung akses throughput tinggi dan latensi rendah, sehingga Anda tidak perlu memindahkan data ke sumber daya komputasi lokal.
Setelah data disimpan di Apsara File Storage for HDFS, Instance ECS atau sumber daya komputasi lainnya dapat langsung mengaksesnya. Anda dapat menerapkan Hadoop atau aplikasi pembelajaran mesin lainnya pada beberapa sumber daya komputasi, sehingga aplikasi dapat mengakses data menggunakan operasi Hadoopfs untuk melakukan komputasi online atau offline. Hasil komputasi juga dapat diekspor ke Apsara File Storage for HDFS untuk penyimpanan permanen.
Performa
Performa Apsara File Storage for HDFS diukur berdasarkan throughput. Throughput praktis dari sistem file ini tidak dapat melebihi bandwidth maksimum Instance ECS tempat sistem file dipasang. Sebagai contoh, jika bandwidth Instance ECS adalah 1,5 Gbit/s, throughput sistem file dapat mencapai maksimum 187,5 Mbit/s. Throughput bergantung pada kapasitas sistem file tersebut.
Ketahanan data dan ketersediaan layanan
Seperti File Storage NAS, Apsara File Storage for HDFS menyediakan beberapa replika untuk setiap data yang disimpan dalam sistem file. Replika ini tersebar di perangkat yang diisolasi di berbagai domain kesalahan untuk redundansi geografis. Apsara File Storage for HDFS menjamin keandalan data sebesar 99,999999999% (sebelas angka sembilan), mengurangi risiko keamanan data secara signifikan.
Skalabilitas dan elastisitas
Apsara File Storage for HDFS memberikan performa penyimpanan optimal untuk aplikasi Anda, termasuk throughput tinggi, IOPS tinggi, dan latensi rendah. Hubungan linear antara performa dan kapasitas memastikan bahwa kebutuhan penyimpanan dan performa Anda tetap terpenuhi seiring pertumbuhan bisnis.
Keamanan
Apsara File Storage for HDFS menggunakan berbagai mekanisme keamanan untuk melindungi data dalam sistem file. Mekanisme ini meliputi isolasi jaringan berbasis VPC, isolasi pengguna di jaringan klasik, kontrol izin standar untuk sistem file, kontrol akses berbasis grup keamanan, dan otorisasi pengguna RAM.
Operasi
Apsara File Storage for HDFS menyediakan SDK untuk sistem file dan manajemen. Selama pratinjau publik, hanya SDK untuk sistem file yang tersedia. Anda dapat melakukan operasi manajemen melalui konsol Apsara File Storage for HDFS. SDK Java untuk Apsara File Storage for HDFS mengimplementasikan operasi berbasis sistem file terdistribusi Hadoop, menyediakan kompatibilitas dengan Hadoop. SDK disediakan sebagai file JAR dengan format nama: aliyun-sdk-dfs-x.y.z.jar. Aplikasi berbasis Apache Hadoop seperti MapReduce, Hive, Spark, dan Flink dapat menggunakan SDK ini untuk memanfaatkan Apsara File Storage for HDFS sebagai sistem file default tanpa modifikasi kode, menawarkan performa lebih baik dibandingkan HDFS asli.
Jika Anda lebih suka antarmuka web grafis, Anda dapat menggunakan konsol untuk mengelola sistem file Apsara File Storage for HDFS.
Model biaya
Apsara File Storage for HDFS ditagih berdasarkan kapasitas dan throughput preset dari sistem file. Secara default, layanan ini ditagih per jam berdasarkan sumber daya yang digunakan (bayar sesuai pemakaian). Anda juga dapat membeli rencana sumber daya (langganan) di muka untuk mendapatkan diskon tambahan.