ストレージ/コンピューティング一体型インスタンスは、オンライン分析処理 (OLAP) の多次元分析、高同時実行クエリ、リアルタイムデータ分析など、高いクエリパフォーマンスを必要とするシナリオに適しています。このインスタンスタイプは、データをクラウドディスクまたはローカルディスクに保存して、高いデータ読み書き効率を確保します。このトピックでは、Alibaba Cloud アカウントを使用して EMR Serverless StarRocks ストレージ/コンピューティング一体型インスタンスを作成および使用する方法について説明します。
前提条件
Alibaba Cloud アカウントを登録し、ID 確認を完了します。
Resource Access Management (RAM) ユーザーの場合は、AliyunEMRStarRocksFullAccess システムポリシーを付与します。
説明AliyunEMRStarRocksFullAccess システムポリシーは、StarRocks インスタンスを作成および管理するために必要です。
注意事項
コードのランタイム環境は、環境の所有者によって管理および構成されます。
手順
ステップ 1: ストレージ/コンピューティング一体型 StarRocks インスタンスの作成
EMR Serverless StarRocks インスタンスリストページに移動します。
E-MapReduce コンソールにログインします。
左側のナビゲーションウィンドウで、 を選択します。
トップメニューバーで、必要なリージョンを選択します。
[インスタンスリスト] ページで、[インスタンスの作成] をクリックします。
[E-MapReduce Serverless StarRocks] ページで、インスタンスパラメーターを構成します。
構成
例
説明
プロダクトタイプ
従量課金
[従量課金] を選択します。課金の詳細については、「従量課金」をご参照ください。
リージョン
中国 (北京)
インスタンスの物理的な場所。
重要インスタンスの作成後にリージョンを変更することはできません。リージョンは慎重に選択してください。
ネットワークとゾーン
vpc_Hangzhou/vpc-bp1f4epmkvncimpgs****
ゾーン I
vsw_i/vsw-bp1e2f5fhaplp0g6p****
仮想プライベートクラウド、ゾーン、および対応する vSwitch 情報を選択します。
仮想プライベートクラウド (VPC): VPC は、Alibaba Cloud で定義する分離されたネットワーク環境です。VPC を完全に制御できます。
既存の VPC を選択するか、[VPC の作成] をクリックして VPC コンソールに移動し、VPC を作成します。詳細については、「VPC の作成と管理」をご参照ください。
説明VPC を作成する場合、IPv4 CIDR ブロックは RFC 1918 で定義されている次の 3 つのプライベートネットワーク範囲のいずれかから選択する必要があります:
10.0.0.0/8(10.0.0.0~10.255.255.255)172.16.0.0/12(172.16.0.0~172.31.255.255)192.168.0.0/16(192.168.0.0~192.168.255.255)
Serverless StarRocks インスタンスが、データのインポートや外部テーブルのクエリなどのためにインターネットにアクセスする必要がある場合は、その VPC がインターネットにアクセスできることを確認してください。VPC にインターネット NAT ゲートウェイをデプロイし、SNAT 機能を有効にすることができます。これにより、Serverless StarRocks インスタンスはゲートウェイを介してインターネットリソースにアクセスできます。詳細については、「インターネット NAT ゲートウェイの SNAT 機能を使用してインターネットにアクセスする」をご参照ください。
ゾーン: インスタンスが配置されているゾーン。
vSwitch: vSwitch は、異なるクラウドリソースを接続するために使用される VPC の基本的なネットワークモジュールです。
既存の vSwitch を選択するか、[VSwitch の作成] をクリックして VPC コンソールに移動し、vSwitch を作成します。詳細については、「vSwitch の作成と管理」をご参照ください。
インスタンスタイプ
ストレージ/コンピューティング一体型
OLAP 多次元分析、高同時実行クエリ、リアルタイムデータ分析など、高いクエリパフォーマンスを必要とするシナリオに適しています。このインスタンスタイプは、データをクラウドディスクまたはローカルディスクに保存して、高いデータ読み書き効率を確保します。
インスタンスシリーズ
Standard Edition
[Starter Edition] と [Standard Edition] をサポートしています。詳細については、「インスタンスファミリーの説明」をご参照ください。
説明Starter Edition は、中国 (北京)、中国 (上海)、中国 (深圳)、中国 (杭州) リージョンでのみ利用可能です。
バージョン
3.3
StarRocks のコミュニティバージョン番号。
FE 仕様
仕様タイプ: 標準
コンピューティング CU: 8 CU
データディスク: PL1 ESSD,
高可用性: デフォルトで有効。
ノード数: 3
負荷分散: 組み込み PrivateZone
仕様タイプ: FE ノードの仕様タイプは、StarRocks の [インスタンスシリーズ] によって異なります。
[Starter Edition]: [標準] をサポートします。
[Standard Edition]: [標準] および [メモリ拡張] 仕様をサポートします。
コンピューティング CU: コンピューティングユニット (CU) の数を選択します。
必要に応じて適切な CU 仕様を選択します。CU 料金の詳細については、「課金項目」をご参照ください。
データディスク: PL1 ESSD のみサポートされています。データディスクサイズは 100 GB から 65,000 GB の範囲で、ステップサイズは 100 です。
クラウドディスクの詳細については、「ESSD」をご参照ください。
高可用性: デフォルトで有効です。Standard Edition は高可用性 (HA) をサポートします。HA を有効にすると、StarRocks FE ノードの数が 1 から 3 に増加し、障害のリスクを軽減します。
重要本番環境では高可用性を有効にしてください。
ノード数: FE ノードの数。値は 1 から 11 までの奇数です。
負荷分散: 次のメソッドがサポートされています。
組み込み PrivateZone: PrivateZone の名前解決を使用して、トラフィックを自動的に分散します。追加料金はかかりません。これは、軽量なシナリオやコスト重視の環境に適しています。
非本番環境や、負荷分散パフォーマンスの要件が低いサービスに適しています。
Server Load Balancer (SLB): SLB サービスを使用して、高性能な負荷分散を実現します。これは、特に高いパフォーマンスと信頼性の要件を持つサービスの本番環境に推奨されます。
クエリトラフィックから FE リーダーを削除する機能は、SLB を有効にした後にのみ利用可能です。
SLB サービスを有効にする必要があり、追加料金が発生します。詳細については、「CLB 課金の概要」をご参照ください。
BE 仕様
仕様タイプ: 標準
コンピューティング CU: 8 CU
データディスク: PL1 ESSD, 100 GB, 1
ノード数: 3
仕様タイプ: BE ノードの仕様タイプは、StarRocks の [インスタンスシリーズ] によって異なります。
[Starter Edition]: [標準] をサポートします。
[Standard Edition]: 次の仕様をサポートします。
標準: デフォルトで推奨される仕様です。1 CU = 1 CPU コア + 4 GiB メモリ。この構成では、StarRocks のストレージソリューションとしてエンタープライズ SSD (ESSD) を使用します。
メモリ拡張: 1 RCU = 1 CPU コア + 8 GiB メモリ。このタイプは、多数の複雑なクエリや高い同時リクエストがある場合など、メモリ集約型のシナリオに適しています。StarRocks のストレージソリューションとして ESSD が使用されます。
ネットワーク拡張: 1 NCU = 1 CPU コア + 4 GiB メモリ。ネットワーク帯域幅は標準仕様の 2 倍以上です。このタイプは、外部テーブルの大量のデータをスキャンするシナリオに適しています。StarRocks ストレージには ESSD が使用されます。
パフォーマンス専有型ストレージ: 必要に応じて詳細な仕様を選択します。この仕様タイプでは、StarRocks ストレージのデータディスクとしてローカル SSD を使用します。ストレージの I/O パフォーマンス要件が厳しいシナリオに適しています。
大容量ストレージ: 必要に応じて詳細な仕様を選択します。この仕様タイプでは、StarRocks ストレージのデータディスクとしてローカル HDD を使用します。データ量が非常に大きいシナリオに適しています。このタイプは、全体的なストレージコストを効果的に削減できますが、ストレージの I/O パフォーマンス要件は比較的低くなります。
コンピューティング CU: コンピューティングユニット (CU) の数を選択します。
必要に応じて適切な CU 仕様を選択します。CU 料金の詳細については、「課金項目」をご参照ください。
データディスク: PL0 ESSD、PL1 ESSD (推奨)、PL2 ESSD、PL3 ESSD をサポートしています。詳細については、「ESSD」をご参照ください。
キャッシュディスクのサイズは 100 GB から 65,000 GB の範囲です。キャッシュディスクの数はデフォルトで 1 です。値は 1 から 8 の範囲で、ステップサイズは 1 です。
説明必要なストレージ容量を入力すると、システムが自動的にデフォルトの推奨構成を提供します。選択したクラウドディスク容量が推奨しきい値を超えると、システムはプロンプトを表示して、最適なパフォーマンスを確保するための適切な調整を支援します。
ノード数: BE ノードの数。値は 3 から 50 の範囲です。
インスタンス名
カスタムインスタンス名を入力します。
インスタンス名は 1~64 文字で、漢字、英字、数字、ハイフン (-)、アンダースコア (_) を使用できます。
管理者ユーザー名
admin
StarRocks を管理するために使用される管理者ユーザー名。デフォルト値は admin で、変更できません。
ログインパスワード と パスワードの確認
カスタムパスワードを入力します。
組み込み管理者 admin のパスワードです。パスワードを記録しておく必要があります。パスワードは、インスタンスを管理および使用するときに必要です。パスワードを忘れた場合は、リセットできます。詳細については、「インスタンスのパスワードをリセットするにはどうすればよいですか?」をご参照ください。
インスタンスパラメーターの詳細については、「インスタンスの作成」をご参照ください。
利用規約を選択し、[インスタンスの作成] をクリックして、プロンプトに従って支払いを完了します。
支払いが完了したら、インスタンスリストページに戻り、作成されたインスタンスを表示します。インスタンスの [ステータス] が [実行中] に変わると、インスタンスが作成されます。
ステップ 2: StarRocks インスタンスへの接続
[インスタンスリスト] ページで、[操作] 列の [インスタンスに接続] をクリックします。
他の方法でStarRocks インスタンスに接続することもできます。
StarRocks インスタンスに接続します。
[新しい接続] タブで、次のパラメーターを構成します。

パラメーター
例
説明
リージョン
中国 (杭州)
作成された StarRocks インスタンスの物理的な場所を選択します。
インスタンス
StarRocks_Serverless
作成された StarRocks インスタンスの名前を選択します。
接続名
Connection_Serverless
カスタム接続名を入力します。
名前は 1~64 文字で、漢字、英字、数字、ハイフン (-)、アンダースコア (_) を使用できます。
ユーザー名
実際のニーズに基づいて値を入力します。
デフォルトの初期ユーザー名は admin です。このユーザー名を使用して接続したり、必要に応じて他のユーザーを作成したりできます。ユーザーの作成方法の詳細については、「ユーザーの管理とデータ承認」をご参照ください。
パスワード
要件に基づいて値を入力します。
StarRocks インスタンスで作成されたユーザー名に対応するパスワード。
[接続テスト] をクリックします。
接続テストが成功したら、[OK] をクリックします。
[SQL エディター] ページで、SQL 文を実行できます。詳細については、「EMR StarRocks Manager を使用して StarRocks インスタンスに接続する」をご参照ください。
ステップ 3: SQL クエリの実行
[SQL エディター] の [クエリリスト] ページで、
アイコンをクリックします。[新しいファイル] ダイアログボックスで、[OK] をクリックします。
新しいファイルに、次のコマンドを入力します。すべてのコマンドを選択し、[実行] をクリックします。
/**データベースの作成**/ CREATE DATABASE IF NOT EXISTS load_test; /**データベースの使用**/ USE load_test; /**テーブルの作成**/ CREATE TABLE insert_wiki_edit ( event_time DATETIME, channel VARCHAR(32) DEFAULT '', user VARCHAR(128) DEFAULT '', is_anonymous TINYINT DEFAULT '0', is_minor TINYINT DEFAULT '0', is_new TINYINT DEFAULT '0', is_robot TINYINT DEFAULT '0', is_unpatrolled TINYINT DEFAULT '0', delta INT SUM DEFAULT '0', added INT SUM DEFAULT '0', deleted INT SUM DEFAULT '0' ) AGGREGATE KEY(event_time, channel, user, is_anonymous, is_minor, is_new, is_robot, is_unpatrolled) PARTITION BY RANGE(event_time) ( PARTITION p06 VALUES LESS THAN ('2015-09-12 06:00:00'), PARTITION p12 VALUES LESS THAN ('2015-09-12 12:00:00'), PARTITION p18 VALUES LESS THAN ('2015-09-12 18:00:00'), PARTITION p24 VALUES LESS THAN ('2015-09-13 00:00:00') ) DISTRIBUTED BY HASH(user) BUCKETS 10 PROPERTIES("replication_num" = "1"); /**データの挿入**/ INSERT INTO insert_wiki_edit VALUES("2015-09-12 00:00:00","#en.wikipedia","GELongstreet",0,0,0,0,0,36,36,0),("2015-09-12 00:00:00","#ca.wikipedia","PereBot",0,1,0,1,0,17,17,0); /**データのクエリ**/ select * from insert_wiki_edit;
次の情報が返されます。

ステップ 4: パフォーマンステストの実行
詳細については、「テスト手順」をご参照ください。
(オプション) ステップ 5: インスタンスのリリース
この操作により、インスタンスとそのすべてのリソースが削除されます。この操作は元に戻せません。注意して進めてください。
インスタンスが不要になった場合は、追加料金が発生しないようにインスタンスをリリースします。
[インスタンスリスト] ページで、インスタンスの [操作] 列にある [リリース] をクリックします。
表示されるダイアログボックスで、[OK] をクリックします。
参考資料
お問い合わせ
ご不明な点がございましたら、DingTalk グループ ID 24010016636 を検索し、グループに参加して質問してください。