このトピックでは、HBase Ganosの機能、利点、およびシナリオについて説明します。
HBase Ganosとは
HBase Ganosは、Alibaba Cloudによって開発された時空間エンジンです。 HBase Ganosを使用すると、空間ジオメトリデータ、時空間軌跡データ、主題ラスターデータ、およびリモートセンシング画像データを管理できます。 HBase Ganosは、オープンソースのGeoMesaおよびGeoServerエコシステムと互換性があります。 HBase Ganosは、時空間インデックスのためのアルゴリズム、トポロジカル空間を計算するためのジオメトリックアルゴリズム、リモートセンシング画像データを処理するためのアルゴリズムなど、効率的な組み込みアルゴリズムを提供します。 HBase Ganosは、ApsaraDB for HBaseの強力な分散ストレージ機能とSparkエンジンとともに使用できます。 HBase Ganosは複数のシナリオに適しています。 HBase Ganosを使用すると、空間データ、時空間データ、リモートセンシング画像データなど、大量のデータを保存、クエリ、分析、およびマイニングできます。
機能
- HBase Ganos V2.0を使用して、時空間ジオメトリデータを処理できます。
- HBase Ganos V2.0を使用して、空間ジオメトリデータと時空間軌跡データを表現およびモデル化できます。
- HBase Ganos V2.0を使用して、時空間ジオメトリデータを管理できます。たとえば、HBase Ganos V2.0を使用して、データの作成、書き込み、インデックス作成、クエリ、または削除を実行できます。
- SparkエンジンでHBase Ganos V2.0を使用して、データ分析を実行できます。 HBase Ganos V2.0は、Open Geospatial Consortium(OGC)で定義されているGeoSQLと互換性があります。
- SDKに基づいて、またはRESTful API操作を呼び出すことによって、HBase Ganos V2.0を開発できます。
- HBase Ganos V2.0は、HBase V1.xと互換性があります。
- HBase Ganos V2.5は、HBase Ganos V2.0のすべての時空間ジオメトリデータと互換性があり、時空間ラスターデータをサポートしています。
- HBase Ganos V2.5では、抽出、変換、ロード(ETL)ツールを使用して、データのチャンク化、ピラミッドの作成、時間次元インデックスの作成など、ラスターデータを高速にインポートできます。 HBase Ganos V2.5は、ネイティブのSparkエンジンも提供します。
- HBase Ganos V2.5は、ラスターデータベースの spatio-temporal データを照会するためのRESTful APIを提供します。
- HBase Ganos V2.5は、WMSやWMTSなどのサービスをサポートし、ネイティブのGeoServerプラグインを提供します。
- HBase Ganos V2.5は、バージョン 2.xのHBaseと互換性があります。
シナリオ
- 輸送における Iot
HBase Ganosを使用すると、高並行モードで軌跡データを書き込み、履歴軌跡データを保存し、注文軌跡をクエリし、時間範囲を指定して時空間データをクエリできます。輸送管理シナリオでは、HBase Ganosを使用して、輸送能力のスケジューリング、相乗りの編成、需給の予測、ヒートマップの分析を行うことができます。
- センサーネットワークとリアルタイム地理情報システム(GIS)
環境保護、気象学、水資源保護、ナビゲーション、航空宇宙など、複数の業界でライフサイクルメトリックを監視する必要がある場合は、広範囲のセンサーが必要です。これらのシナリオでは、トポロジ、天気、汚染、水位、イベントに関する地理データを収集する必要があります。
- ラスタ化された GIS と航空宇宙リモートセンシング
HBase Ganosは、ラスターデータ管理のための汎用モデルを提供します。 GIS の大量のリモートセンシング画像データとラスターデータを効果的に保存、クエリ、分析、および処理できます。 ETL ツールを使用して、リモートセンシング画像を再投影、スプライス、スライス、およびインポートできます。 OGC WMS や WMTS などのサービスを公開できます。 また、Spark の高性能分散コンピューティングエンジンに基づいて、多数のラスター画像を分析および処理することもできます。
- IoT
IoT デバイスは、時系列データと空間データを生成します。たとえば、Internet of Vehicles(IoV)シナリオでは、多数の接続された車両が時間と空間の情報を含む軌跡データを生成します。このシナリオでは、HBase Ganosを使用して車両データをリアルタイムで監視できます。たとえば、車両の軌跡を追跡し、車両が逸脱したか、制限区域に入ったかを識別できます。 HBase Ganosでは、空間データをリアルタイムでクエリすることもできます。一定期間の車両の軌跡をクエリできます。また、特定の期間にエリアに入った車両をクエリすることもできます。 HBase Ganosは、ビッグデータ分析のためにSparkなどのフレームワークと連携して動作できます。これにより、時空間クエリを実行し、ヒートマップを分析できます。
- インテリジェント物流とテイクアウト配送
物流とテイクアウト配送のシナリオでは、ユーザーは配送車両とライダーを追跡する必要があります。 HBase Ganosを使用して、配達時間を推定できます。このシナリオでは、データ分析用のクラウドシステムは、高速書き込み操作のために高並行性をサポートする必要があります。また、システムは車両のルートをリアルタイムで計画し、車両の逸脱を監視する必要があります。
利点
- パブリッククラウドネイティブアーキテクチャは、NoSQLデータベースアーキテクチャを使用し、ビッグデータを処理するためのすぐに使えるソリューションを提供します。 HBase Ganosは、空間データ、時空間データ、およびリモートセンシング画像データを処理するためのエンジンを提供します。
- HBase Ganosを使用して、ペタバイトのデータを保存できます。 HBase Ganosは、高並列書き込み操作をサポートし、数十億のデータエントリを数秒以内に処理します。
- HBase Ganosは、コールドデータとホットデータの個別のストレージをサポートし、効率的な圧縮アルゴリズムを使用します。 HBase Ganosを使用して、大量のデータを低コストで保存できます。
- HBase GanosをSparkとともに使用できます。これは、大規模な空間データリポジトリと空間ビッグデータを分析するために使用されるプラットフォームを構築するのに役立ちます。
- HBase Ganosは、OGC標準に準拠しています。これにより、システム間の統合と相互運用が容易になります。
- HBase Ganosは、ApsaraDB for HBaseに基づく専門的なO&Mと完全な管理により、信頼性が高く安定したサービスを提供します。
シナリオとアーキテクチャ
船舶追跡のためのビッグデータプラットフォーム
- ジオフェンシングを使用して、地理的地域への出入をリアルタイムで判断します。
- 地域と時間範囲を指定して、船舶の軌跡を再生します。
- 時間範囲を指定して、船舶の軌跡を再生します。
- Sparkでクレンジングおよび処理されたAISデータを格納するデータウェアハウスを構築します。
- HBase Ganosは、クエリされるデータを格納します。データが格納された後、フロントエンドアプリケーションからデータをクエリできます。たとえば、ジオフェンシングデータをクエリしたり、船舶の軌跡を再生したりできます。
- このアーキテクチャでは、データクエリはミリ秒以内、データクレンジングは数分以内に実行できます。
位置追跡
シナリオ:位置追跡プラットフォームは、車両の軌跡データをリアルタイムで収集します。プラットフォームを使用して、400,000台を超える車両の軌跡データを収集し、1秒あたり最大30,000の軌跡ポイントを書き込むことができます。プラットフォームを使用することにより、車両をリアルタイムでナビゲートし、ジオフェンスクエリを実行し、軌跡間の類似性を計算できます。
- HBase Ganosは、すべての履歴軌跡データを格納します。
- 大量の履歴データが格納されている場合、システムはコールドデータをオブジェクトストレージサービス(OSS)に自動的にダンプします。これにより、コストが 70 % 以上削減されます。
- 数十億の軌跡データレコードをサブ秒以内にクエリできます。時間範囲または空間別に軌跡をクエリできます。
- HBase GanosはSparkと連携して動作できます。これにより、軌跡間の類似性を計算し、起点と目的地(OD)データを分析できます。
リモートセンシング画像データ管理とインテリジェント Serviceplatform
シナリオ:リモートセンシング画像データを保存、クエリ、分析し、リモートセンシングのAIを有効にします。
- リモートセンシング画像のデータ量は多く、データ量は急速に増加しています。ストレージリソースのスケーリングプロセスは柔軟性がありません。これにより、コストが増加し、管理が複雑になります。
- データを高速に視覚化するには、静的データをスライスに分割できます。ただし、この従来の方法では少量のデータがサンプリングされるため、AIベースのデータ分析の要件を満たすことができません。
- 複数の空間データソースから統合クエリと分析を実行することは困難です。
- OSSは、生データを保存し、コールドデータとホットデータを分離するために使用されます。これにより、ストレージコストが削減されます。
- SQLデータベースとNoSQLデータベースを一緒に使用して、ストレージ容量に制限なく時空間シーケンス画像を保存します。これにより、ストレージとコンピューティングが分離され、高いスケーラビリティが提供されます。
- クラウドネイティブアーキテクチャは、データをチャンク単位で保存および整理します。これにより、画像のピクセルデータが保持され、データ分析とコンピューティングに適しています。
- HBase GanosをSparkとともに使用して、ETLを高速化できます。これにより、複数のソースからの空間データを分析および処理することもできます。