TPC Benchmark-H (TPC-H) は、Transaction Processing Performance Council (TPC) が公開している意思決定支援ベンチマークです。これは、ビジネス指向のアドホッククエリと同時データ変更のスイートで構成されており、大規模分析ワークロードにおけるデータベースパフォーマンスを評価するように設計されています。TPC-H は、データベース選定の標準ガイドラインとして、学術界と産業界で広く使用されています。
AnalyticDB for PostgreSQL は、TPC-H 30 TB 性能リストで第 1 位を獲得しました。これは、世界をリードするデータベースサービスであり、性能とコスト効率の両方で TPC-H 30 TB ランキングに登場した初の中国のデータベースプロダクトです。

TPC-H テストの概要
TPC-H は、現実的なビジネス条件の下で、トランザクションおよび分析データベースパフォーマンスの両方を評価します。クエリ速度のみをテストするベンチマークとは異なり、TPC-H は、大規模 OLAP (オンライン分析処理) ワークロードと並行して、完全な ACID (原子性、一貫性、隔離、耐久性) コンプライアンスを検証します。
このベンチマークでは、30 TB にスケールアップされたデータセットを使用し、最大のテーブルには最大 1,800 億行が含まれます。テストでは、少なくとも 10 の同時クエリ ストリームと、大量のデータに対する作成および削除操作のラウンドを実行する複数のリフレッシュ ストリームが必要です。
30 TB スケールが要求される理由
30 TB スケールでトップティアの TPC-H 結果を達成するには、データベースは 5 つのカテゴリの課題を同時に処理する必要があります。
大規模データセット処理: 最大 30 TB のデータセットと最大 1,800 億行を含むテーブルは、データインポート、ストレージ、コンピューティング性能の限界を押し上げます。
複雑なアソシエーション分析: ワークロードには、マルチテーブル結合、UNION クエリ、多次元データフィルタリング、高精度数値計算が含まれます。これは、クエリ オプティマイザーが最適な結合順序とディストリビューションモードを選択すること、およびコンピュートエンジンがメモリ、コード生成、実行スケジューリングを効率的に管理することに課題を提起します。
リアルタイムバッチデータ書き込み: 数億レコードに対する書き込みおよび削除操作は、トランザクション処理性能と OLAP システムに必要なカラム指向ストレージエンジンをテストします。
高スループット同時読み取りおよび書き込み: 複数のリフレッシュ ストリームと並行して少なくとも 10 の同時クエリ ストリームを実行することは、持続的な負荷の下での同時実行数と ACID コンプライアンスの両方をテストします。
分散トランザクション検証: TPC-H には、コーディネーターノードとコンピュートノードがテスト中にシャットダウンされる極限条件テストが含まれており、停電などの条件下でのシステム可用性と ACID プロパティを検証します。
実装の詳細
TPC-H は、高いシステム機能と厳格な規制を必要とします。特定のケースでは、デバイスを複数回再起動する必要があります。テスト手順と構成については、「TPC-H」をご参照ください。