このトピックでは、AnalyticDB for PostgreSQL V6.0 での完全な TPC-H 性能テストについて説明します。1 TB のデータセットの生成から、テーブルの作成、OSS からのデータロード、および 22 個すべてのクエリの実行までを網羅しています。最終的には、32 個のコンピュートノードで構成される MPP クラスター上で再現可能なベンチマーク結果が得られます。
このトピックで説明するテストは、TPC-H ベンチマークに基づいていますが、そのすべての要件を満たしているわけではありません。結果は、公式に公開されている TPC-H ベンチマーク結果と比較することはできません。
TPC-H について
以下の説明は、TPC Benchmark™ H (TPC-H) の仕様から引用したものです。
「TPC-H は意思決定支援ベンチマークです。ビジネス指向のアドホッククエリと同時データ変更のスイートで構成されています。クエリとデータベースに格納されるデータは、業界全体で広範な関連性を持つように選択されています。このベンチマークは、大量のデータを調査し、高度な複雑性を持つクエリを実行し、重要なビジネス上の質問に回答する意思決定支援システムを示しています。」
完全な仕様については、TPC Benchmark™ H Standard Specification をご参照ください。
前提条件
開始する前に、以下を準備してください。
AnalyticDB for PostgreSQL インスタンス。詳細については、「インスタンスの作成」をご参照ください。
Elastic Compute Service (ECS) インスタンス。詳細については、「作成方法」をご参照ください。
Object Storage Service (OSS) がアクティブ化され、バケットが作成されていること。詳細については、「バケットの作成」をご参照ください。
ECS インスタンスの IP アドレスが AnalyticDB for PostgreSQL インスタンスの IP アドレスホワイトリストに追加されていること。詳細については、「IP アドレスホワイトリストの設定」をご参照ください。
psql が ECS インスタンスにインストールされていること。詳細については、クライアント接続トピックの「psql」をご参照ください。
このトピックで使用されるテスト環境
AnalyticDB for PostgreSQL インスタンスの仕様は以下のとおりです。
| パラメーター | 値 |
|---|---|
| エンジンバージョン | 6.0 Standard Edition |
| コンピュートノードの仕様 | 2 コア、16 GB |
| コンピュートノード数 | 32 |
| ディスクタイプ | Enhanced SSD (ESSD) |
| コンピュートノードあたりのストレージ容量 | 200 GB |
ECS インスタンスの仕様は以下のとおりです。
| パラメーター | 値 |
|---|---|
| インスタンスタイプ | ecs.g6e.4xlarge |
| オペレーティングシステム | CentOS 7.x |
| システムディスク | PL1 ESSD、40 GiB |
| データディスク | PL3 ESSD、2,048 GiB |
使用前に ECS データディスクを初期化してください。詳細については、「Linux インスタンスで 2 TiB を超えないサイズのデータディスクを初期化する」をご参照ください。
スキーマ概要
TPC-H ベンチマークでは、製品サプライチェーンをモデル化する 8 つのテーブルを使用します。2 つの小さなディメンションテーブル (NATION と REGION) は、すべてのコンピュートノードにレプリケートされます。残りの 6 つのテーブルは、プライマリキーによって分散され、データをノード全体に分散させます。
テーブル間の関係は以下のとおりです。LINEITEM は中央のファクトテーブルであり、注文キーによって ORDERS に、部品キーとサプライヤーキーによって PART および SUPPLIER にリンクされています。ORDERS は顧客キーによって CUSTOMER にリンクされています。PARTSUPP は PART と SUPPLIER 間の多対多の関係を表します。SUPPLIER と CUSTOMER の両方が NATION にリンクし、NATION は REGION にリンクしています。
| テーブル | ディストリビューション | 役割 |
|---|---|---|
| LINEITEM | DISTRIBUTED BY (L_ORDERKEY) | 最大のファクトテーブル。注文明細行ごとに 1 行 |
| ORDERS | DISTRIBUTED BY (O_ORDERKEY) | 注文ヘッダーレコード |
| CUSTOMER | DISTRIBUTED BY (C_CUSTKEY) | 顧客レコード |
| PART | DISTRIBUTED BY (P_PARTKEY) | 部品カタログ |
| SUPPLIER | DISTRIBUTED BY (S_SUPPKEY) | サプライヤーレコード |
| PARTSUPP | DISTRIBUTED BY (PS_PARTKEY) | 部品とサプライヤーの関係およびコスト |
| NATION | DISTRIBUTED Replicated | 25 行のディメンションテーブル |
| REGION | DISTRIBUTED Replicated | 5 行のディメンションテーブル |
すべてのテーブルは、LZ4 圧縮を使用した追記型カラムナストレージを使用します (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9)。ORDERS と LINEITEM は、注文日と出荷日の範囲クエリを高速化するためにソートキー列も定義します。
テストデータの生成
ECS インスタンスにログインします。詳細については、「インスタンスへの接続」をご参照ください。
TPC-H DBGEN ソースコードをデータディスクにダウンロードしてコンパイルします。この例では、データディスクは
/mntにマウントされています。wget https://github.com/electrum/tpch-dbgen/archive/refs/heads/master.zip yum install -y unzip zip unzip master.zip cd tpch-dbgen-master/ echo "#define EOL_HANDLING 1" >> config.h # Removes trailing | from each row make ./dbgen --help1 TB のデータセット (スケールファクター 1000) を生成します。データを 32 個のファイル (コンピュートノードごとに 1 つ) に分割し、各ノードが独自のファイルを並列でインポートできるようにします。
説明TPC-H では、スケールファクター (SF) はデータ量に直接マッピングされます。1 SF = 1 GB なので、SF 1000 = 1 TB です。各 SF は、インデックスストレージを除いて 8 つのテーブルをカバーします。少なくとも 1 SF の追加ディスク領域を確保してください。
生成にはかなりの時間がかかります。
ps -fHU $USER | grep dbgenを使用して進捗状況を確認してください。
for((i=1;i<=32;i++)); do ./dbgen -s 1000 -S $i -C 32 -f & done
テストテーブルの作成
psql を使用して AnalyticDB for PostgreSQL インスタンスに接続します。詳細については、クライアント接続トピックの「psql」をご参照ください。
8 つの TPC-H テーブルを作成します。
CREATE TABLE NATION ( N_NATIONKEY INTEGER NOT NULL, N_NAME CHAR(25) NOT NULL, N_REGIONKEY INTEGER NOT NULL, N_COMMENT VARCHAR(152) ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED Replicated ; CREATE TABLE REGION ( R_REGIONKEY INTEGER NOT NULL, R_NAME CHAR(25) NOT NULL, R_COMMENT VARCHAR(152) ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED Replicated ; CREATE TABLE PART ( P_PARTKEY INTEGER NOT NULL, P_NAME VARCHAR(55) NOT NULL, P_MFGR CHAR(25) NOT NULL, P_BRAND CHAR(10) NOT NULL, P_TYPE VARCHAR(25) NOT NULL, P_SIZE INTEGER NOT NULL, P_CONTAINER CHAR(10) NOT NULL, P_RETAILPRICE DECIMAL(15,2) NOT NULL, P_COMMENT VARCHAR(23) NOT NULL ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED BY (P_PARTKEY) ; CREATE TABLE SUPPLIER ( S_SUPPKEY INTEGER NOT NULL, S_NAME CHAR(25) NOT NULL, S_ADDRESS VARCHAR(40) NOT NULL, S_NATIONKEY INTEGER NOT NULL, S_PHONE CHAR(15) NOT NULL, S_ACCTBAL DECIMAL(15,2) NOT NULL, S_COMMENT VARCHAR(101) NOT NULL ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED BY (S_SUPPKEY) ; CREATE TABLE PARTSUPP ( PS_PARTKEY INTEGER NOT NULL, PS_SUPPKEY INTEGER NOT NULL, PS_AVAILQTY INTEGER NOT NULL, PS_SUPPLYCOST DECIMAL(15,2) NOT NULL, PS_COMMENT VARCHAR(199) NOT NULL ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED BY (PS_PARTKEY) ; CREATE TABLE CUSTOMER ( C_CUSTKEY INTEGER NOT NULL, C_NAME VARCHAR(25) NOT NULL, C_ADDRESS VARCHAR(40) NOT NULL, C_NATIONKEY INTEGER NOT NULL, C_PHONE CHAR(15) NOT NULL, C_ACCTBAL DECIMAL(15,2) NOT NULL, C_MKTSEGMENT CHAR(10) NOT NULL, C_COMMENT VARCHAR(117) NOT NULL ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED BY (C_CUSTKEY) ; CREATE TABLE ORDERS ( O_ORDERKEY BIGINT NOT NULL, O_CUSTKEY INTEGER NOT NULL, O_ORDERSTATUS "char" NOT NULL, O_TOTALPRICE DECIMAL(15,2) NOT NULL, O_ORDERDATE DATE NOT NULL, O_ORDERPRIORITY CHAR(15) NOT NULL, O_CLERK CHAR(15) NOT NULL, O_SHIPPRIORITY INTEGER NOT NULL, O_COMMENT VARCHAR(79) NOT NULL ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED BY (O_ORDERKEY) ORDER BY(O_ORDERDATE) ; CREATE TABLE LINEITEM ( L_ORDERKEY BIGINT NOT NULL, L_PARTKEY INTEGER NOT NULL, L_SUPPKEY INTEGER NOT NULL, L_LINENUMBER INTEGER NOT NULL, L_QUANTITY DECIMAL(15,2) NOT NULL, L_EXTENDEDPRICE DECIMAL(15,2) NOT NULL, L_DISCOUNT DECIMAL(15,2) NOT NULL, L_TAX DECIMAL(15,2) NOT NULL, L_RETURNFLAG "char" NOT NULL, L_LINESTATUS "char" NOT NULL, L_SHIPDATE DATE NOT NULL, L_COMMITDATE DATE NOT NULL, L_RECEIPTDATE DATE NOT NULL, L_SHIPINSTRUCT CHAR(25) NOT NULL, L_SHIPMODE CHAR(10) NOT NULL, L_COMMENT VARCHAR(44) NOT NULL ) WITH (APPENDONLY=TRUE, ORIENTATION=COLUMN, COMPRESSTYPE=LZ4, COMPRESSLEVEL=9) DISTRIBUTED BY (L_ORDERKEY) ORDER BY(L_SHIPDATE) ;
データのインポート
NATION および REGION テーブルは、ECS インスタンスから直接インポートできるほど小さいです。残りの 6 つのより大きなテーブルは OSS を経由する必要があります。これは、COPY ステートメントがコーディネーターノードを介してデータをシリアルに書き込み、大規模なインポートを並列化できないためです。OSS を使用すると、すべてのコンピュートノードがデータを並列でロードできます。
NATION および REGION のインポート
psql で以下のステートメントを実行します。
\copy nation from '/mnt/tpch-dbgen-master/nation.tbl' DELIMITER '|';
\copy region from '/mnt/tpch-dbgen-master/region.tbl' DELIMITER '|';/mnt/tpch-dbgen-master を、ご利用の .tbl ファイルへの実際のパスに置き換えてください。
残りの 6 つのテーブルを OSS 経由でインポート
ECS インスタンスで ossutil をダウンロードします。
wget http://gosspublic.alicdn.com/ossutil/1.7.3/ossutil64実行権限を付与します。
chmod 755 ossutil646 つの各テーブルの
.tblファイルを OSS バケットにアップロードします。プレースホルダーを、ご利用のエンドポイント、AccessKey ID、Access Key Secret、およびバケット名に置き換えてください。ls <table_name>.tbl* | while read line; do ~/ossutil64 -e <EndPoint> -i <AccessKey ID> -k <Access Key Secret> cp $line oss://<OSS Bucket>/<Directory>/ & doneすべてのファイルがアップロードされたら、それらを AnalyticDB for PostgreSQL データベースにインポートします。COPY ステートメントの構文の詳細については、「COPY または UNLOAD ステートメントを使用して OSS 外部テーブルと AnalyticDB for PostgreSQL テーブル間でデータをインポートまたはエクスポートする」をご参照ください。
<OSS Bucket>、<Directory>、<AccessKey ID>、<Access Key Secret>、および<EndPoint>を、ご利用の実際の値に置き換えてください。COPY customer FROM 'oss://<OSS Bucket>/<Directory>/customer.tbl' ACCESS_KEY_ID '<AccessKey ID>' SECRET_ACCESS_KEY '<Access Key Secret>' FORMAT AS text "delimiter" '|' "null" '' ENDPOINT '<EndPoint>' FDW 'oss_fdw' ; COPY lineitem FROM 'oss://<OSS Bucket>/<Directory>/lineitem.tbl' ACCESS_KEY_ID '<AccessKey ID>' SECRET_ACCESS_KEY '<Access Key Secret>' FORMAT AS text "delimiter" '|' "null" '' ENDPOINT '<EndPoint>' FDW 'oss_fdw' ; -- インポート後に lineitem をソートキー列でソートします。 sort lineitem; COPY orders FROM 'oss://<OSS Bucket>/<Directory>/orders.tbl' ACCESS_KEY_ID '<AccessKey ID>' SECRET_ACCESS_KEY '<Access Key Secret>' FORMAT AS text "delimiter" '|' "null" '' ENDPOINT '<EndPoint>' FDW 'oss_fdw' ; -- インポート後に orders をソートキー列でソートします。 sort orders; COPY part FROM 'oss://<OSS Bucket>/<Directory>/part.tbl' ACCESS_KEY_ID '<AccessKey ID>' SECRET_ACCESS_KEY '<Access Key Secret>' FORMAT AS text "delimiter" '|' "null" '' ENDPOINT '<EndPoint>' FDW 'oss_fdw' ; COPY supplier FROM 'oss://<OSS Bucket>/<Directory>/supplier.tbl' ACCESS_KEY_ID '<AccessKey ID>' SECRET_ACCESS_KEY '<Access Key Secret>' FORMAT AS text "delimiter" '|' "null" '' ENDPOINT '<EndPoint>' FDW 'oss_fdw' ; COPY partsupp FROM 'oss://<OSS Bucket>/<Directory>/partsupp.tbl' ACCESS_KEY_ID '<AccessKey ID>' SECRET_ACCESS_KEY '<Access Key Secret>' FORMAT AS text "delimiter" '|' ENDPOINT '<EndPoint>' FDW 'oss_fdw' ;
クエリの実行
22 個すべてのクエリは、AnalyticDB for PostgreSQL のベクター計算アクセラレーションエンジンである laser 拡張機能 (Odyssey) を使用します。各クエリの前に set laser.enable = on; で有効にするか、セッションの開始時に create extension if not exists laser; で一度作成します。
2 つの方法があります。22 個すべてのクエリの時間を自動的に測定するシェルスクリプトを使用する方法と、psql でクエリを 1 つずつ実行する方法です。
シェルスクリプトですべてのクエリを実行
tpch_query.tar.gz パッケージをダウンロードし、
/tpch_queryディレクトリに展開します。以下の内容で
query.shという名前のファイルを作成します。このスクリプトは Q1 から Q22 を順次実行し、各クエリの実行時間と累積合計を記録します。#!/bin/bash total_cost=0 for i in {1..22} do echo "begin run Q${i}, tpch_query/q$i.sql , `date`" begin_time=`date +%s.%N` ./psql ${Instance endpoint} -p ${Port number} -U ${Database username} -f ~/tpch_query/q${i}.sql > ~/log/log_q${i}.out rc=$? end_time=`date +%s.%N` cost=`echo "$end_time-$begin_time"|bc` total_cost=`echo "$total_cost+$cost"|bc` if [ $rc -ne 0 ] ; then printf "run Q%s fail, cost: %.2f, totalCost: %.2f, `date`\n" $i $cost $total_cost else printf "run Q%s succ, cost: %.2f, totalCost: %.2f, `date`\n" $i $cost $total_cost fi doneスクリプトをバックグラウンドで実行します。
nohup bash ~/query.sh > /tmp/tpch.log &結果を表示します。
cat /tmp/tpch.log
psql で個別にクエリを実行
以下の表は、各 TPC-H クエリが回答するビジネス上の質問をリストしています。これを使用して、評価に最も関連性の高いクエリを特定してください。
| クエリ | ビジネス上の質問 |
|---|---|
| Q1 | 指定された日付までに出荷されたすべての明細行の集計料金サマリーは何ですか? |
| Q2 | 指定されたリージョンで指定された部品のコストを最小限に抑えるために、どのサプライヤーを選択すべきですか? |
| Q3 | 指定された市場セグメントと日付において、最高の収益を持つ未出荷のトップ注文は何ですか? |
| Q4 | 指定された四半期内で注文はどの程度優先されていますか? |
| Q5 | 指定されたリージョンと年において、各国のサプライヤーはどのくらいの収益を生成しましたか? |
| Q6 | 指定された年において、割引決定によりどのくらいの収益が失われましたか? |
| Q7 | 指定された期間に、出荷を通じて一対の国間でどのくらいの収益が流れていますか? |
| Q8 | 指定されたサプライヤー国の市場シェアは、リージョン内で時間とともにどのように変化しますか? |
| Q9 | 指定された製品の色について、国別および年別の利益の内訳は何ですか? |
| Q10 | 商品を返品した顧客は誰で、指定された四半期にどのくらいの収益を生成しましたか? |
| Q11 | 指定された国にとって、総供給価値の重要な部分を占める部品はどれですか? |
| Q12 | 指定された年において、出荷モードは注文優先度カウントにどのように影響しますか? |
| Q13 | 顧客の注文数は、すべての顧客にどのように分散されていますか? |
| Q14 | 指定された月の収益のうち、プロモーション部品からの割合はどのくらいですか? |
| Q15 | 指定された四半期に最も多くの収益に貢献したサプライヤーはどれですか? |
| Q16 | 特定のブランド、タイプ、およびサイズの基準に一致する部品を供給できるサプライヤーはいくつありますか? |
| Q17 | 指定された部品の平均数量しきい値を下回る販売による推定年間収益損失はどのくらいですか? |
| Q18 | 指定された数量しきい値を超える大口注文を行った顧客は誰ですか? |
| Q19 | 特定のブランドとコンテナの基準を満たす航空便出荷部品の割引総収益はどのくらいですか? |
| Q20 | 出荷履歴から導き出されたしきい値と比較して、指定された部品の過剰な在庫を持つサプライヤーはどれですか? |
| Q21 | 指定された国で注文を時間通りに配送できなかったサプライヤーはどれですか? |
| Q22 | 特定の国別コードにおいて、平均以上の残高を持つが一度も注文したことのない潜在顧客はいくついますか? |
データベースに接続後、以下のステートメントを実行します。各クエリは、Odyssey ベクター計算エンジンをアクティブ化するために set laser.enable = on; で始まります。
-- Laser ベクター計算エンジンを作成します。
create extension if not exists laser;
-- Q1: 料金サマリーレポート
set laser.enable = on;
select
l_returnflag,
l_linestatus,
sum(l_quantity) as sum_qty,
sum(l_extendedprice) as sum_base_price,
sum(l_extendedprice * (1 - l_discount)) as sum_disc_price,
sum(l_extendedprice * (1 - l_discount) * (1 + l_tax)) as sum_charge,
avg(l_quantity) as avg_qty,
avg(l_extendedprice) as avg_price,
avg(l_discount) as avg_disc,
count(*) as count_order
from
lineitem
where
l_shipdate <= date '1998-12-01' - interval '93 day'
group by
l_returnflag,
l_linestatus
order by
l_returnflag,
l_linestatus;
-- Q2: 最小コストサプライヤー
set laser.enable = on;
select
s_acctbal,
s_name,
n_name,
p_partkey,
p_mfgr,
s_address,
s_phone,
s_comment
from
part,
supplier,
partsupp,
nation,
region
where
p_partkey = ps_partkey
and s_suppkey = ps_suppkey
and p_size = 23
and p_type like '%STEEL'
and s_nationkey = n_nationkey
and n_regionkey = r_regionkey
and r_name = 'EUROPE'
and ps_supplycost = (
select
min(ps_supplycost)
from
partsupp,
supplier,
nation,
region
where
p_partkey = ps_partkey
and s_suppkey = ps_suppkey
and s_nationkey = n_nationkey
and n_regionkey = r_regionkey
and r_name = 'EUROPE'
)
order by
s_acctbal desc,
n_name,
s_name,
p_partkey
limit 100;
-- Q3: 出荷優先度
set laser.enable = on;
select
l_orderkey,
sum(l_extendedprice * (1 - l_discount)) as revenue,
o_orderdate,
o_shippriority
from
customer,
orders,
lineitem
where
c_mktsegment = 'MACHINERY'
and c_custkey = o_custkey
and l_orderkey = o_orderkey
and o_orderdate < date '1995-03-24'
and l_shipdate > date '1995-03-24'
group by
l_orderkey,
o_orderdate,
o_shippriority
order by
revenue desc,
o_orderdate
limit 10;
-- Q4: 注文優先度の確認
set laser.enable = on;
select
o_orderpriority,
count(*) as order_count
from
orders
where
o_orderdate >= date '1996-08-01'
and o_orderdate < date '1996-08-01' + interval '3' month
and exists (
select
*
from
lineitem
where
l_orderkey = o_orderkey
and l_commitdate < l_receiptdate
)
group by
o_orderpriority
order by
o_orderpriority;
-- Q5: ローカルサプライヤーボリューム
set laser.enable = on;
select
n_name,
sum(l_extendedprice * (1 - l_discount)) as revenue
from
customer,
orders,
lineitem,
supplier,
nation,
region
where
c_custkey = o_custkey
and l_orderkey = o_orderkey
and l_suppkey = s_suppkey
and c_nationkey = s_nationkey
and s_nationkey = n_nationkey
and n_regionkey = r_regionkey
and r_name = 'MIDDLE EAST'
and o_orderdate >= date '1994-01-01'
and o_orderdate < date '1994-01-01' + interval '1' year
group by
n_name
order by
revenue desc;
-- Q6: 収益変化の予測
set laser.enable = on;
select
sum(l_extendedprice * l_discount) as revenue
from
lineitem
where
l_shipdate >= date '1994-01-01'
and l_shipdate < date '1994-01-01' + interval '1' year
and l_discount between 0.06 - 0.01 and 0.06 + 0.01
and l_quantity < 24;
-- Q7: ボリューム出荷
set laser.enable = on;
select
supp_nation,
cust_nation,
l_year,
sum(volume) as revenue
from
(
select
n1.n_name as supp_nation,
n2.n_name as cust_nation,
extract(year from l_shipdate) as l_year,
l_extendedprice * (1 - l_discount) as volume
from
supplier,
lineitem,
orders,
customer,
nation n1,
nation n2
where
s_suppkey = l_suppkey
and o_orderkey = l_orderkey
and c_custkey = o_custkey
and s_nationkey = n1.n_nationkey
and c_nationkey = n2.n_nationkey
and (
(n1.n_name = 'JORDAN' and n2.n_name = 'INDONESIA')
or (n1.n_name = 'INDONESIA' and n2.n_name = 'JORDAN')
)
and l_shipdate between date '1995-01-01' and date '1996-12-31'
) as shipping
group by
supp_nation,
cust_nation,
l_year
order by
supp_nation,
cust_nation,
l_year;
-- Q8: 国内市場シェア
set laser.enable = on;
select
o_year,
sum(case
when nation = 'INDONESIA' then volume
else 0
end) / sum(volume) as mkt_share
from
(
select
extract(year from o_orderdate) as o_year,
l_extendedprice * (1 - l_discount) as volume,
n2.n_name as nation
from
part,
supplier,
lineitem,
orders,
customer,
nation n1,
nation n2,
region
where
p_partkey = l_partkey
and s_suppkey = l_suppkey
and l_orderkey = o_orderkey
and o_custkey = c_custkey
and c_nationkey = n1.n_nationkey
and n1.n_regionkey = r_regionkey
and r_name = 'ASIA'
and s_nationkey = n2.n_nationkey
and o_orderdate between date '1995-01-01' and date '1996-12-31'
and p_type = 'STANDARD BRUSHED BRASS'
) as all_nations
group by
o_year
order by
o_year;
-- Q9: 製品タイプ利益測定
set laser.enable = on;
select
nation,
o_year,
sum(amount) as sum_profit
from
(
select
n_name as nation,
extract(year from o_orderdate) as o_year,
l_extendedprice * (1 - l_discount) - ps_supplycost * l_quantity as amount
from
part,
supplier,
lineitem,
partsupp,
orders,
nation
where
s_suppkey = l_suppkey
and ps_suppkey = l_suppkey
and ps_partkey = l_partkey
and p_partkey = l_partkey
and o_orderkey = l_orderkey
and s_nationkey = n_nationkey
and p_name like '%chartreuse%'
) as profit
group by
nation,
o_year
order by
nation,
o_year desc;
-- Q10: 返品アイテムレポート
set laser.enable = on;
select
c_custkey,
c_name,
sum(l_extendedprice * (1 - l_discount)) as revenue,
c_acctbal,
n_name,
c_address,
c_phone,
c_comment
from
customer,
orders,
lineitem,
nation
where
c_custkey = o_custkey
and l_orderkey = o_orderkey
and o_orderdate >= date '1994-08-01'
and o_orderdate < date '1994-08-01' + interval '3' month
and l_returnflag = 'R'
and c_nationkey = n_nationkey
group by
c_custkey,
c_name,
c_acctbal,
c_phone,
n_name,
c_address,
c_comment
order by
revenue desc
limit 20;
-- Q11: 重要な在庫の特定
set laser.enable = on;
select
ps_partkey,
sum(ps_supplycost * ps_availqty) as value
from
partsupp,
supplier,
nation
where
ps_suppkey = s_suppkey
and s_nationkey = n_nationkey
and n_name = 'INDONESIA'
group by
ps_partkey having
sum(ps_supplycost * ps_availqty) > (
select
sum(ps_supplycost * ps_availqty) * 0.0001000000
from
partsupp,
supplier,
nation
where
ps_suppkey = s_suppkey
and s_nationkey = n_nationkey
and n_name = 'INDONESIA'
)
order by
value desc;
-- Q12: 出荷モードと注文優先度
set laser.enable = on;
select
l_shipmode,
sum(case
when o_orderpriority = '1-URGENT'
or o_orderpriority = '2-HIGH'
then 1
else 0
end) as high_line_count,
sum(case
when o_orderpriority <> '1-URGENT'
and o_orderpriority <> '2-HIGH'
then 1
else 0
end) as low_line_count
from
orders,
lineitem
where
o_orderkey = l_orderkey
and l_shipmode in ('REG AIR', 'TRUCK')
and l_commitdate < l_receiptdate
and l_shipdate < l_commitdate
and l_receiptdate >= date '1994-01-01'
and l_receiptdate < date '1994-01-01' + interval '1' year
group by
l_shipmode
order by
l_shipmode;
-- Q13: 顧客分布
set laser.enable = on;
select
c_count,
count(*) as custdist
from
(
select
c_custkey,
count(o_orderkey)
from
customer left outer join orders on
c_custkey = o_custkey
and o_comment not like '%pending%requests%'
group by
c_custkey
) as c_orders (c_custkey, c_count)
group by
c_count
order by
custdist desc,
c_count desc;
-- Q14: プロモーション効果
set laser.enable = on;
select
100.00 * sum(case
when p_type like 'PROMO%'
then l_extendedprice * (1 - l_discount)
else 0
end) / sum(l_extendedprice * (1 - l_discount)) as promo_revenue
from
lineitem,
part
where
l_partkey = p_partkey
and l_shipdate >= date '1994-11-01'
and l_shipdate < date '1994-11-01' + interval '1' month;
-- Q15: トップサプライヤー
set laser.enable = on;
create view revenue0 (supplier_no, total_revenue) as
select
l_suppkey,
sum(l_extendedprice * (1 - l_discount))
from
lineitem
where
l_shipdate >= date '1997-10-01'
and l_shipdate < date '1997-10-01' + interval '3' month
group by
l_suppkey;
select
s_suppkey,
s_name,
s_address,
s_phone,
total_revenue
from
supplier,
revenue0
where
s_suppkey = supplier_no
and total_revenue = (
select
max(total_revenue)
from
revenue0
)
order by
s_suppkey;
drop view revenue0;
-- Q16: 部品/サプライヤー関係
set laser.enable = on;
select
p_brand,
p_type,
p_size,
count(distinct ps_suppkey) as supplier_cnt
from
partsupp,
part
where
p_partkey = ps_partkey
and p_brand <> 'Brand#44'
and p_type not like 'SMALL BURNISHED%'
and p_size in (36, 27, 34, 45, 11, 6, 25, 16)
and ps_suppkey not in (
select
s_suppkey
from
supplier
where
s_comment like '%Customer%Complaints%'
)
group by
p_brand,
p_type,
p_size
order by
supplier_cnt desc,
p_brand,
p_type,
p_size;
-- Q17: 少量注文収益
set laser.enable = on;
select
sum(l_extendedprice) / 7.0 as avg_yearly
from
lineitem,
part
where
p_partkey = l_partkey
and p_brand = 'Brand#42'
and p_container = 'JUMBO PACK'
and l_quantity < (
select
0.2 * avg(l_quantity)
from
lineitem
where
l_partkey = p_partkey
);
-- Q18: 大口顧客
set laser.enable = on;
select
c_name,
c_custkey,
o_orderkey,
o_orderdate,
o_totalprice,
sum(l_quantity)
from
customer,
orders,
lineitem
where
o_orderkey in (
select
l_orderkey
from
lineitem
group by
l_orderkey having
sum(l_quantity) > 312
)
and c_custkey = o_custkey
and o_orderkey = l_orderkey
group by
c_name,
c_custkey,
o_orderkey,
o_orderdate,
o_totalprice
order by
o_totalprice desc,
o_orderdate
limit 100;
-- Q19: 割引収益
set laser.enable = on;
select
sum(l_extendedprice* (1 - l_discount)) as revenue
from
lineitem,
part
where
(
p_partkey = l_partkey
and p_brand = 'Brand#43'
and p_container in ('SM CASE', 'SM BOX', 'SM PACK', 'SM PKG')
and l_quantity >= 5 and l_quantity <= 5 + 10
and p_size between 1 and 5
and l_shipmode in ('AIR', 'AIR REG')
and l_shipinstruct = 'DELIVER IN PERSON'
)
or
(
p_partkey = l_partkey
and p_brand = 'Brand#45'
and p_container in ('MED BAG', 'MED BOX', 'MED PKG', 'MED PACK')
and l_quantity >= 12 and l_quantity <= 12 + 10
and p_size between 1 and 10
and l_shipmode in ('AIR', 'AIR REG')
and l_shipinstruct = 'DELIVER IN PERSON'
)
or
(
p_partkey = l_partkey
and p_brand = 'Brand#11'
and p_container in ('LG CASE', 'LG BOX', 'LG PACK', 'LG PKG')
and l_quantity >= 24 and l_quantity <= 24 + 10
and p_size between 1 and 15
and l_shipmode in ('AIR', 'AIR REG')
and l_shipinstruct = 'DELIVER IN PERSON'
);
-- Q20: 潜在的な部品プロモーション
set laser.enable = on;
select
s_name,
s_address
from
supplier,
nation
where
s_suppkey in (
select
ps_suppkey
from
partsupp
where
ps_partkey in (
select
p_partkey
from
part
where
p_name like 'magenta%'
)
and ps_availqty > (
select
0.5 * sum(l_quantity)
from
lineitem
where
l_partkey = ps_partkey
and l_suppkey = ps_suppkey
and l_shipdate >= date '1996-01-01'
and l_shipdate < date '1996-01-01' + interval '1' year
)
)
and s_nationkey = n_nationkey
and n_name = 'RUSSIA'
order by
s_name;
-- Q21: 注文を待たせたサプライヤー
set laser.enable = on;
select
s_name,
count(*) as numwait
from
supplier,
lineitem l1,
orders,
nation
where
s_suppkey = l1.l_suppkey
and o_orderkey = l1.l_orderkey
and o_orderstatus = 'F'
and l1.l_receiptdate > l1.l_commitdate
and exists (
select
*
from
lineitem l2
where
l2.l_orderkey = l1.l_orderkey
and l2.l_suppkey <> l1.l_suppkey
)
and not exists (
select
*
from
lineitem l3
where
l3.l_orderkey = l1.l_orderkey
and l3.l_suppkey <> l1.l_suppkey
and l3.l_receiptdate > l3.l_commitdate
)
and s_nationkey = n_nationkey
and n_name = 'MOZAMBIQUE'
group by
s_name
order by
numwait desc,
s_name
limit 100;
-- Q22: グローバル販売機会
set laser.enable = on;
select
cntrycode,
count(*) as numcust,
sum(c_acctbal) as totacctbal
from
(
select
substring(c_phone from 1 for 2) as cntrycode,
c_acctbal
from
customer
where
substring(c_phone from 1 for 2) in
('13', '31', '23', '29', '30', '18', '17')
and c_acctbal > (
select
avg(c_acctbal)
from
customer
where
c_acctbal > 0.00
and substring(c_phone from 1 for 2) in
('13', '31', '23', '29', '30', '18', '17')
)
and not exists (
select
*
from
orders
where
o_custkey = c_custkey
)
) as custsale
group by
cntrycode
order by
cntrycode;