このトピックでは、Spark Streaming SQL でタンブリングウィンドウ関数を使用する方法について説明します。

タンブリングウィンドウとは

タンブリングウィンドウを使用して、指定したサイズのウィンドウに各要素を割り当てることができます。 通常、タンブリングウィンドウのサイズは固定で、互いにオーバーラップすることはありません。 たとえば、5 分間のタンブリングウィンドウが定義されている場合、期間に基づいて要素は [0:00, 0:05)、[0:05, 0:10)、[0:10, 0:15) のウィンドウに割り当てられます。

構文

GROUP BY TUMBLING (colName, windowDuration) 

SELECT avg(inv_quantity_on_hand) qoh
FROM kafka_inventory
GROUP BY TUMBLING (inv_data_time, interval 1 minute)