ユーザー設定の統計期間の分析タスク
タスクの種類: ドロップダウンリストから [ユーザー設定の統計期間の分析] を選択します。データテーブル: 動作テーブルを選択します。タスク名: タスクのカスタム名を入力します。
パーティションフィールド: 日付(文字列)フィールドを選択します。フィールドは、yyyymmdd および yyyy-mm-dd の形式で表示できます。ドロップダウンリストから 1 つ選択します。
ユーザー ID フィールド: ユーザーを一意に識別できるフィールドを選択します。例: user_id。
再発率の統計期間: 再発率を計算する日数を入力します。複数の値を指定する場合は、コンマ(,)で区切ります。例: 1,7,15,21。
1 日維持率の統計期間: 指定された日の維持率を計算する日数を入力します。複数の値を指定する場合は、コンマ(,)で区切ります。例: 1,3,7。
定期維持率の統計期間: 週または月ごとに統計期間を指定します。
定期実行: デフォルトでは、[いいえ] が選択されています。定期的な分析を実行しない場合は、[保存して計算] をクリックします。表示される [再実行タスクのデータタイムスタンプ] ダイアログボックスで、データ分析の時間範囲を指定し、[OK] をクリックします。デフォルトでは、時間範囲は過去 7 日間に設定されています。定期的な分析を実行する場合は、[はい] を選択し、[定期実行時間] パラメーターを設定します。
再発率: k 日間の再発率 = T-k 日から T-1 日までと T 日の両方にアクセスしたユーザー数 / T 日にアクセスしたユーザー数。
維持率: k 日間の維持率 = T+k 日と T 日の両方にアクセスしたユーザー数 / T 日にアクセスしたユーザー数。
k の値を調整することにより、再発率が 80% または 90% になる k' の値を見つけることができます。k' の値は、特徴エンジニアリングフェーズでユーザー設定の特徴を計算するための統計期間と、サンプルトレーニングの日数を決定するために使用されます。k' 日間の再発率が 90% 未満の場合、過去 k' 日間で 10% 以上のユーザーがアクティブではないことを示しています。システムには、彼らの設定と行動に関する最近のデータが不足しています。これらのユーザーにはコールドスタートポリシーを使用する必要があります。
定期維持率とは、1 月などのある期間にアクティブで、2 月などの次の期間にもアクティブなままであるユーザーの割合を指します。
定期維持率のデフォルトの統計間隔では、週単位の間隔は 1 週間、4 週間、12 週間で、月単位の間隔は 1 か月と 2 か月です。
業務時間とは、データが書き込まれた時間ではなく、データが格納されている日付パーティションに対応する時間を指します。
定期実行で [はい] を選択した場合は、[定期実行時間] パラメーターを設定して、タスクを毎日実行する時間を指定する必要があります。次に、[保存] をクリックします。
診断レポート
ユーザー設定の統計期間の分析タスクの診断レポートには、ユーザー行動の設定の分析結果とユーザー維持状況が含まれています。