データセットのオーナーまたはワークスペースの管理者で、[データセット Q&A 構成] 権限を持っている場合は、[Q&A 設定] と [Q&A 権限] を構成できます。必要な権限を取得する方法の詳細については、「ロール管理」をご参照ください。この Topic では、データセットの Q&A 設定および Q&A 権限を構成する方法について説明します。
この機能は、現在 中国 (香港) および マレーシア のサイトでのみ利用可能です。他のサイトにも順次展開されます。
Q&A 構成
Q-Copilot を使用するには、まずデータセットの Q&A 設定を構成する必要があります。
アクセス
次の 2 つの方法で Q&A 構成ページにアクセスできます。
方法 1: データセット編集ページで、次の図に示すように[Q&A 構成]をクリックします。

方法 2: 「データセットの作成」ページで、次の図に示すように[Q&A 構成]をクリックします。

基本情報
[Q&A 構成] ページで、[基本情報] を設定します。
データセットフィールドの品質は、Q&A の精度にとって非常に重要です。Q&A を有効にする前に、次のヒントに従ってデータセットを確認してください。
フィールド名の最適化
フィールド名は明確でわかりやすいものにしてください。これにより、モデルがフィールド名を処理しやすくなり、複雑またはあいまいな表現を防ぐことができます。
詳細なフィールドの説明を入力してください
各フィールドに説明を追加して、モデルがその意味と目的をよりよく理解できるようにします。
プレースホルダーの使用上の注意
プレースホルダーの構成は、Q&A の結果に影響を与える可能性があります。Q&A を有効にする前に、プレースホルダーを無効にしてください。
ナレッジベース情報を充実させる
ナレッジベース管理で、現在のデータセットに関する追加情報を追加および編集します。これにより、大規模言語モデル (LLM) がユーザーの意図をよりよく理解できるようになります。

データセットの[表示名]を変更できます。
説明ビジネスユーザーが理解しやすいデータセットの表示名を構成できます。この名前は訪問者に表示され、データの内容 (「2023 年の業種別収益データ」など) を理解するのに役立ちます。
説明
ユーザーがデータセットを見つけやすいように、簡単な説明を入力します。
データセットタイプ
データセットタイプを選択すると、Q-Copilot がデータ構造を理解するのに役立ち、回答の精度が向上します。サポートされているタイプは、詳細テーブル、複数メトリック期間テーブル、キーバリューテーブルです。
詳細テーブル
1 行あたり 1 レコードの詳細データを表示します。各レコードには、注文 ID、ユーザー ID、注文ステータス、注文金額など、複数のディメンション値またはメトリック情報が含まれています。
複数メトリック期間別テーブル
7 日間の累積売上高、15 日間の累積売上高、30 日間の累積売上高など、さまざまな期間にわたるメトリックの統計値を表示します。
キーと値の表
日付、ディメンション、メトリック名、メトリック値のフィールドを含むキーバリューテーブル。例としては、統計日付、KPI メトリック名、KPI 実際値、KPI 目標値などがあります。
[今すぐ学習] をクリックして、システムにデータセットを学習させます。

学習プロセスが完了した後、データセットが変更された場合は、[再学習] をクリックできます。

[次へ] をクリックして、[フィールド品質評価] ページに移動します。
フィールド品質評価
フィールド品質評価ページでは、システムが現在のデータセットのフィールドの品質を評価して、Q&A の結果を向上させます。

アセスメントを開始 をクリックします。
説明フィールド品質評価には約 1 ~ 2 分かかります。評価の実行中に次の手順に進むことができます。評価が完了すると通知されます。
フィールド品質評価が完了すると、システムは変更の提案を提供します。それらを受け入れるかどうかを選択できます。

[適用して再学習] をクリックして、データセットのフィールド情報に変更を適用します。 次に、[次へ] をクリックして、[クイック質問] ページに移動します。

クイック質問
ユーザーが データセットを選択すると、すぐに利用を開始できるように推奨質問が表示されます。サポートされているモードは、[システム推奨]、[エキスパートカスタマイズ]、[オブジェクトベースの推奨] の 3 つです。

システム推奨事項
クイック質問をプレビューできます。[更新] をクリックして、クイック質問の新しいバッチを取得します。
エキスパートカスタマイズ
エキスパートカスタマイズモードでは、[質問を追加] をクリックして、ユーザーに表示したい推奨質問を入力します。デフォルトでは、最初の 4 つの推奨質問が表示されます。4 つ以上入力した場合、ユーザーは [更新] をクリックして他の質問を表示できます。

複数のクイック質問を追加するには、[一括追加] をクリックして入力します。
説明1 行に 1 つの質問を入力します。最大 10 個の質問を追加できます。

オブジェクトベースの推奨
[オブジェクトベースのレコメンデーション] モードでは、以下のステップに従ってルールを追加できます。
左下隅の[推奨ルールの追加]または[ルールの追加]をクリックします。

[レコメンデーションルールの追加] ページで、ルール名、ターゲットオブジェクト、およびおすすめの質問を入力します。
[推奨ルール名]: 検索しやすいようにルールの名前を入力します。
[ターゲットオブジェクト]: ターゲットオブジェクトとしてユーザーを選択します。
推奨質問: [質問の追加] をクリックして質問を 1 つ追加するか、[一括追加] をクリックして複数の推奨質問を追加します。
説明最大 10 個の質問を追加できます。

その他のユーザーは、適用ルールとして[システム推奨] または [エキスパートカスタマイズ]を選択します。

[変更を確定] をクリックして構成を完了します。
完了後、[Q-Copilot 権限管理に移動] をクリックするか、[Q&A 権限] タブをクリックして、[Q&A 権限] 構成ページに移動できます。 このページでは、ユーザーにこの Q&A データセットの権限を付与できます。 詳細については、「Q&A 権限構成」をご参照ください。

Q&A 権限構成
Q&A 設定を構成した後、Q&A 権限を管理できます。
以下の図は、[Q&A 権限] の構成ページを示しています。

[Q&A 権限] 構成ページで、[権限付与の追加] をクリックします。

前のステップの Q&A 構成ページで [権限付与の追加] をクリックすることもできます。

権限を付与するユーザーを選択します。有効期限を設定することもできます。

[完了] をクリックします。この Q&A データセットの承認済みユーザーを表示および管理できるようになります。

集中管理権限をお持ちの場合は、 Q-Copilot > [権限管理] ページで、さらに権限管理タスクを実行することもできます。詳細については、「権限管理」をご参照ください。
ナレッジベース管理
ナレッジベースは、企業固有の知識と用語のプリファレンスを構成するために使用します。構成後、モデルはこの知識を学習し、データ取得と分析に使用します。データセット編集ページでナレッジベースを管理し、ビジネスロジックと正規表現マッチングのルールを構成できます。
データセットナレッジベースは、エンタープライズナレッジベースよりも優先順位が高くなります。エンタープライズナレッジベースの管理方法の詳細については、「エンタープライズナレッジベース管理」をご参照ください。
アクセス
次の図に示すように、[ナレッジベース管理] ページに移動します。

ビジネスロジックの追加
[ナレッジベース管理] > [現在のデータセットから] > [ビジネスロジック] タブで、ビジネスロジックを追加できます。
右上隅で、[ビジネスロジックの追加] をクリックします。
[ビジネス定義]、[データの説明]、および [類義語] を入力します。その他の構成では、[強制書き換えを有効化] するかどうかを選択します。
ビジネス定義: 販売進捗や会計年度など、企業内の一般的な概念を定義します。長さは最大 100 文字です。このフィールドはグローバルで一意である必要があり、重複させることはできません。ここには、よく使われる Q&A 用語を入力できます。
データの説明: ビジネス定義の具体的な説明を提供し、データメトリックに関連付けます。これにより、モデルはさまざまなメトリックを識別し、理解しやすくなります。最大 3,000 文字です。
シノニム: 企業内のビジネス用語に別名を定義します。これにより、モデルはさまざまな質問方法を認識できるようになります。
強制書き換えを有効にする: このオプションを有効にすると、ユーザーの質問が[ビジネス定義]またはその[類義語]と一致した場合、質問は[データの説明]の内容として書き換えられます。このオプションは注意して使用してください。
保存 をクリックします。
エントリの追加を続けるには、[保存して次を追加] をクリックします。
正規表現マッチの追加
[ナレッジベース管理] > [現在のデータセット] > [正規表現マッチング] タブでは、正規表現マッチを追加できます。
右上隅で、[正規表現一致の追加] をクリックします。
[ビジネス定義]、[正規表現]、および [データの説明] を入力します。適用方法として、[強制書き換えを有効にする] かどうかを選択します。
ビジネス定義: 正規表現の名前を識別するためにのみ使用されます。ユーザーの質問との照合には使用されません。最大 100 文字で、データセット内で一意である必要があります。
正規表現: ユーザーの質問を識別するために使用します。選択した適用方法に基づいて操作が実行されます。式は Python スタイルで記述してください。長さは最大 100 文字です。
照合するテキストを入力して式をテストし、照合結果を表示できます。
データの説明:正規表現内の対応する内容を具体的に説明します。適用方法と組み合わせることで、式の内容を説明または再書き込みできます。
強制書き換えを有効にする: このオプションを有効にすると、ユーザーの質問が[正規表現]と一致した場合、その質問は[データの説明]の内容に書き換えられます。このオプションは注意して使用してください。
[保存] をクリックします。
続けてエントリを追加するには、[保存して続けて追加] をクリックします。
ナレッジベースの管理
ナレッジベースは、[ナレッジベース管理] > [現在のデータセットから] タブで管理できます。
[有効] 列でナレッジエントリのステータスを表示できます。
ナレッジエントリのアイコンが
の場合、エントリは有効になっています。アイコンをクリックして無効にすることができます。ナレッジエントリのアイコンが
の場合、エントリは無効になっています。アイコンをクリックして有効にすることができます。
ターゲットナレッジエントリの右側にある
アイコンをクリックして編集します。ターゲットナレッジエントリの右側にある
アイコンをクリックして削除します。複数のエントリを選択して一括削除できます。

[企業ナレッジベース] タブをクリックすると、企業ナレッジベースに追加され、このデータセットで有効なナレッジが表示されます。

主要ドライバー分析の構成
主要ドライバー分析構成は、Q-Copilot での変動分析のディメンションの優先順位を決定するために使用されます。たとえば、製品タイプと物流方法が優先ドライバーディメンションとして構成されている場合、変動分析ではこれら 2 つのディメンションが優先されます。

アクセス
次の図に示すように、[Key Driver Analysis 構成] ページに移動します。

キードライバー分析の構成は、[グローバル設定] と [カスタム設定] に分かれています。
グローバル設定
キードライバー分析を実行すると、[優先ドライバーディメンション] が最初に表示されます。さらにディメンションが必要な場合は、[セカンダリドライバーディメンション] から選択されます。カスタム設定がないメトリクスは、デフォルトでグローバル設定を使用します。
グローバル設定では、セカンダリドライバーディメンションからディメンションフィールドを選択し、
アイコンをクリックしてから [保存] をクリックすると、それらをプライオリティドライバーディメンションとして設定できます。

優先ドライバーディメンションを削除するには、ディメンションを選択して
アイコンをクリックします。

カスタム設定
[カスタム設定] の特定のメトリックの設定は、[グローバル設定] よりも優先されます。
カスタム設定では、次の手順に従って適用可能なメトリックを選択し、優先ドライバーディメンションを設定できます。
適用可能なメトリックを選択します。
「適用可能なメトリック」の右側にあるプラスアイコン (+) をクリックし、メトリックを選択して、[確認] をクリックします。

優先ドライバーディメンションを設定します。
セカンダリドライバーディメンションからディメンションフィールドを選択して
アイコンをクリックし、[保存] をクリックして優先ドライバーディメンションとして設定します。
データセット構成の推奨事項
計算可能なディメンション属性の場合は、デフォルトの集計方法を平均に設定します。 そうしないと、後続のデータ計算に影響します。
自動車モデルの価格、高さ、幅などの属性には、最大、最小、平均などの集計計算が含まれます。これらはメジャーとして扱う必要があります。クエリ中に自動合計が行われないようにするには、デフォルトの集計方法を平均に設定するのがより論理的です。例: 「車種価格が 300,000 を超える各ブランドの売上高は?」
データフィールドにデータ単位を指定します。 そうしないと、フィルタリングに影響します。
クエリ 「価格が 100,000 を超えるブランドの売上高は?」 で、価格フィールドの単位が 10,000 の場合、バックエンド計算では条件 >100,000 ではなく >10 が使用されます。
頻繁に使用されるディメンションカウントの計算フィールドを追加します。 現在のバージョンでは、ディメンションフィールドのカウントはサポートされていません。
データセットに計算フィールドを作成すると、クエリ 「2020 年に各県で 10,000 を超える売上高を上げた顧客は何人ですか?」 に正しく回答できます。システムは、計算入力に基づいて重複を自動的に削除します。
データセットフィールド名と説明を構成するための基本原則。
フィールド名:
フィールド名は明確で標準化されており、ユーザーの質問方法と一致している必要があります。フィールド名が重複しないようにしてください。
基になる英語のフィールド名を直接使用しないでください。不要なコメントは避けてください。
「過去 1 日」など、あいまいになる可能性のある特定の時間情報は避けてください。
フィールドタイプ: 日付/時刻データの場合は、データセットでフィールドタイプを日付に変更してください。そうしないと、認識に影響します。他のフィールドタイプも、対応するタイプ (地理ディメンションなど) に変更する必要があります。
フィールド集計方法: メジャーの場合は、適切なデフォルトの集計方法を選択します。ユーザーが集計方法を指定しない場合、モデルはこの構成を使用します。 たとえば、「コンバージョン率」の場合は、ビジネスセマンティクスに基づいてデフォルトとして平均を選択できます。「累積 XX」の場合は、合計ではなく、平均または最大をデフォルトとして選択します。