データセットのオーナーまたはワークスペースの管理者で、[データセット Q&A 構成] 権限を持っている場合、[Q&A 設定] と [Q&A 権限] を構成できます。必要な権限の取得方法については、「ロール管理」をご参照ください。このトピックでは、データセットの Q&A 設定、Q&A 権限、およびその他の機能の構成方法について説明します。
この機能は現在、中国 (香港) および マレーシア (クアラルンプール) のサイトでのみ利用可能です。他のサイトにも順次展開される予定です。
Q&A の構成
Q-Copilot を使用する前に、データセットの Q&A 設定を構成する必要があります。
アクセス
以下の 2 つの方法で Q&A 構成ページにアクセスできます。
方法 1:データセット編集ページで、[Q&A 構成] をクリックします。次の図に示します。

方法 2:データセットの作成ページで、[Q&A 構成] をクリックします。次の図に示します。

基本情報
[Q&A 構成] ページで、[基本情報] を構成します。
データセットのフィールドの品質は、Q&A の精度にとって非常に重要です。Q&A を有効にする前に、以下のヒントに従ってデータセットを確認してください。
フィールド名の最適化
フィールド名は明確で理解しやすいものにする必要があります。これにより、モデルがそれらを処理しやすくなり、複雑または曖昧な表現を防ぐことができます。
詳細なフィールド説明の提供
各フィールドに説明を追加することで、モデルがその意味と目的をよりよく理解できるようになります。
プレースホルダーの慎重な使用
プレースホルダーの構成は Q&A の結果に影響を与える可能性があります。Q&A を有効にする前に、プレースホルダーを無効にしてください。
ナレッジベース情報の拡充
ナレッジベース管理では、現在のデータセットに関する追加情報を追加・編集します。これにより、大規模言語モデル (LLM) がユーザーの意図をよりよく理解できるようになります。

データセットの [表示名] を変更できます。
説明ビジネスユーザーが理解しやすいデータセットの表示名を設定できます。この名前は訪問者に表示され、「2023年業界別収益データ」のようにデータの内容を理解するのに役立ちます。
説明
ユーザーがデータセットを見つけやすくするための簡単な説明を提供します。
データセットタイプ
データセットタイプを選択すると、Q-Copilot がデータ構造を理解しやすくなり、回答の精度が向上します。サポートされているタイプには、詳細テーブル、複数メトリックの定期的テーブル、Key-Value テーブル、その他があります。
詳細テーブル
1行に 1 レコードの詳細データを表示します。各レコードには、「注文 ID」、「ユーザー ID」、「注文ステータス」、「注文金額」など、複数のディメンション値やメトリック情報が含まれます。
複数メトリックの定期的テーブル
「7日間累積売上」、「15日間累積売上」、「30日間累積売上」など、さまざまな期間にわたるメトリックの統計値を表示します。
Key-Value テーブル
日付、ディメンション、メトリック名、メトリック値のフィールドを含む Key-Value テーブルです。例としては、「統計日」、「KPI メトリック名」、「KPI 実績値」、「KPI 目標値」などがあります。
[今すぐ学習] をクリックして、システムにデータセットを学習させます。

学習プロセスが完了した後、データセットが変更された場合は [再学習] をクリックできます。

[詳細設定] で、[ディメンション値のマッチングモード] を設定します。[自動モード] と [カスタムモード] がサポートされています。

ユーザーの質問に、ディメンション値の総数が学習上限を超えたためにシステムが学習していないディメンション値が含まれている場合、2 つのマッチングポリシーがサポートされています。
自動モード:システムは、ユーザーのディメンション値を、学習済みの類似したディメンション値に再書き込みするかどうかを自動的に判断します。
カスタムモード:管理者は、ディメンションごとに再書き込みを有効にするかどうかを個別に設定できます。
再書き込みを有効にする:システムがユーザーのディメンション値を学習済みのディメンション値にマッピングできるようにします。
再書き込みを無効にする:再書き込みを行わず、ユーザーの入力を厳密に照合します。
[次へ] をクリックして、[フィールド品質評価] ページに移動します。
フィールド品質評価
フィールド品質評価ページでは、システムは現在のデータセットのフィールドの品質を評価し、Q&A の結果を改善します。

[評価を開始] をクリックします。
説明フィールド品質評価には約 1〜2 分かかります。評価の実行中に次のステップに進むことができます。評価が完了すると通知されます。
フィールド品質評価が完了すると、システムは修正の提案を提供します。それらを受け入れるかどうかを選択できます。

[適用して再学習] をクリックして変更をデータセットのフィールド情報に適用します。次に、[次へ] をクリックして [クイック質問] ページに移動します。

クイック質問
ユーザーがデータセットを選択した後、すぐに始められるように推奨質問が表示されます。[システム推奨]、[エキスパートによるカスタマイズ]、[オブジェクトベースの推奨] の 3 つのモードがサポートされています。

システム推奨
クイック質問をプレビューできます。[更新] をクリックして、新しいクイック質問のバッチを取得します。
エキスパートによるカスタマイズ
エキスパートによるカスタマイズモードでは、[質問を追加] をクリックして、ユーザーに表示したい推奨質問を入力します。デフォルトでは、最初の 4 つの推奨質問が表示されます。4 つ以上入力した場合、ユーザーは [更新] をクリックして他の質問を表示できます。

複数のクイック質問を追加するには、[一括追加] をクリックして入力します。
説明1行に 1 つの質問を入力します。最大 10 個の質問を追加できます。

オブジェクトベースの推奨
[オブジェクトベースの推奨] モードでは、次の手順でルールを追加できます。
[推奨ルールを追加] または左下隅の [ルールを追加] をクリックします。

[推奨ルールを追加] ページで、ルール名、対象オブジェクト、および推奨質問を入力します。
推奨ルール名:識別しやすいようにルールの名前を入力します。
対象オブジェクト:対象ユーザーを選択します。
推奨質問:[質問を追加] をクリックして単一の質問を追加するか、[一括追加] をクリックして複数の推奨質問を追加します。
説明最大 10 個の質問を追加できます。

他のユーザーについては、適用するルールとして [システム推奨] または [エキスパートによるカスタマイズ] を選択します。

[変更を確定] をクリックして構成を完了します。
完了後、[Q-Copilot 権限管理に移動] または [Q&A 権限] タブをクリックして、[Q&A 権限] 設定ページに移動できます。このページでは、この Q&A データセットの権限をユーザーに付与できます。詳細については、「Q&A 権限の設定」をご参照ください。

Q&A 権限の設定
Q&A 設定を構成した後、Q&A 権限を管理できます。
次の図は、[Q&A 権限] 設定ページを示しています。

[Q&A 権限] 設定ページで、[権限付与を追加] をクリックします。

前の Q&A 構成ページで [権限付与を追加] をクリックすることもできます。

権限を付与するユーザーを選択します。有効期限を設定することもできます。

[完了] をクリックします。これで、この Q&A データセットの権限が付与されたユーザーを表示および管理できます。

[集中管理] 権限がある場合は、Q-Copilot > [権限管理] ページで追加の権限管理タスクを実行できます。詳細については、「権限管理」をご参照ください。
ナレッジベース管理
ナレッジベースは、企業固有のナレッジや用語を構成するために使用されます。構成後、モデルはこのナレッジを学習し、データ取得と分析に使用します。データセット編集ページでナレッジベースを管理でき、[ビジネスロジック] と [正規表現マッチング] のルールを構成できます。
データセットのナレッジベースは、企業のナレッジベースよりも優先度が高くなります。企業のナレッジベースの管理方法については、「企業ナレッジベース管理」をご参照ください。
アクセス
次の図に示すように、[ナレッジベース管理] ページに移動します。

ビジネスロジックの追加
[ナレッジベース管理] > [現在のデータセットから] > [ビジネスロジック] タブで、ビジネスロジックを追加できます。
右上隅にある [ビジネスロジックを追加] をクリックします。
[ビジネス定義]、[データ説明]、[同義語] を入力します。次に、[強制的な再書き込みを有効化] オプションを構成します。
ビジネス定義:売上の進捗や会計年度など、企業内の一般的な概念を定義します。最大 100 文字までです。このフィールドはグローバルで一意である必要があります。ここによく使われる Q&A 用語を入力できます。
データ説明:ビジネス定義の具体的な説明を提供し、それをデータメトリックに関連付けます。これにより、モデルが異なるメトリックを識別し、理解するのに役立ちます。最大 3000 文字までです。
同義語:企業内でのビジネス用語の異なる呼び名を定義します。これにより、モデルがさまざまな質問の仕方を認識するのに役立ちます。
強制的な再書き込みを有効化:このオプションを有効にすると、ユーザーの質問が [ビジネス定義] またはその [同義語] と一致した場合、質問は [データ説明] の内容に再書き込みされます。このオプションは慎重に使用してください。
[保存] をクリックします。
エントリの追加を続けるには、[保存して別のエントリを追加] をクリックします。
正規表現マッチの追加
[ナレッジベース管理] > [現在のデータセットから] > [正規表現マッチ] タブで、正規表現マッチを追加できます。
右上隅にある [正規表現マッチを追加] をクリックします。
[ビジネス定義]、[正規表現]、[データ説明] を入力します。次に、[強制的な再書き込みを有効化] オプションを構成します。
ビジネス定義:正規表現の名前を識別するためにのみ使用されます。ユーザーの質問とのマッチングには使用されません。最大 100 文字までで、データセット内で一意である必要があります。
正規表現:ユーザーの質問を識別するために使用されます。選択された適用方法に基づいて操作が実行されます。式は Python スタイルで記述します。最大 100 文字までです。
[マッチングするテキストを入力] して式をテストし、[マッチング結果] を表示できます。
データ説明:正規表現内の対応する内容の具体的な説明を提供します。適用方法と組み合わせることで、式の内容を説明または再書き込みできます。
強制的な再書き込みを有効化:このオプションを有効にすると、ユーザーの質問が [正規表現] と一致した場合、質問は [データ説明] の内容に再書き込みされます。このオプションは慎重に使用してください。
[保存] をクリックします。
エントリの追加を続けるには、[保存して別のエントリを追加] をクリックします。
ナレッジベースの管理
[ナレッジベース管理] > [現在のデータセットから] タブでナレッジベースを管理できます。
[有効] 列でナレッジエントリのステータスを確認できます。
ナレッジエントリのアイコンが
の場合、エントリは有効です。アイコンをクリックして無効にできます。ナレッジエントリのアイコンが
の場合、エントリは無効です。アイコンをクリックして有効にできます。
対象のナレッジエントリの右側にある
アイコンをクリックして編集します。対象のナレッジエントリの右側にある
アイコンをクリックして削除します。複数のエントリを選択して一括で削除できます。

[企業ナレッジベースから] タブをクリックして、このデータセットに適用される企業ナレッジベースのナレッジを表示します。

変動要因分析の設定
データセット編集ページで、[詳細設定] をクリックし、[変動要因分析] を選択して変動要因分析の設定ページに移動します。
変動要因分析の設定ページでは、メトリックの [分析アプローチ] と [レポートテンプレート] を構成できます。詳細については、「主要因分析」をご参照ください。
データセット設定の推奨事項
計算可能なディメンション属性については、デフォルトの集計方法を平均に設定します。そうしないと、後続のデータ計算に影響が出ます。
価格、高さ、幅などの属性には、最大値、最小値、平均値などの集計計算が含まれます。これらの属性はメジャーとして扱う必要があります。クエリ中に自動的に合計されるのを防ぐため、デフォルトの集計方法を平均に設定する方が論理的です。例:「価格が 30 万を超える車種を持つ各ブランドの売上高はいくらですか?」
データフィールドにデータ単位を指定します。そうしないと、フィルタリングに影響が出ます。
クエリ「価格が 10 万を超えるブランドの売上高はいくらですか?」で、価格フィールドの単位が万の場合、バックエンドの計算では >100,000 ではなく >10 という条件が使用されます。
頻繁に使用されるディメンションのカウントには計算フィールドを追加します。現在のバージョンでは、ディメンションフィールドのカウントはサポートされていません。
クエリ「2020年に各省で売上が 1 万を超えた顧客は何人ですか?」は、データセットに計算フィールドを作成すれば正しく回答できます。システムは計算入力に基づいて重複を自動的に削除します。
データセットのフィールド名と説明を構成するための基本原則。
フィールド名:
フィールド名は明確で、標準化されており、ユーザーが質問する方法と一致している必要があります。重複するフィールド名は避けてください。
基盤となる英語のフィールド名を直接使用しないでください。不要なコメントは避けてください。
「過去 1 日」など、曖昧になりがちな特定の時間情報は避けてください。
フィールドタイプ:日付/時刻データの場合、フィールドタイプをデータセットで [日付] に変更してください。そうしないと、システムが正しく認識しない可能性があります。他のフィールドタイプも、地理ディメンションなど、対応するタイプに変更する必要があります。
フィールドの集計方法:メジャーについては、適切なデフォルトの集計方法を選択します。ユーザーが集計方法を指定しない場合、モデルはこの構成を使用します。たとえば、「コンバージョン率」については、ビジネスセマンティクスに基づいてデフォルトとして平均を選択できます。「累積 XX」については、合計ではなく、平均または最大をデフォルトとして選択します。