すべてのプロダクト
Search
ドキュメントセンター

MaxCompute:MaxCompute の AI 関数の概要

最終更新日:Jun 04, 2026

AI 関数は、AI 関連のユースケース向けに MaxCompute で定義済みの関数セットです。複雑なモデル推論操作を簡潔な SQL または Python 演算子にカプセル化します。これらの関数を使用すると、低レベルのモデル呼び出しコードを記述することなく、標準 SQL または MaxFrame (分散 Python エンジン) から大規模モデルや機械学習モデルを直接呼び出すことができます。これにより、データ処理やビッグデータ分析で AI を使用するための参入障壁が大幅に低減します。

ユースケース

大規模モデルはデータ理解能力が大幅に向上しており、構造化データ、テキスト、非構造化データなどのマルチモーダルデータから正確な意味情報を抽出できます。命令追従能力に基づき、これらのモデルは意味情報を正規化データに変換し、関係代数操作を可能にします。これにより、ビッグデータプラットフォーム内で構造化データと非構造化データの両方に対する統一的なクエリと処理が実現します。

ユースケースが拡大するにつれて、ビッグデータプラットフォーム内での統一コンピューティングに対する需要が高まっています。MaxCompute は、MaxFrame (Python) や SQL などの複数のコンピューティングエンジンを提供することで、この需要に応えます。AI 関数と組み合わせることで、MaxCompute はユーザーが AI をより簡単に活用できる方法を提供します。これにより、マルチモーダルデータ処理、コンテンツ生成、情報抽出、画像およびテキスト分析など、さまざまなユースケースにおけるデータ分析とコンピューティングの能力と品質が向上します。典型的なユースケースは次のとおりです:

  1. 大規模モデルの事前学習のためのデータ前処理:大規模モデルの事前学習のための Web データ処理では、テキスト品質スコアの計算、テキストのフィルタリング、テキストの分類などのタスクを実行するために、ファインチューニングされた小パラメータの大規模言語モデル (LLM) が必要です。

  2. マルチモーダルコンテンツの理解:従来の e コマースや新たな自動運転分野におけるビデオや画像の処理では、オブジェクト検出、画像タギング、分類などのタスクを実行するためにマルチモーダルモデルが必要です。

  3. インテリジェントなリスクコントロール:インテリジェントなリスクコントロールのユースケースでは、ユーザー行動の分類やリスク警告などのタスクに、ファインチューニングされた小パラメータの LLM を使用できます。

image.png

利点

  • ローコード開発:迅速に開始できます。モデルサービスをデプロイしたり、複雑な推論ロジックを記述したりすることなく、単一の関数呼び出しでモデル推論を実行できます。これにより、開発サイクルが大幅に短縮され、AI アプリケーションを構築するための障壁が低くなります。

  • シームレスな統合:AI 関数は MaxCompute のモデルオブジェクト、コンピューティングリソース、権限システムとシームレスに統合されており、導入が簡素化されます。

  • 統一されたマルチエンジンサポート:MaxCompute は、SQL と MaxFrame の両方のエンジンで統一された AI 関数機能を提供します。これにより、データアナリストは使い慣れた SQL を使用して強力な AI モデルを呼び出すことができ、データサイエンティストは MaxFrame の分散 Python コンピューティング能力を活用してデータ前処理の能力と品質を向上させることができます。

AI 関数

SQL AI 関数

MaxCompute は、MaxCompute モデルオブジェクトを指定してモデル推論を実行できる SQL AI 関数を提供します。サポートされているモデルには、組み込みのパブリック大規模言語モデル、ユーザーがインポートしたモデル、PAI-EAS のリモートモデルなどがあります。詳細については、「モデルタイプ」をご参照ください。

  • 次の表に、MaxCompute がサポートする SQL AI 関数を示します。

    関数

    説明

    サポートされているモデルタイプ

    AI_CLASSIFY

    指定されたラベルのセットから、入力コンテンツに最も一致するラベル文字列を抽出します。

    パブリックモデルリストのモデルをサポートします。ただし、text-embedding-v4Qwen3-VL-8B-Instruct は除きます。

    AI_EXTRACT

    指定されたテキストデータから指定された情報を抽出します。

    パブリックモデルリストのモデルをサポートします。ただし、text-embedding-v4Qwen3-VL-8B-Instruct は除きます。

    AI_GENERATE

    自然言語テキストを生成します。複雑な論理的推論や非構造化データの処理をサポートします。

    パブリックモデルとリモートモデルをサポートします。ただし、Qwen3-VL-8B-Instruct は除きます。

    AI_SENTIMENT

    入力テキストの感情分析を実行します。

    パブリックモデルリストのモデルをサポートします。ただし、text-embedding-v4Qwen3-VL-8B-Instruct は除きます。

    AI_SIMILARITY

    2 つのテキスト間のテキスト的および意味的類似性を判定します。0 から 1 までの浮動小数点数を返し、値が大きいほど意味的類似性が高いことを示します。

    公開モデルリストのモデルをサポートします。ただし、text-embedding-v4Qwen3-VL-8B-Instruct は除きます。

    AI_SUMMARIZE

    指定されたテキストの要約を生成します。

    パブリックモデルリストのモデルをサポートします。ただし、text-embedding-v4Qwen3-VL-8B-Instruct は除きます。

    AI_TRANSLATE

    入力テキストを指定された言語に翻訳します。

    パブリックモデルリストのモデルをサポートします。ただし、text-embedding-v4Qwen3-VL-8B-Instruct は除きます。

    ML_PREDICT

    構造化データに対して予測を行います。これは、分類や回帰などの従来の機械学習タスクで一般的です。

    • BOOSTED_TREE_REGRESSOR

    • BOOSTED_TREE_CLASSIFIER

SQL AI 関数の課金

SQL AI 関数を使用してモデルを呼び出す場合:

  • サブスクリプションの標準コンピューティングリソース (サブスクリプション CU クォータとも呼ばれる) を使用する場合、ジョブは CU クォータを消費します。

  • 従量課金の標準コンピューティングリソース (従量課金 CU クォータとも呼ばれる) を使用する場合、SQL ジョブによってスキャンされたデータ量に基づいて課金され、別途 CU コンピューティング料金は発生しません。

MaxFrame の AI 関数

MaxFrame AI 機能は、柔軟で汎用的な generate インターフェイスと、簡潔なシナリオベースの task インターフェイス (翻訳、構造化データ抽出、埋め込みなど) を提供します。モデルを選択し、MaxCompute テーブルとプロンプトを入力として提供します。

インターフェースが実行されると、MaxFrame はまずテーブルデータを分割します。データサイズに応じて適切な並列度を設定し、ワーカーのグループを起動して計算を実行できます。各ワーカーは、提供されたプロンプトテンプレートを使用して入力データ行からプロンプトをレンダリングし、推論を実行して、成功ステータスを含む結果を MaxCompute に書き戻します。

全体のアーキテクチャとワークフローを以下の図に示します。

image.png

MaxCompute は、MaxFrame を通じて Python ベースの AI 関数も提供します。

この呼び出しは、必要なリソースタイプに基づいて CPU または GPU リソースを消費します。詳細については、「MaxFrame の AI 関数」をご参照ください。

チュートリアル

MaxCompute のモデルと AI 関数の使用に関するその他のチュートリアルについては、次のトピックをご参照ください: