本記事の作成者:JV Roig
Alibaba Cloud での生成 AI のデプロイアプローチに関するシリーズのパート 3 へようこそ。
本シリーズのパート 1 では、Elastic Compute Service (ECS) を使用して、Iaas で生成 AI をデプロイしました。
パート 2 では、Platform for AI (PAI) を使用して、PaaS (Platform as a Service) で生成 AI をデプロイしました。 パート 1 の手順と比較して、PAI では使用可能な生成 AI エンドポイントをはるかに簡単かつ短時間で作成できます。さらに、すぐに本番環境で使用できます。
本日は、Alibaba Cloud Model Studio を使用して、MaaS (Model as a Service) アプローチに取り組みます。
Alibaba Cloud Web コンソールにログインし、Model Studio を検索します。 表示される結果 (Alibaba Cloud Model Studio) をクリックします。
今回初めて使用する場合は、Model Studio をアクティブ化してください。 最初に Model Studio コンソールを開いた際に表示される画面上の指示に従います。
右上隅にあるユーザーアイコンにカーソルを合わせて、表示されるポップアップメニューで [API-KEY] をクリックします。
[Create API Key] ボタンをクリックします。
新しい API キーがテーブルに追加されます。 [Actions] 列の [View] をクリックして、API キーをアプリケーションまたは環境変数にコピー&ペーストするために完全に表示します。
API キーは秘密にしておくことを推奨します。 API キーが誤って漏洩した場合 (公開コードに残した場合など) は、その API キーを削除して新しいものを作成する必要があります。
Model Studio ホームページに戻ります。 左サイドバーの [Model Gallery] をクリックします。
Model Gallery に使用可能なモデルが表示されます。 この例では、Qwen-Max を選択します。 Qwen-Max で、[Try] をクリックします。
[Model Experience] ページが開きます。 Qwen-Max の他に、別のモデルを追加して試すことができます。 このテストでは、Qwen-Plus を選択します。
(上図では、Qwen-Max と Qwen-Plus の両方がチェックされています。)
チャットボックスにメッセージを入力し、enter キーを押します。 両方のモデルが同時に答えていることがわかりますが、Qwen-Max は Qwen-Plus よりもゆっくりです (はるかに大きいため)。
前述の API キーが必要になります。
[Model Gallery] ページでは、各モデルの下に [API Call Example] リンクがあり、独自のアプリケーションでモデルを使用する際に役立つサンプルコードが表示されます。
右上に [API Call Documentation] ボタンが表示され、クリックすると Model Studio モデルの公式 API ドキュメントが開きます。
このように、Model Studio を使用して生成 AI 機能をアプリケーションに統合する準備が整いました。
まず、Alibaba Cloud Model Studio SDK をインストールする必要があります。 この例では Python を使用するので、pip を使用して Python 用の Alibaba Cloud Model Studio SDK をインストールします。
pip install dashscope
以下に、Model Studio コンソールで直接提供されるサンプルとドキュメントから作成したサンプルコードを示します。
これは、パート 1 から使用しているものと同じ推論の例です。 そして、Python コードを実行したときのサンプル出力は以下の通りです。
想定の通り、この LLM はシステムプロンプトに従って海賊のような口調で応答し、私たちの質問に対して船旅の提案をしています。
以上です。 Model Studio を使用すると、本当に簡単に生成 AI を始められることがお分かりいただけたと思います。
最も優れている点は、 すべてはすぐに本番環境で使用できる ことで、パフォーマンスとスケーラビリティを問題にしなくてもよいところです。 すべてが Model Studio によって処理されます。
IaaS や PaaS を使用した生成 AI のデプロイとは異なり、Model Studio では、トークン課金 を利用できます。 ECS または PAI にデプロイするインスタンスに対して時間単位で料金を支払う代わりに、実際に消費するトークンの料金を支払うだけです。 実際の料金については、こちらの公式ドキュメントをご参照ください:https://www.alibabacloud.com/help/en/model-studio/developer-reference/billing-for-tongyiqianwen
本記事の作成者について:JV は Alibaba Cloud フィリピンのシニアソリューションアーキテクトであり、チームのデータおよび生成 AI 戦略を主導しています。 この記事の内容が、お客様のビジネス上の問題のいくつかに関連していると思われる場合、JV (jv.roig@alibaba-inc.com) までお問い合わせください。
この記事は英語から翻訳されました。 元の記事は こちら です。
72 posts | 3 followers
FollowRegional Content Hub - August 28, 2024
Regional Content Hub - August 28, 2024
Regional Content Hub - February 26, 2024
Regional Content Hub - March 8, 2024
Regional Content Hub - January 19, 2024
Regional Content Hub - March 8, 2024
72 posts | 3 followers
FollowTop-performance foundation models from Alibaba Cloud
Learn MoreA one-stop generative AI platform to build intelligent applications that understand your business, based on Qwen model series such as Qwen-Max and other popular models
Learn MoreAccelerate innovation with generative AI to create new business success
Learn MoreMake identity management a painless experience and eliminate Identity Silos
Learn MoreMore Posts by Regional Content Hub