全部產品
Search
文件中心

Data Management:Notebook開發

更新時間:Sep 23, 2025

Notebook相當於一個互動頁面,能夠在同一個頁面中整合代碼、文字和圖表,以便於向其他使用者傳達資訊。本文介紹如何在工作空間中使用Notebook進行資料查詢和分析。

前提條件

您的AnalyticDB for MySQL執行個體已引入目標工作空間。具體操作,請參見Notebook所需資源

注意事項

新版Notebook僅支援部分地區使用,包括:華東1(杭州)、華北2(北京)、華東2(上海)、華南1(深圳)、新加坡和印尼(雅加達)。

費用資訊

Notebook會話的費用與該會話的規格(使用的CU數)相關,單價請以配置資源時的頁面提示為準。

操作步驟

  1. 建立Notebook檔案並執行相關代碼。

    如下為您展示兩種建立Notebook檔案的方式,您可任選其一。

    手動建立檔案

    1. 單擊工作空間右側的image(資源管理員)。

    2. 在WORKSPACE地區,右鍵空白地區,選擇建立Notebook檔案

    3. 輸入檔案名稱,再單擊確定

    使用匯入功能匯入檔案

    1. 單擊工作空間右側的image(資源管理員)。

    2. 在WORKSPACE地區,右鍵空白地區,選擇上傳檔案。

    3. 輸入檔案名稱,再單擊確定

    說明

    建立Notebook檔案後,如果檔案沒有出現在工作空間地區,請單擊image重新整理資源管理員。

  2. 雙擊檔案名稱,進入執行字碼頁面進行作業開發。

  3. 在Cell中輸入相關代碼,再單擊image執行按鈕。

    如果頁面出現提示“運行失敗,需要您先建立並掛載Notebook會話資源”,則需要單擊建立會話

  4. 建立Notebook會話。

    1. 單擊建立會話,並配置如下參數資訊。

      參數

      說明

      所屬叢集

      選擇目的地組群類型。

      • 如果您僅需要使用CPU執行,則選擇DMS預設CPU叢集即可(建立工作空間時,已自動建立)。

      • 如果您需要使用Spark開發作業,則選擇Spark叢集(需要手動建立)。

        您可在叢集下拉式清單單擊建立叢集,選擇建立Spark叢集

      會話名稱

      您可自訂會話名稱。

      鏡像

      頁面會根據您選擇的叢集類型展示對應的鏡像規格。

      • Python3.9_U22.04:1.0.9

      • Python3.11_U22.04:1.0.9

      • Spark3.6_Scala2.12_Python3.9:1.0.9

      • Spark3.3_Scala2.12_Python3.9:1.0.9

      規格

      Driver的資源規格。

      • 1核4 GB

      • 2核8 GB

      • 4核16 GB

      • 8核32 GB

      • 16核64 GB

      配置

      profile資源。

      您可編輯profile的名稱、資源釋放時間長度、資料存放區位置、Pypi包管理和環境變數資訊。

      說明

      資源釋放時間長度:當資源空閑時間超過設定的時間長度,則會自動釋放。資源釋放時間長度設定為0,表示資源永久不會自動釋放。

    2. 單擊完成,去建立

      當工作階段狀態為運行中,表示建立成功。

      初次建立會話大約耗時5分鐘左右,後續建立或重啟會話大約需要1分鐘左右。

  5. 重新執行代碼。

    在Spark SQL Cell中執行的代碼,您可在資料目錄image地區查看。

Notebook介面介紹

image

支援的儲存格屬性:Python、SQL、Markdown和Parameter。

  • image:儲存輸入的SQL、Python代碼等資訊。

    說明

    DMS預設僅自動儲存已執行的SQL或代碼。其他未執行的SQL或代碼需要手動儲存,否則在關閉功能頁面或關閉瀏覽器後將無法查看。

  • image:增加一行Python屬性儲存格。

  • image:增加一行Markdown屬性的儲存格。

  • image:中斷核心,即暫停使用當前選擇的Spark資源執行代碼。

  • image:運行當前Notebook檔案中的SQL。

  • image:重啟核心,即重啟Spark資源。

  • image:執行所選中的儲存格。

  • image:執行上方所有的儲存格。

  • image:執行當前及以下所有的儲存格。

  • image:拆分儲存格。

  • image:刪除所選中的儲存格。

  • image:查看此儲存格的執行歷史。

  • image:開啟開關,該儲存格將不被執行。

建立Spark叢集

  1. 建立叢集頁面,配置Spark叢集資訊。

    參數說明如下:

    參數

    說明

    叢集名稱

    輸入便於識別使用情境的叢集名稱。

    運行環境

    目前支援選擇如下鏡像:

    • adb-spark:v3.3-python3.9-scala2.12

    • adb-spark:v3.5-python3.9-scala2.12

    AnalyticDB執行個體

    在下拉框中選擇已準備的AnalyticDB for MySQL

    AnalyticDB MySQL資源群組

    在下拉框中選擇已準備的Job資源群組。

    Spark APP Executor規格

    選擇AnalyticDB for MySQL Spark Executor的資源規格。

    不同型號的取值對應不同的規格,詳情請參見Spark應用配置參數說明的型號列。

    交換器

    選擇當前VPC下的交換器。

    依賴的Jars

    Jar包的OSS儲存路徑。僅在通過Python提交作業且使用了Jar包時,填寫該參數。

    SparkConf

    與開源Spark中的配置項基本一致,參數格式為key: value形式。與開源Spark用法不一致的配置參數及AnalyticDB for MySQL特有的配置參數,請參見Spark應用配置參數說明

  2. 單擊建立叢集

  3. 在Notebook會話中選擇已建立的Spark叢集。

    Notebook對話關聯Spark叢集後,叢集狀態變為運行中

其他動作

  • 添加儲存格

    在Notebook工具列中,根據需要選擇新增SQLPythonMarkdown、Parameter,快速建立對應的儲存格。此外,您也可以在代碼編輯區具體儲存格上下方快速新增儲存格。

    • 從目前的儲存格上方新增儲存格:滑鼠懸浮至儲存格上方時展示新增代碼按鈕。

    • 從目前的儲存格下方新增儲存格:滑鼠懸浮至儲存格下方時展示新增代碼按鈕。

  • 切換儲存格屬性

    單擊儲存格右側的屬性,即可切換儲存格屬性。

  • 開發儲存格代碼

    在相應的儲存格內可編輯SQL、Python以及Markdown代碼,使用SQL儲存格開發時,需確保SQL文法與選擇的SQL儲存格類型。