DataWorks支持Python和Java两种语言接口,本文为您介绍如何注册函数。

前提条件

您需要先上传资源,才可以注册函数。

操作步骤

  1. 进入数据开发页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的数据开发
  2. 创建业务流程,详情请参见创建业务流程
  3. 创建JAR或Python类型的资源,并提交发布。详情请参见创建MaxCompute资源
  4. 新建函数。
    1. 打开相应的业务流程,右键单击MaxCompute,选择新建 > 函数
    2. 新建函数对话框中,输入函数名称,并选择目标文件夹
    3. 单击提交
    4. 注册函数对话框中,配置各项参数。
      注册函数
      参数 描述
      函数类型 选择函数类型,包括数学运算函数聚合函数字符串处理函数日期函数窗口函数其他函数
      MaxCompute引擎实例 默认不可以修改。
      函数名 UDF函数名,即SQL中引用该函数所使用的名称。需要全局唯一,且注册函数后不支持修改。
      责任人 默认显示为当前登录账号,您也可以选择其他账号。
      类名 UDF函数的类名,格式为资源名.类名。其中,资源名可以为Java包名称或Python资源名称。
      DataWorks创建自定义函数时支持使用JAR及Python两种类型的MaxCompute资源,不同类型资源的类名配置如下:
      • 当资源类型为JAR时,配置的类名格式为Java包名称.实际类名,您可以在IDEA中通过copy reference语句获取。

        例如,com.aliyun.odps.examples.udf为Java包的名称,UDAFExample为实际类名,则类名参数配置为com.aliyun.odps.examples.udf.UDAFExample

      • 当资源类型为Python时,配置的类名格式为Python资源名称.实际类名
        例如,LcLognormDist_sh为Python资源名称,LcLognormDist_sh为实际类名,则类名参数配置为LcLognormDist_sh.LcLognormDist_sh
        说明
        • 填写资源名称时,无需添加.jar.py后缀。
        • 资源需要提交并发布后才可以使用,详情请参见创建MaxCompute资源
      资源列表 支持模糊匹配查找本工作空间中已添加的资源,必填。
      说明
      • 无需填写已添加的资源的路径。
      • 如果UDF中调用了多个资源,则多个资源使用英文逗号(,)分隔。
      描述 针对当前UDF作用的简单描述。
      命令格式 该UDF的具体使用方法示例,例如test
      参数说明 支持输入的参数类型以及返回参数类型的具体说明。
      返回值 返回值,例如1,非必填项。
      示例 函数中的示例,非必填项。
  5. 单击工具栏中的保存图标。
  6. 提交函数。
    1. 单击工具栏中的提交图标。
    2. 提交新版本对话框中,输入变更描述
    3. 单击确认