如果您在表格存储里面的数据有着独特的结构,希望自定义开发逻辑来处理每一行数据,例如解析特定的JSON字符串,可以使用UDF(User Defined Function,即用户自定义函数)来处理。

操作步骤

  1. 参考MaxCompute Studio文档,在IntelliJ中安装MaxCompute-Java/MaxCompute-Studio插件。插件安装完毕,即可直接开发。

    下图是一个简单的UDF定义,将两个字符串连接。MaxCompute支持更复杂的UDF,包括自定义窗口执行逻辑等。更多信息,请参见开发和调试UDF

  2. 参考MaxCompute Studio文档,在IntelliJ中安装MaxCompute-Java/MaxCompute-Studio插件。插件安装完毕,即可直接开发。

    下图是一个简单的UDF定义,将两个字符串连接。MaxCompute支持更复杂的UDF,包括自定义窗口执行逻辑等。更多信息,请参见开发和调试UDF

  3. 包之后可以上传到MaxCompute。

    选择File > Project Structure > Artifacts,输入NameOutput directory后,单击+选择输出模块。打包后通过ODPS Project Explorer来上传资源、创建函数,然后就可以在SQL中调用。

    fig_udf_003
  4. 运行bin/odpscmd.bat
    // 选出来1行数据,并将name/name传入UDF,返回两个string的累加.
    select cloud_metric_extract_md5(name, name) as udf_test from test_table limit 1;                    

    返回结果如下:

    fig_udf_004