全部產品
Search
文件中心

Object Storage Service:文檔處理

更新時間:Dec 27, 2024

文檔轉換是由Intelligent Media ManagementIMM提供的對多種文檔格式進行格式轉換的處理能力。您可以將原始文檔上傳到阿里雲Object Storage Service,通過OSS的RESTful資料處理介面x-oss-processx-oss-async-process在任何時間、任何地點、任何互連網裝置上對文檔進行文檔格式轉換、線上預覽、線上編輯等處理。

處理參數

OSS支援直接使用一個或多個參數處理文檔,也支援將多個參數封裝在一個樣式中批量處理文檔。關於樣式的更多資訊,請參見樣式

當存在多個處理參數時,OSS將按照參數順序對檔案進行處理。處理參數說明如下表所示。

處理操作

參數

說明

文檔轉換

doc/convert

將OSS中的文檔轉換為需要的格式。

文檔線上預覽

doc/preview

對OSS中的文檔進行預覽。

文檔線上編輯

doc/edit

對OSS中的文檔進行協同編輯。

文檔快照

doc/snapshot

對OSS中的文檔指定頁產生快照。

文檔智能處理

參見具體文檔

對OSS中的文檔進行AI處理,包括文檔內容翻譯、文檔內容潤色、文檔摘要產生、文檔續寫、文檔內容豐富以及文檔語氣改寫六大類。

操作方式

  • 您可以通過非同步處理介面x-oss-async-process對文檔進行轉換處理。操作方式,請參見非同步處理

  • 您可以使用批處理對存量文檔進行轉換處理。操作方式,請參見批處理

  • 您可以使用觸發器對增量文檔進行轉換處理。操作方式,請參見觸發器

  • 您可以通過同步處理介面x-oss-process對文檔進行線上預覽、線上編輯、文檔快照、文檔智能處理。操作方式,請參見同步處理

使用限制

文檔轉換支援的檔案類型

  • 輸入檔案類型

    文件類型

    檔案尾碼

    文字文檔

    doc、dot、wps、wpt、docx、dotx、docm、dotm、txt、wpss、lrc、c、cpp、h、asm、s、java、asp、bat、bas、prg、cmd、rtf、txt、log、xml、htm、html

    示範文檔

    pptx、ppt、pot、potx、pps、ppsx、dps、dpt、pptm、potm、ppsm、dpss

    表格文檔

    xls、xlt、et、ett、xlsx、xltx、csv、xlsb、xlsm、xltm、ets

    PDF文檔

    pdf

  • 輸出檔案類型

    檔案格式

    說明

    JPEG

    按文檔樣式每頁產生一張JPEG圖片。

    PNG

    按文檔樣式每頁產生一張PNG圖片。

    PDF

    每個文檔產生一個PDF檔案。

    TXT

    每個文檔產生一個TXT檔案。

文檔轉換支援的檔案大小和頁數

  • 文檔轉換單次轉換的原檔案大小限制為200 MB。

  • 文檔轉換單次轉換的原檔案頁數無限制,但頁數太多可能會導致轉換處理逾時,此時需要傳入頁碼參數分頁轉換。樣本如下:

    POST /exmaple.docx?x-oss-async-process HTTP/1.1
    Host: doc-demo.oss-cn-hangzhou.aliyuncs.com
    Date: Fri, 28 Oct 2022 06:40:10 GMT
    Authorization: OSS qn6q**************:77Dv****************
     
     // 將檔案example.docx的1-10頁轉換為PNG格式的圖片檔案,轉換後的儲存路徑為:oss://test-bucket/doc_images/頁碼.png。
    x-oss-async-process=doc/convert,pages_MS0xMA,target_png,source_docx|sys/saveas,b_dGVzdC1idWNrZXQ,o_ZG9jX2ltYWdlcy97aW5kZXh9LnBuZw

文檔預覽支援的檔案類型

文檔預覽支援的檔案類型如下表所示。

文件類型

檔案尾碼

文字文檔

doc、dot、wps、wpt、docx、dotx、docm、dotm、rtf

表格文檔

xls、xlt、et、xlsx、xltx、csv、xlsm、xltm

示範文檔

ppt、pptx、pptm、ppsx、ppsm、pps、potx、potm、dpt、dps

PDF文檔

pdf

文檔編輯支援的檔案類型

文檔編輯支援的檔案類型如下表所示。

文件類型

檔案尾碼

文字文檔

doc、dot、wps、wpt、docx、dotx、docm、dotm

表格文檔

xls、xlt、et、xlsx、xltx、xlsm、xltm

示範文檔

ppt、pptx、pptm、ppsx、ppsm、pps、potx、potm、dpt、dps

文檔預覽和編輯支援的檔案大小和頁數

  • 文檔預覽和編輯支援的檔案大小限制為200 MB。

  • 文檔預覽和編輯支援的頁數無限制。

文檔快照支援輸出的檔案格式

  • 支援輸出jpg、png格式。

計費

使用文檔處理服務時,會產生如下費用:

  • 文檔處理費用:由Intelligent Media Management(IMM)收取,費用詳情請參見計費項目

  • 請求費用:處理文檔線上預覽、文檔線上編輯、文檔快照時會產生一次Get請求,按請求次數收費。計費詳情,請參見請求費用

  • 流量費用:處理文檔線上預覽、文檔線上編輯、文檔快照根據處理後的返回資訊的大小收取外網流出流量費用。計費詳情,請參見流量費用

常見問題

開啟CDN後產生帶簽名的文檔URL報錯Either the Signature query string parameter or the Authorization header should be specified, not both.

如果您在私人 Bucket 開啟回源功能後,通過 CDN 網域名稱訪問已綁定至 IMM 專案的 Bucket 中的檔案,無需提供額外的簽名資訊。請按照以下要求進行配置:

  1. 授權預設角色 您需要為 CDN 的預設角色 AliyunCDNAccessingPrivateOSSRole授予 oss:ProcessImmimm:GetWebofficeURL許可權。

  2. 訪問資源時,應使用不包含簽名資訊的 URL。

    例如,您可以使用如下格式的URL:http://cdn.example.info/demo.ppt?x-oss-process=doc/preview,export_1,print_1使用文檔線上預覽功能。