阿裡雲AI安全護欄是AI應用防護和內容稽核領域的先行者,依託阿裡巴巴多年科技積澱,深度融合通義大模型能力,構建面向AI時代的AI安全治理框架和UGC內容稽核體系。 基於在電商、社交、教育、遊戲、基模、AI應用等多場景積累的AIGC與UGC內容治理和風險防護經驗,提供覆蓋文字、圖片、視頻、音訊、檔案等多模態內容的一站式風險識別與AI防護服務。 為企業和開發者提供穩定、合規、即接即用的AI安全解决方案,高效防範違規、虛假、攻擊、有害等風險資訊,全面提升AI應用安全和內容質量,助力構建清朗可信的網路空間。
優點

-
領先算灋能力
基於阿裡巴巴集團、達摩院、通義實驗室等領先算灋能力,自動化精准識別,毫秒級結果返回。

-
功能豐富
支持視頻、圖片、文字、音訊等多模態,覆蓋內容稽核、提示詞攻擊、敏感數據、模型幻覺、AI鑒別等檢測功能。

-
實戰檢驗
服務於社交、直播、電商、教育、AIGC等行業客戶,豐富的樣本積累及管控經驗。

-
個性化定製
一對一算法運營,支持個性化效果調整,通過數據回流完成快速叠代。
產品詳情
-
安全護欄
風險檢測能力
覆蓋內容合規、敏感數據、提示詞攻擊、惡意檔案、惡意URL、模型幻覺、Prompt爬蟲等風險場景,同時支持對生成內容進行數字浮水印嵌入。
自定義防護配寘
支持在防護配寘中更改精細化的風險檢測項,包括自定義檢測項、自定義風險閾值、自定義過濾詞等。
接入方式<br/>
支持API、AI閘道、 WAF、 百煉模型、百煉智慧體、Dify智慧體、OpenClaw挿件等接入方式。
-
内容安全2.0
圖片稽核2.0版
支持對圖片中色情、性感、暴力、違禁、旗幟、不良、謾罵、特殊元素等風險內容進行檢測,包括圖片中畫面內容和圖片中文字內容(支持中文、英語、法語、俄語、日語、阿拉伯語等18種語言)。
視頻稽核2.0版
检测视频文件或视频直播流中是否存在违规或不宜传播的内容,支持对视频中画面和视频中语音进行检测。建议对涉及开放公网访问的视频内容均进行该项检测。
文字稽核2.0版
採用獨立的策略和標籤體系,能有效識別色情、暴力、違禁品、廣告引流、褻瀆辱駡、地域對立等文字內容。 支援中文、英文、法語、泰語、日語、韓語、俄語、葡萄牙語、阿裏伯語等38種語言類型。 提供更多功能特性,簡化業務使用並輔助人工稽核。
語音稽核2.0版
語音稽核2.0版服務通過陞級內容安全覈心引擎,提供面向圖文分享、遊戲連麥、直播課程等業務場景的稽核服務,識別違反網絡內容傳播規定、影響平臺秩序和用戶體驗的內容或元素,提供豐富的內容風險標籤。
檔案稽核2.0版
檢測檔案中是否包含圖片或文字違規資訊,包括色情、性感、涉政、暴恐、違禁等底線類內容。
-
内容安全1.0
圖片稽核服務
通過神經網路算灋和即時更新的億級影像樣本庫,可對圖片進行風險內容識別,支持涉黃、敏感資訊、暴力違禁、不良內容、LOGO等維度的檢測。
圖片OCR服務
基於業內領先的深度學習科技,經過多年各類業務場景打磨,可為用戶提供各類場景的文字識別服務。 OCR支持簡體中文、常見繁體中文以及英文識別。
面孔檢測和檢索
支持對圖片中的面孔進行檢測,支持對面孔進行比對,支持對面孔進行檢索等功能。
视频审核服务<br/>
通過神經網路算灋和即時更新的億級影像樣本庫,對視頻進行識別,檢測視頻中是否有涉黃、敏感、暴力違禁、不良、LOGO等風險內容。
文字反垃圾檢測服務
應用深度學習技術,檢測視頻中是否包含不良引導類內容,包含抽煙、喝酒、紋身、無意義、涉賭等。
