阿里云AI 安全护栏是AI应用防护和内容审核领域的先行者,依托阿里巴巴多年技术积淀,深度融合通义大模型能力,构建面向AI时代的AI安全治理框架和UGC内容审核体系。基于在电商、社交、教育、游戏、基模、AI应用等多场景积累的AIGC与UGC内容治理和风险防护经验,提供覆盖文本、图片、视频、音频、文档等多模态内容的一站式风险识别与AI防护服务。为企业和开发者提供稳定、合规、即接即用的AI安全解决方案,高效防范违规、虚假、攻击、有害等风险信息,全面提升AI应用安全和内容质量,助力构建清朗可信的网络空间。
优点

-
领先算法能力
基于阿里巴巴集团、达摩院、通义实验室等领先算法能力,自动化精准识别,毫秒级结果返回。

-
功能丰富
支持视频、图片、文本、音频等多模态,覆盖内容审核、提示词攻击、敏感数据、模型幻觉、AI鉴别等检测功能。

-
实战检验
服务于社交、直播、电商、教育、AIGC等行业客户,丰富的样本积累及管控经验。

-
个性化定制
AI安全专家团队,一对一算法运营,支持个性化效果调整,通过数据回流完成快速迭代。
产品详情
-
安全护栏
风险检测能力
覆盖内容合规、敏感数据、提示词攻击、恶意文件、恶意URL、模型幻觉、Prompt爬虫等风险场景,同时支持对生成内容进行数字水印嵌入。
自定义防护配置
支持在防护配置中更改精细化的风险检测项,包括自定义检测项、自定义风险阈值、自定义过滤词等。
接入方式
支持API、AI网关、WAF、百炼模型、百炼智能体、Dify智能体、OpenClaw插件等接入方式。
-
内容安全2.0
图片审核2.0版
支持对图片中色情、性感、暴力、违禁、旗帜、不良、谩骂、特殊元素等风险内容进行检测,包括图片中画面内容和图片中文字内容(支持中文、英语、法语、俄语、日语、阿拉伯语等18种语言)。
视频审核2.0版
检测视频文件或视频直播流中是否存在违规或不宜传播的内容,支持对视频中画面和视频中语音进行检测。建议对涉及开放公网访问的视频内容均进行该项检测。
文本审核2.0版
采用独立的策略和标签体系,能有效识别色情、暴力、违禁品、广告引流、亵渎辱骂、地域对立等文本内容。支持中文、英文、法语、泰语、日语、韩语、俄语、葡萄牙语、阿里伯语等38种语言类型。提供更多功能特性,简化业务使用并辅助人工审核。
语音审核2.0版
语音审核2.0版服务通过升级内容安全核心引擎,提供面向图文分享、游戏连麦、直播课程等业务场景的审核服务,识别违反网络内容传播规定、影响平台秩序和用户体验的内容或元素,提供丰富的内容风险标签。
文档审核2.0版
检测文档中是否包含图片或文字违规信息,包括色情、性感、涉政、暴恐、违禁等底线类内容。
-
内容安全1.0
图片审核服务
通过神经网络算法和实时更新的亿级图像样本库,可对图片进行风险内容识别,支持涉黄、敏感信息、暴力违禁、不良内容、LOGO等维度的检测。
图片OCR服务
基于业内领先的深度学习技术,经过多年各类业务场景打磨,可为用户提供各类场景的文字识别服务。OCR支持简体中文、常见繁体中文以及英文识别。
面孔检测和检索
支持对图片中的面孔进行检测,支持对面孔进行比对,支持对面孔进行检索等功能。
视频审核服务
通过神经网络算法和实时更新的亿级图像样本库,对视频进行识别,检测视频中是否有涉黄、敏感、暴力违禁、不良、LOGO等风险内容。
文本反垃圾检测服务
应用深度学习技术,检测视频中是否包含不良引导类内容,包含抽烟、喝酒、纹身、无意义、涉赌等。
