1 调研分析
1.1 调研重点
调研重点是对用户上传内容中文字和图片,是否涉政、涉恐(枪支弹药、宗教符号、血腥暴力)、涉黄等,进行发现和统一管理的产品。
1.2 方案对比
通过调研,与厂商进行沟通,并进行试用,了解到相关方案如下:
- 定向站点产品。通过在公网环境下配置定向站点地址,进行数据爬取,分析图片、文本是否存在涉正、恐、黄内容。目前了解到百度、阿里提供相关产品。
- 内容安全检测API公有云方式。通过HTTP REST 形式的API,向服务方发送指定图片URL或者上传图片文件,以实时或非实时的响应方式,获取分析结果。同时,可以安排人工审核人员在公有云平台系统中,对于不确定的内容进行人工审核确认。
- 内容安全检测API私有云(本地化部署)方式。功能实现原理同公有云。
下表就三种方案进行了详细对比:
定向站点监测产品 | API公有云产品 | API私有云产品 | |
产品检测方式 | 通过提交定向站点地址,由产品实现数据爬取,获取图片、文本,进行检查。 | 由我方将用户图片、文字以URL或上传方式提交公有云API,进行检测。
对于非自主开发系统通过数据爬取方式,对于自主开发系统可以通过API服务进行集成。 |
同公有云。 |
二次开发难度 | 无需二次开发,数据发现依赖于产品本身数据爬取能力。 | 对于非自主开发系统,需要自主开发数据爬取功能。 | 同公有云。 |
成本费用 | 价格最高。
按单个站点/年方式收费,价格单位在万元级。产品供应商少。 |
价格最低。
按公有云API调用次数收费,图片平均在1.6元/千张。 |
价格中等。
|
建设周期 | 最短。 | 较长。
需要自实现数据爬取等功能。 |
较长。
需要自实现数据爬取等功能。 |
应用复杂度 | 产品提供后台管理系统,允许自定义敏感词库、图库。对于多级组织架构、权限管理和质检流程支持弱,集团化管理困难。 | 产品提供后台管理系统,允许自定义敏感词库、图库。需要公网登录系统后台操作。
检测模型随供应商实时更新。 |
产品提供后台管理系统,允许自定义敏感词库、图库,可以通过API方式集成。
可以根据业务要求,进行高度定制化开发。 监测模型需要由供应商定期更新。 |
长期发展 | 时间越久费用越高。无技术积累、敏感数据积累。 | 可以实现敏感数据积累,但无法实现技术积累。 | 可以实现敏感数据积累,并通过本地化部署积累使用运维技术。
目前各厂商私有云技术架构均采用微服务架构、容器化运行,与目前软开中心系统架构集成部研发方向一致,具有一定的技术积累和技术发展参考。 |
1.1 厂商对比
就可提供相关方案的厂商的不同产品进行逐一分析、试用,对比情况如下:
百度云 | 阿里云 | 腾讯云 | 网易云 | 华为云 | |
定向站点检测 | 暂未提供。 | 支持。 | 待确认。 | 暂未提供。 | 暂未提供。
(年底推出) |
内容安全公有云API服务 | 支持。 | 支持。 | 支持。 | 支持。 | 支持。 |
完整信息下载地址:https://t.zsxq.com/u37UzbQ