阿里安全AI识别语义分析技术再获突破 可快速拦截色情黑话
近日,阿里安全宣布,面对“多人运动”“王者五排”等不断变异升级的黑话暗语,阿里AI鉴黄技术能力升级,可精准快速地进行识别拦截。这对人工智能技术的发展具有非常重要的意义,让AI引入知识后并不对原始语义产生曲解,正是训练智能AI模型需要重点解决的难题。
涉黄黑话变异升级难识别
在内容安全场景下,黑灰产通常会利用黑话来绕开检测引擎,比如会出现这种语句“小哥哥,要不要来我们这里多人运动啊?”“大号玻璃过滤彩珠大水瓶玻璃水壶全套配件到手即用”。
“这对人工智能技术带来了非常大的挑战。”阿里安全高级算法专家开阳表示,目前谷歌发布的BERT自然语言处理模型已经在文本理解领域取得了突破性进展,但在识别上述黑话时仍难以发挥作用,尚不能撕掉黑话的“伪装”,辨别其指代“色情、毒品”的本来含义。
对此,开阳解释,技术和预训练语言模型有一定局限性,经过大量公开语料进行学习训练后,模型能理解字、词、句之间的语义关系,比如判断“足球”跟“多人运动”属于同类话题;“水壶”“器皿”和“烧水”属于同类话题。
“‘多人运动’等黑话通常背后由某个特定事件造成,这些事件比较随机,也无规律可循。”开阳介绍称,这样的语料难以积累,加上占比极低,建立预训练模型变得不太容易。
AI技术升级可理解文字语义
那么,鉴黄机器人能否接收到“多人运动”黑话背后的事件信息,从而给出更精准的判断?
开阳称,阿里新一代安全架构核心AI技术可以做到这一点。他介绍,如果过去的鉴黄AI只停留在识别直观的“图片、字符串、语音”这些表层信息上,升级之后的鉴黄AI则可以理解字符串背后的深意。如果看到“小哥哥,要不要来我们这里多人运动啊?”这样的语句,AI经智能分析后可识别出这是一条色情信息。
“升级后的AI鉴黄师增加了基于知识图谱的识别黑话的能力,将人工经验知识引入,让机器智能与人工经验更好地结合,大大提升了文本理解与语义识别的能力。”开阳介绍,这也是技术升级后的最大亮点,只需要把新的黑话知识添加到知识图谱中就可生效,发现舆情事件导致的变异时间可能在小时级,但识别只需几十毫秒。
简单而言,就是以热点事件为中心,围绕事件本身,将相关联的人物、事件、特定的词语绘成一张关联图谱。以“多人运动”为例,将出轨事件新闻作为核心,关联该事件的男女主角、事件引发的热词“多人运动”“王者五排”“群P”等。
相关阅读
最新文章
随机推荐
- 深圳5G产业联盟正式成立
- 亚美科技车智汇 给你的陪伴一直在路上
- 重要成果斩获一等奖,彰显超威科技硬实力
- 金彭官方抖音号成功捧红“女司机” 玩转抖音短视频营销
- 2017全国双创周深圳活动暨第三届深圳国际创客周启幕
- 美国国防部资助研究将使用3D打印来帮助再生军事人员受损的骨骼
- Puzzle of life:守住的不只是玩具的安全,更是孩子的未来
- 送货无人机被指如F1赛车那样聒噪:市民请愿希望其停飞
- 苹果今年春可能会带来多款新 iPad,包括许久未更新的 iPad mini
- 俄罗斯科学家利用单激光技术在金属上打印彩色图像
- 分享一下亿健ELF手动调节坡度的经验
- 中建科工新技术新产品亮相第十六届国际“绿博会”
- 小米在印度发布one more thing 4.9毫米的小米电视4再度惊艳
- 圆刚CAM100T直播套装 “视频种草+直播电商”,助力品牌全链路视频营销
- 街电科技全国数据迎来增长迅猛,多场景恢复至去年最好水平
- 成功绝非偶然 超威电池成功的背后
- [12P]联想ThinkPlus“口红电源”简单上手
- 英国学校警告父母《堡垒之夜》会对孩子产生“腐蚀性影响”
- 毫不创新的「家教机」,竟然给硬件行业上了一课?
- 赵丽颖冯绍峰结婚 30亿曝光竟然被荣耀10GT收割了
最新评论
更多评论