创新AI安全应用虎牙持续提高直播内容审核能力 _ 经济参考网

　　虎牙直播近日对外宣布，其直播实时消音系统上线并已在其平台应用，该系统为直播场景中先审后发的“事前防控”提供全面的监管能力。

　　据介绍，目前主流的内容安全审核方法是“AI+人工审查”，这是一种“事后审查”的处理方式。而虎牙开发的这套系统是一种先审后发的技术，基于虎牙自研的音频算法以及多媒体加工平台leaf，可以在不增加直播延时的条件下，对直播过程中的违规音频进行实时消音，有效降低甚至完全阻断风险内容的传播，实现实时屏蔽、先审后发。“针对AI能力在内容风控上的场景应用，我们优先选择在人工审核难度高、效率慢的直播音频场景上应用，下一步，我们将在直播视频场景中做出尝试。”虎牙风控团队负责人表示。

　　为在直播场景内做到无延时，虎牙多巴胺AI技术团队对语音识别模型以及解码模块进行优化，对每个语音片段的解码能够达到稳定一致的识别时间。“因为音频片段解码时间的大幅波动，会导致违规音频漏出。在普通的2.1G主频CPU上，我们的实时率达到0.08，相当于1秒音频只需要80毫秒就能识别出来。”虎牙AI消音技术负责人表示。

　　直播场景的复杂性比一般的语音识别场景大，而复杂场景的识别准确率一直是业界难点。“虎牙多巴胺团队开发了基于直播场景的VAD算法、语音识别算法、后处理算法，同时收集了大量复杂场景的样本，进行算法迭代优化，使我们在直播这种复杂场景下，也有较高的识别准确率以及召回率。另一方面，AI模型的优化仍然依赖样本校准工作。”上述负责人表示。

　　国家互联网信息办公室部署开展2022年“清朗”系列专项行动时指出，此次行动重点针对网络直播、信息内容乱象、网络谣言、未成年网络环境等十个方面。对每一家互联网内容平台来说，确保平台内容的合法性和规范性，健全平台内容审核机制成为必须重视的问题。

　　虎牙直播内容风控负责人表示，平台一直深入推进内容安全保障工作，采用“AI智能识别、人工审核和网络志愿者”三位一体模式。实时消音系统是平台AI安全应用的一次扩容，未来将打造全方位安全攻防和更精准的内容审核体系，为健康的网络直播内容生态建设提供参考样本和前沿解决方案。