凯发app官网-ag凯发旗舰厅

中文站

凯发app官网-ag凯发旗舰厅
内容安全

ai内容检测

文本检测~~hot~~

图片检测

音频检测~~hot~~

视频检测

ai内容分析

安全审核

人工审核服务

智能审核平台~~new~~

安全专家服务

安全舆情服务~~hot~~

安全培训服务~~new~~

安全蓝军服务

安全顾问服务

业务安全

智能风控

风控引擎~~hot~~

设备指纹

身份校验

行为式验证码~~hot~~

号码认证

实名核验

生物核验

应用安全

合规检测

隐私合规检测

app安全检测

安全加固

android应用加固~~hot~~

ios应用加固

h5应用加固

sdk加固

安全组件
内容安全场景ag凯发旗舰厅的解决方案

aigc内容风控~~hot~~

品牌内容风控

出海内容合规

广告法合规检测

历史数据回归~~new~~

头像人脸分析

未成年人保护~~hot~~

举报审核~~new~~

业务安全场景ag凯发旗舰厅的解决方案

手游智能反外挂

端游智能反外挂

小游戏智能反外挂

人脸实名核验~~new~~

作弊监控~~hot~~

注册保护

登录保护

引流欺诈账号识别~~new~~

应用安全场景ag凯发旗舰厅的解决方案

个人信息合规测评

移动应用安全管理

行业ag凯发旗舰厅的解决方案

媒体行业

数字阅读

教育行业

政企行业

金融行业~~hot~~
内容安全

图片检测

文本检测

视频检测

音频检测

业务安全

验证码体验

人脸识别体验
内容安全

机器检测服务~~hot~~

智能审核平台~~new~~

人工审核服务

安全培训服务~~new~~

业务安全

行为式验证码~~hot~~

号码认证~~new~~

风控引擎~~new~~

设备指纹~~new~~

实名核验

生物核验

反作弊

反外挂

应用安全

应用加固~~hot~~

隐私合规检测~~new~~
渠道合作
动态资讯易盾简介发展历程资质荣誉联系凯发app官网易盾学院

利用 dfa 算法实现文字过滤-凯发app官网

【安全知识】2021-08-20

分享到

一、dfa 算法简介

在实现文字过滤的算法中，dfa是唯一比较好的实现算法。

dfa 全称为：deterministic finite automaton，即确定有穷自动机。其特征为：有一个有限状态集合和一些从一个状态通向另一个状态的边，每条边上标记有一个符号，其中一个状态是初态，某些状态是终态。但不同于不确定的有限自动机，dfa 中不会有从同一状态出发的两条边标志有相同的符号。

简单点说就是，它是是通过 event 和当前的 state 得到下一个 state，即 event state= nextstate。理解为系统中有多个节点，通过传递进入的 event，来确定走哪个路由至另一个节点，而节点是有限的。

二、dfa 算法实践敏感词过滤

1. 敏感词库构造

以王八蛋和王八羔子两个敏感词来进行描述，首先构建敏感词库，该词库名称为sensitivemap，这两个词的二叉树构造为：

用 hash 表构造为：

怎么用代码实现这种数据结构呢？

2. 敏感词过滤

以上面例子构造出来的 sensitivemap 为敏感词库进行示意，假设这里输入的关键字为：王八不好，流程图如下：

怎么用代码实现这个流程图逻辑呢？

三、优化思路

对于“王*八&&蛋”这样的词，中间填充了无意义的字符来混淆，在我们做敏感词搜索时，同样应该做一个无意义词的过滤，当循环到这类无意义的字符时进行跳过，避免干扰。

来源：博客园作者：jmcui

原文链接：https://www.cnblogs.com/jmcui/p/11925777.html

【声明】文章来源于网上采集整理，凯发app官网的版权归原作者所有，如有侵权，请邮件反馈yidunmarket@126.com，我们将尽快核实修改。

分享到

热门标签

热门文章