现阶段,如果有童鞋问我哪个反欺诈内容是技术最高,并且在现有的很多行业中运用最广泛的,可以告诉大家知识图谱、关系网络相关的技术肯定是是最重要的模块的内容之一。 2020年至今在我们接触的所有的项目中,知识图谱也是让我们团队耗时时间最多的一个项目,一直想要抽空总结下知识图谱的相关内容,特别是在金融领域的应用现状,今天就给大家介绍这个内容! 大家都知道,目前图谱不同的叫法也有不同,是不同机构对这项技术的称呼五花八门——关联网络、关系图谱、复杂网络、知识图谱。严格来讲它们彼此之间紧密相连又有所区别,今天我们不打算去区别以上这些名词不同。这里我们统一用图谱,这个名称来泛指这项技术——节点-关系网络,如边分类而言,相关的数据信息可以分为以下类型: 知识图谱在金融领域的应用现状,又可以概括为以下内容: 金融风控技术演进路线是规则-模型-图谱,对应的技术分别是数据分析、机器学习、知识图谱,所需要和处理的数据维度可以抽象成从点到线再到面。 从理论角度而言,图谱识别欺诈团伙优势万千,比如数据间的天然关联、图谱强大的路径分析功能、各式社区发现算法、风险传播算法等等。知识图谱在风控领域的最典型应用场景是利用图谱识别欺诈团伙。本文我们将从一个实操案例开始为大家剖析这个内容。
关系网络—实操案例 我们从历史库的信息中获取到用户进件时候的设备指纹数据,根据数据清洗得到用户的在不同时间区隔中的地理位置信息。以下分不同的步骤来具体展开讲解: 第一步:根据地理位置,确认异常用户: 如上图中,第4、第5列是经纬度信息,第8列是设备指纹ID,第9列是最重要的一列数据,字面解析是:1分钟内100米内的申请用户数量。 如果做过欺诈的同学就非常清楚,我们做这个变量的目的就是想要获取单位网格内,不同用户的申请数,这是判断团伙欺诈的一个重要指标。
第二步:根据设备、applist、短信等内容,确认异常详情: 根据上述的设备指纹gadi,我们进一步获取属于这一设备指纹的用户情况,将所有以上情况的设备数据的用户统一染色,进一步我们又得到以下的数据特征: 第三步:根据设备,定位等信息,确认关联用户,查看逾期,确认规则 根据上一步的获取的目标的设备id,这一步我们做最重要的分析,将数据与逾期指标做分析得到以下的分析情况: 在做数据分析中,我们可以看到,与团伙集中度过多的设备数据中,其相关的逾期的数据(最后一列),其数值也非常高。证明多用户共用同设备具有较高逾期表现,我们可以大胆对这一风险行为判断定位为高风险。
第四步:关系网络分析,染色——对黑商户持续染色 这一步,也是最重要的步骤,对这一确定为高风险用户持续染色: 关于关系网络染色的过程,我们在这一次的关系网络实操专题课中更会重点介绍。本次专题内容,不仅仅是关系网络理论知识的讲解,我们还将从理论+实操案例的角度,为各位童鞋深度剖析关系网络实操落地。 为此我们用到OrientDB为大家进行实操演示,并且此次通过云端数据库即可实操这一内容,省去了本地安装部署的繁琐步骤:
详细内容敬请关注: 另外:本文所提及的相关数据案例,各位童鞋也可到番茄风控大数据下载相关excel学习跟了解: ~原创文章 … end
|