时间:2022-11-11 17:11:58来源:法律常识
维护账户安全的手段主要有网络层防护、数据层防护以及业务层防护。 相应的手段不局限于WAF、设备指纹、验证码、生物探针、数字证书、安全SDK。 这些防护手段从技术原理上可以总结为加密/解密、人机识别两大类。
黑产手段:群控设备、养卡平台、养号平台、打码平台算法选择:K-means、高斯混合(GMM);OPTICS、DBSCAN应用方法:如果两个注册用户时的ip地址段相同、则两个用户的之间的边权重增加1,如果邮箱后缀也相同,则权重就为2,以此类推,我们就可以把某段时间内子互联网平台上注册的账号关联成一张权重无向图。再使用图嵌入(embedding)表征的方法得到每个账号节点高维向量,然后将这些高维向量联合基础特征进行聚类。可以识别有聚集性的注册垃圾账号的团体。电商平台最核心的业务就是交易,而交易又衍生出其他业务。商家为了达到提升排名、引流、商品冷启动、增加商品评论数等目的,会通过多种渠道来做虚假交易。典型的虚假交易是指通过虚构交易流程、伪造物流、资金流信息等手段,提到DSR(Detail Seller Rateing,即商铺信用、商品销量和店铺动态评分)分数,实现提升店铺和商品排名的目的。
恶意下单 拍下商品但不付款,旨在侵占库存,一般的对策是在高峰时段下单使用验证码,下单后一段时间不付款订单自动失效,限制下单频率,有风控数据源可以对恶意账单进行标记、冻结下单。黄牛抢单 黄牛一般事前批量注册小号、抢购前准备好抢单机器人程序。对于恶意养号,风控系统一般会根据小号、僵尸号的行为与正常账户的区别标注、登录的途径、登录地域、登录设备指纹、收货地址来分类标记刷优惠券和奖励 首先要在账号层面根据大数据标记账号恶意灰度,其次优惠券跟账号绑定,无法流通和交易。跟网游中的经济体系数值类似,建立阶梯模型,给优质账户高额回馈,给低信誉账号小额优惠。反价格爬虫 价格爬虫主要是竞争对手比价。爬虫所在的IP段,访问的申请头,以及是否会解析JavaScript,浏览器行为等特征可以作为人机识别模型的有用特征。交易风控账户安全客户端安全(反钓鱼、反木马)认证机制(证书、令牌、多因素认证)风险评估(账号历史行为、账户历史征信、交易和用户异常、模型和策略)刷单主体:商家、刷手、刷单中介和上下游利益团体(泛指卡商、账号批发商、物流)。
刷单流程:商家发布刷单需求。刷手接任务、浏览、下单、付款、发货、收货、评论。商家和刷手按协议返回佣金刷单危害:虚假交易产生的商誉、信用、评论会严重误导消费者、影响购物决策。刷单会验证干扰算法所需数据的准确性,并且刷单短期的ROI高于广告、因此广告主会减少广告投入而转向刷单、导致平台收入减少。刷单识别角度:交易的行为主体:主体包括商家和用户,可以从商家和用户的账号中提取业务特征。交易的行为流程:我们可以在每个交易的环节提取虚假交易的特定模式,如注册和登陆的渠道占比、商品浏览时长与分布、购物车操作的模式等。交易的第三方依赖:主要有支付和物流,支付账号的资金流转情况和物流的走件与时效性都可以从中去判断交易的真实性互联网平台对流量监控在大多数情况下,宁可放宽监管力度,也不允许有太多的错杀的情况。
算法选择:wide&deep + LSTM + Attention应用方法: 使用IP地址访问的时间序列、类目序列、URL序列以及用户访问的时间间隔,来判断用户访问网站是否正常用户。注意力机制:为了防止序列时间过长使模型的注意力被分散,并且让模型更多的关注URL等序列的跳转信息,增加了注意力机制增加序列数据的长度:意识尝试不同的序列长度,二是尝试不同的数据截取方式。增加更多的序列数据:通过对URL中多级类目进行分类处理,增加了类目之间的转移序列和refer的转移序列等信息。从作案规模上,信贷欺诈一般可分为个人欺诈和团队欺诈。从风险归因上,可分为以下类别:
A. 白户风险:借款人信息缺失,没有足够的数据来对借款人进行风险评估。包括内部白户(新注册用户、无申贷历史记录)和外部白户(央行征信、第三方民间征信无覆盖)。由于从未或较少有申贷记录,因此黑名单规则、多头规则等都会失效。在对待白户时,应当谨慎其被黑产利用的可能。
B. 黑户风险:借款人存在逾期、失信、欺诈的记录。包括内部黑户(历史多笔订单出现逾期、在途订单催收失联等)、外部黑户(央行征信花/黑、第三方民间征信黑)。出于炫耀等心理,很多黑户会在口子论坛、QQ群等交流撸贷经验,因此可通过论坛舆情监控、黑产群卧底等来发现新的作案手法。
C. 恶意欺诈:借款人通过伪造资料,蓄意骗贷。例如,伪造账单流水记录来企图骗取更高的额度。一般都是借款老哥,熟悉各平台流程,深谙套路。恶意欺诈人群往往到处借钱,广撒网来提高放款概率。同时,可能涉及不良嗜好(黄赌毒)。
D. 身份冒用:伪冒他人身份进行欺诈骗贷。包括熟人冒用(亲戚朋友、同学等)和他人盗用(购买他人四件套、个人隐私信息泄漏等)。一般可通过信审、人脸识别、活体验证等方式来核验借款人身份。
E. 以贷养贷:通过拆东墙补西墙的方式,来维持不良消费(黄赌毒、奢侈品等)。借款人现金流收入主要靠不断借款,借下家的钱,还上家的债。这种击鼓传花的游戏,会将共债风险杠杆逐渐放大。一旦借款人再也借不到钱,资金链便会立刻断裂,所有平台全线逾期。目前市场上,同盾、百融、亿美等第三方征信机构都提供此类多头借贷产品服务。
F. 中介风险:黑中介哄骗或招揽客户实施骗贷。网贷中介有利有弊,好中介可帮助平台导流(类似贷款超市),提高市场份额;黑中介将对平台风控漏洞进行大规模攻击,造成巨大资损。黑中介可利用白户轻松突破风控防线,并骗取白户的高额手续费。黑中介通讯录一般会存客户的号码;若是远程贷款操作,可能会采取视频通话、翻拍照片来应对活体识别核身。
A. 实时大盘监控:基于订单、用户维度,监控设备聚集性风险(LBS、Wi-Fi)、地域欺诈风险(如朋克村)。大盘监控对于识别黑中介风险、传销风险等团伙欺诈相对更有效,需要设置报警阈值,并人工介入分析。
B. 信审催收反馈:信审通过电话外呼,核验客户身份,咨询借款动机,往往会发现某些欺诈用户。例如,身份伪冒风险场景中,借款人支支吾吾无法正确回答问题。催收中发现失联用户等,这些兄弟部门的案件将反馈至调研组。因此,需要建设好案件管理平台,联通各部门。
C. 论坛舆情监控:通过对各大口子论坛、戒赌吧、上岸交流区等内容,提取近期市场动向。特别是需要去理解欺诈人群的心理特征、社会身份等。例如,2018年,在714高炮行业风险初见苗头时,论坛上就出现“青铜系”、“宁波系”等借贷口子系列。
D. 黑产卧底调研:线上渠道可尝试加撸口子QQ群、网贷中介微信等方式,利用老哥们的集体智慧,以及网贷中介的丰富经验。站在对方的立场上,你更会发现自己风控系统的弱点。线下渠道可去一些欺诈案件多发地,实地调研来学习黑产的手法。实地调研的难度相对较高。
A.设备指纹 唯一标识出该设备的设备特征或者独特的设备标识;从技术方法上,可分为: 主动式设备指纹和被动式设备指纹。
主动式设备指纹: 一般采用JS代码或SDK,在客户端主动地收集与设备相关的信息和特征,包括:
浏览器特征,包括UA、版本、OS、插件的配置、Canvas特征等;设备的传感器特征,比如麦克风、加速传感器的特征等;设备OS的特征,比如是否越狱等;设备的配置,比如网络配置,系统flash的配置等;主动式设备指纹算法一般将这些信息组合起来,通过特定的hash算法得到一个设备指纹ID值,作为该设备的唯一标识符。
被动式设备指纹: 在终端设备与服务器通信的过程中,从数据报文的协议中提取出该终端设备的OS、协议栈和网络状态相关的特征集,并结合机器学习算法来标识和跟踪具体的终端设备。
B.生物探针 采集用户使用手机时的传感器数据和屏幕轨迹数据的技术; 优点: • 无需其他硬件支持 • 用户无感知 • 行为习惯不易改变 • 可以进行连续判断 缺点: • 需要一定的算法支持
C.设备行为 APP安装列表;APP行为(包括安装、卸载、打开等);通话记录、短信等
D.WiFi列表 WiFi 名称、接入时间、接入时长等
E.LBS 设备与地理空间位置映射数据; 包括IP、基站、WiFi、身份证、手机号及银行卡等多维度的地理位置信息的信息库 用户稳定性判断登录、交易等多环节多重验证
F.运营商 特点:完整、真实; 涵盖: • 在网时长 • 通话记录、短信记录 • 网站、APP访问记录 • 位置信息
G.关联数据 前提假设:人是社会关系的总和、人以类聚物以群分; 应用:人的社会关系网反映人的特征; 目的:信息核验、度量身份和关系风险、社群团伙发现
H.多头 信贷全流程数据;涵盖注册、申请、审批、放款、还款成功、还款失败、逾期等整个信贷周期;场景贴合度高
传统反欺诈的困境
只覆盖申请人自身的单点属性只覆盖了静态信息动态事件数据的处理很繁琐低效无法整合碎片化、异构数据应用案例 A.app特征挖掘:
对APP列表进行拆分,one-hot处理删除低频APPapp embeddingB.关联特征挖掘:
根据id间关联的类型(both/in/out)对边属性的处理 • 哪些月份发生关联 • 发生关联的月份数量 • 关联次数/权重的mean/std/sum • 关联次数/权重的month on month的difference一度关联“点”的属性处理 计算一度关联id的各类风险、分类、APP类型属性衍生变量“点”与“边”交叉特征 将(1)一度关系id的风险、分类、APP类型(2)关联类型进行交叉后统计衍生变量C.其他特征挖掘
将Node tag与Edge属性交叉后,统计训练集样本中一度关系Node与Edge属性的交叉数据。采用Network Embedding的方法,找到一种映射函数,该函数将网络中的每个节点转换为低维度的潜在表示。如Deep Walk、Node2Vec