IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【Kaggle】欺诈检测 IEEE-CIS Fraud Detection(更新ing) -> 正文阅读

[人工智能]【Kaggle】欺诈检测 IEEE-CIS Fraud Detection(更新ing)

一、题目背景

kaggle赛题:https://www.kaggle.com/c/ieee-fraud-detection/discussion/101203
从客户的交易行为中,找到欺诈的行为,典型的二分类任务。数据集中坏客户有20000+,好坏样本比例为29:1,数据集有一张副表,表的字段解释:

交易表(transaction表):

TransactionID:主键
TransactionDT:来自给定参考日期时间的timedelta(不是实际时间戳)
TransactionAMT:以美元计算的交易付款金额
ProductCD:产品代码,每笔交易的产品类型
card1 ~ card6:支付卡信息,如卡类型,卡类别,发行银行,国家/地区等。
addr1~add2:支付卡的地址
dist~dist2:距离
P_emaildomain 和 R_emaildomain:购买者和收件人电子邮件域
C1-C14:计数,例如发现与支付卡相关联的地址数等,实际含义被掩盖。
D1-D15:timedelta,时间间隔,例如当前交易和上次交易之间的间隔天数等。
M1-M9:匹配,例如卡片上的姓名和地址等。
Vxxx:Vesta设计了丰富的特征,包括排名,计数和其他实体关系。
类别特征:
ProductCD
card1 - card6
addr1,addr2
P emaildomain R emaildomain
M1 - M9

身份表(identity)表:

TransactionID:主键
该表中的变量是与交易相关的身份信息 - 网络连接信息(IP,ISP,代理等)和数字签名(UA /浏览器/操作系统/版本等)。
它们由Vesta的欺诈保护系统和数字安全合作伙伴收集。
(字段名称被屏蔽,并且不会提供成对字典用于隐私保护和合同协议)

DeviceType 用户使用的设备类型
DeviceInfo  用户使用的设备信息
id 1 ~ id 38  网络连接、数字签名等相关特征
类别特征:
DeviceType 
DeviceInfo  
id 12 ~ id 38 

对于kaggle这样的数据科学比赛一般的流程:
在这里插入图片描述

二、反欺诈模型思路

在这里插入图片描述

  • 目标列Class呈现较大的样本不平衡,会对模型学习造成困扰。样本不平衡常用的解决方法有过采样和欠采样,我们此处处理样本不平衡,可以用过采样,具体操作使用SMOTE(Synthetic Minority Oversampling Technique)。
  • 更新ing。。。。。。

Reference

[1] https://www.cnblogs.com/tan2810/p/10594752.html
[2] kaggle支付反欺诈:IEEE-CIS Fraud Detection第一名方案复现过程

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-10 22:31:02  更:2022-03-10 22:33:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 16:36:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码