IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 基于K-means车物未决案件聚类结果展示 -> 正文阅读

[人工智能]基于K-means车物未决案件聚类结果展示

前言

未决案件属于没有结案,一直滞留的案件,也没有历史标记,所以属于无监督类数据,适用于K-means算法,将数据分门别类,以让同类别的样本之间差异尽可能小,不同类别间的差异尽可能的大,然后将每个类别特征可视化,从特征出发,提供清理新思路。


一、算法实现过程简单说明

数据量:5018

average silhouette_score:0.52

聚类类别数:5

由于数据中的连续变量很少,分类变量较多,经过相关性验证结合经验,选取了4个连续型变量用于建模,尝试不同的分类变量组合测试,遍历2到5个类别下的聚类效果,并提取每个类别的特征进行验证,得到一个较为理想的聚类,这个过程结合代码可以完整说一篇了,就不详细描述了。

二、部分数据展示

三、类别可视化

1.总体展示

说明:散点图的大小表示数据量

类别0数据量较大,周期及金额较低;类别4周期及金额都较高,且4个类别主要表现在险种为商业险,责任为全责,这和原始数据这两个特征数据量占比较大有一定关系。

2.车型及环节展示

车型方面:类别1主要是以企业客车,类别2为营业货车,其余类别集中在家庭自用车

环节方面:主要集中在单证、定核损、结案、其他四个环节

3.其余特征展示

?以上对5个类别都进行了可视化对比,可以比较清晰的看出每个类别的特征差异

例如针对类别2:车型为营业货车、滞留周期195天、估损金额17721元、以小额及公司车占比为主、案件集中在本地及省内环节、险种为商业险、滞留环节为定核损、责任以全责为主,结合先验经验判断是否是配件价格、物损价格争议等原因导致。

总结

1.聚类算法偏向于众,异常检测算法偏向于少,所以两者结果会有差异,但可以结合两者结果对数据进行细分,找出原因,对症下药。

2.针对K-means算法,类别数也不是越多越好,类别太多,大量信息会被碎片化,特征会被分散,聚类效果就会不明显,尽量用较少的类别,达到较好的区分。

3.针对分类变量选取,不是越多越好,特征较多会导致聚类效果不好,根据研究情况选取适合的变量很重要

4.可以结合自身经验将一些变量数据通过数据库人员导入,可以更好的对数据进行分析、建模。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-07-04 22:54:12  更:2022-07-04 22:56:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 1:28:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码