IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数据挖掘与机器学习——数据挖掘概述 -> 正文阅读

[人工智能]数据挖掘与机器学习——数据挖掘概述

挖掘是从大量的、不完全的、有噪声的、模糊的、随机的应用数据中,提取潜在且有用的信息的过程。
分析分析处理(On-Line Analytical Processing ,OLAP)

数据分析过程
确定知识发现的目标:确定知识发现的目的。
数据采集:数据采集可以是从网络爬取的数据,也可以是从数据库中直接导出的数据,还可以是常见的CSV文件等数据。数据质量决定挖掘的上限,而算法仅仅是逼近这个上限。
数据探索:可视画(画各种散点图);相关性。
数据预处理:数据处理主要包括数据清理、数据集成、数据规约、数据变换和离散化等几个部分。数据归约——维归约的含义是将原先高维的数据合理地压缩成低维数据,从而减少数据量常用的方法为特征的提取,如线性判别分析(LDA)和主成分分析(Principal Component Analysis,PCA)。LDA是基于有监督的降维,PCA是基于方差的聚类降维,都可以对高维数据进行降维。数据归约技术采用维归约和数据量归约等方式。数据的变换是将原始的特征数据进行归一化和标准化的操作。
数据挖掘(模型选择)算法
视频,骨膜,视频故事对数据挖掘结果的评价,常用的评价指标有精度、召回率等。
数据挖掘的功能与应用领域
电信行业:推荐系统
金融行业:信用卡勘测
医疗行业
社会网络:人的变迁情况

数据挖掘应用面临的问题
数据源的多样性
数据挖掘算法的改进:部分算法就需要基于分布式计算和云计算进行改进。
数据隐私保护:个人隐私被暴露
?
数据挖掘的模型
数据挖掘任务可以分为描述和预测两大类。描述性挖掘任务描述数据中数据的一般性质;预测性挖掘任务对当前数据进行推断,以做出预测。数据挖掘的任务主要集中在回归、分类、预测、关联、聚类、异常检测六个方面。

回归
回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
按照回归分类中自变量的数量,可将回归分析分成一元回归和多元回归分析。
如果回归分析只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,则这种回归分析被称为一元线性回归分析。
常见的回归算法包括线性回归、逻辑回归(逻辑回归实际上做的是分类的任务)、多项式回归、逐步回归、岭回归、Lasso回归、ElasticNet回归。

分类
回归可用于预测连续的目标变量,分类可用于预测离散的目标变量。
常见的分类算法包括逻辑回归、决策树、神经网络、贝叶斯、K近邻算法、支持向量机(SCM)等。

预测
预测算法可分为定性预测和定量预测。
定量预测相对准确,因果关系分析法有回归方法、计量经济模型、神经网络预测法、灰色预测法、马尔科夫预测法等。

聚类
前提:没有先验知识
原则:较高的类内相似度和较低的类间相似度。
K-Means、层次聚类、神经网络聚类、DBSCAN聚类等。

异常检测
离群点检测的算法大致可分为以下几类:包括基于统计学或模型的方法、基于距离或邻近度的方法、基于偏差的方法、基于密度的方法和基于聚类的方法。

数据挖掘的数据类型
非结构化数据往往要经过数据预处理等环节转换成结构化数据。
数据库
联机事务处理(OLTP)数据库增、删、改、查、读、写,对象一般数据库管理员。
数据仓库
ET L:从外部数据抽取、转换、装载到DW中。

其他数据类型
数据流、空间数据、工厂设计数据、超文本和多媒体数据、图和网状数据和万维网。
数据挖掘不需要机器自动学习,机器学习需要机器自动学习。
数据挖掘的交叉学科
统计分析包括最大值、最小值、平均值、方差、四分位、个数、概率分配等。
数据库与数据仓库
ETL(提取-转换-加载)
?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-21 00:29:07  更:2022-09-21 00:30:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/28 18:36:56-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计