| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> 自动特征构建工具——featuretools -> 正文阅读 |
|
|
[人工智能]自动特征构建工具——featuretools |
简介featuretools是一个可以实现单表的转换操作和多表的跨表连接操作的框架。它擅长于将时间和关系数据集转换为机器学习的特征矩阵。 多表操作定义实体集实体(entity,多个实体则称为实体集entityset)。实体就是一张表或者一个dataframe,多张表的集合就叫实体集。
定义一个包含数据集中所有 DataFrame 的字典,同时指定DataFrame中的索引列和时间列,DataFrame中的索引列的数据类型要一致,且数据唯一不重复。
定义的字典中的DataFrame通常为父子关系。
index用于指定主键;time_index用于指定时间特征,便于featuretools自动统计各种滑窗统计的特征等;dataframe即传入的表数据;entity_id是为这个表数据进行命名;logical_types指定product_id为分类类型数据,区分连续特征和类别特征,可以不填。
也可以在对象上使用设置器来添加数据帧EntitySet。
定义表关系:指定父子关系
以下代码指定了两张表之间的共同的关联键substrateid。
特征基元特征基元(Feature Primitives)分为聚合和转换两类,相当于构造新特征的方法。
DFS(Deep Feature Synthesis)深度特征合成深度特征合成:根据实体集里的实体和特征基元创造新特征。 DFS 的输出是一个特征矩阵和相应的特征定义列表。 举例:定义 加减乘除 转换基元
另一种输入:DFS 的最小输入是 DataFrame 的字典(dataframes)、关系列表(relationships)以及我们要计算其特征的目标 DataFrame 的名称(target_dataframe_name)。
注:时间索引在截取时间后面的行将自动忽略。
单表操作
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年12日历 | -2025/12/26 8:27:58- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |