IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 预测facebook签到位置 -> 正文阅读

[人工智能]预测facebook签到位置

1 项?描述

在这里插入图片描述
本次?赛的?的是预测?个?将要签到的地?。 为了本次?赛,Facebook创建了?个虚拟世界,其中包括10公?*10 公?共100平?公?的约10万个地?。 对于给定的坐标集,您的任务将根据?户的位置,准确性和时间戳等预测?户下 ?次的签到位置。 数据被制作成类似于来?移动设备的位置数据。 请注意:您只能使?提供的数据进?预测。

2 数据集介绍

在这里插入图片描述

?件说明 train.csv, test.csv
 row id:签?事件的id 
 x y:坐标 
 accuracy: 准确度,定位精度
  time: 时间戳 
  place_id: 签到的位置,这也是你需要预测的内容

3 步骤分析

在这里插入图片描述

import pandas as pd
#数据基本处理(训练集和测试集)
from sklearn.model_selection import train_test_split,GridSearchCV
#特征工程和特征预处理
from sklearn.preprocessing import StandardScaler
#机器学习
from sklearn.neighbors import KNeighborsClassifier

3.1 读取数据

data=pd.read_csv("./data/train.csv") 
data.head(5)

在这里插入图片描述

data.shape

3.2 基本数据处理

3.2.1 缩小数据范围

partial_data=data.query("x>2.0 & x<2.5 & y>2.0 &y<2.5")
partial_data.head()

在这里插入图片描述

partial_data.shape # 明显和原数据相比少了很多数据

在这里插入图片描述

3.2.2 选择时间特征

partial_data["time"].head()

在这里插入图片描述

time=pd.to_datetime(partial_data["time"],unit="s")
time.head()
#脱敏   数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护

在这里插入图片描述
在这里插入图片描述

partial_data["hour"]=time.hour
partial_data["day"]=time.day
partial_data["weekday"]=time.weekday

在这里插入图片描述

3.2.3 去掉签到数较少的地方

place_count=partial_data.groupby("place_id").count()   # 聚合

在这里插入图片描述

place_count=place_count[place_count["row_id"]>3]
place_count.head()

在这里插入图片描述

# 获取row_id>3的数据
partial_data=partial_data[partial_data["place_id"].isin(place_count.index)]

在这里插入图片描述

3.2.4 确定特征值和目标值

x=partial_data[["x","y","accuracy","hour","day","weekday"]]
y=partial_data["place_id"]

在这里插入图片描述

3.2.5 分割数据集

x_train,x_test,y_train,y_test=train_test_split(x,y,random_state=2,test_size=0.25)

在这里插入图片描述

3.3 特征工程—特征预处理

#实例化
transfer=StandardScaler()
x_train=transfer.fit_transform(x_train)
x_test=transfer.fit_transform(x_test)

3.4 机器学习

3.4.1 实例化一个训练模型

estimator=KNeighborsClassifier()

3.4.2 交叉验证网格搜索实现

param_grid={"n_neighbors":[3,5,7,9]}
estimator=GridSearchCV(estimator=estimator,param_grid=param_grid,cv=10,n_jobs=4)

3.4.3 模型训练

estimator.fit(x_train,y_train)

在这里插入图片描述

3.5 模型评估

3.5.1 准确率输出

score_ret=estimator.score(x_test,y_test)
print("模型准确率为:\n",score_ret)

在这里插入图片描述

3.5.2 预测结果

y_pridict=estimator.predict(x_test)
print("预测值:\n",y_pridict)

在这里插入图片描述

3.5.3 其他结果输出

print("最好的模型是\n",estimator.best_estimator_)
print("最好的结果是\n",estimator.best_score_)
print("所有的结果\n",estimator.cv_results_)
最好的模型是
 KNeighborsClassifier()
最好的结果是
 0.36103403905372417
所有的结果
 {'mean_fit_time': array([0.23680475, 0.24250968, 0.27274141, 0.28223894]), 'std_fit_time': array([0.04789135, 0.05988373, 0.05860585, 0.04193857]), 'mean_score_time': array([0.54308534, 0.54496615, 0.72975917, 0.7652776 ]), 'std_score_time': array([0.02659151, 0.07117335, 0.08149376, 0.08075544]), 'param_n_neighbors': masked_array(data=[3, 5, 7, 9],
             mask=[False, False, False, False],
       fill_value='?',
            dtype=object), 'params': [{'n_neighbors': 3}, {'n_neighbors': 5}, {'n_neighbors': 7}, {'n_neighbors': 9}], 'split0_test_score': array([0.34725698, 0.36438884, 0.36612127, 0.3599615 ]), 'split1_test_score': array([0.34687199, 0.35938402, 0.35919153, 0.35688162]), 'split2_test_score': array([0.35052936, 0.35899904, 0.3574591 , 0.35784408]), 'split3_test_score': array([0.34898941, 0.36458133, 0.36246391, 0.35899904]), 'split4_test_score': array([0.35264678, 0.36381136, 0.36458133, 0.35803657]), 'split5_test_score': array([0.34513956, 0.3572666 , 0.35688162, 0.35514918]), 'split6_test_score': array([0.35437921, 0.36477382, 0.36554379, 0.36997113]), 'split7_test_score': array([0.35264678, 0.35880654, 0.3626564 , 0.36323388]), 'split8_test_score': array([0.34501348, 0.35618021, 0.35463997, 0.35309973]), 'split9_test_score': array([0.35021178, 0.36214863, 0.3567578 , 0.35309973]), 'mean_test_score': array([0.34936853, 0.36103404, 0.36062967, 0.35862765]), 'std_test_score': array([0.00310395, 0.00310417, 0.00392977, 0.00478577]), 'rank_test_score': array([4, 1, 2, 3])}
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-15 22:31:54  更:2022-03-15 22:35:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 15:27:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码