开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 预测facebook签到位置 -> 正文阅读

[人工智能]预测facebook签到位置

1 项?描述

在这里插入图片描述
本次?赛的?的是预测?个?将要签到的地?。为了本次?赛，Facebook创建了?个虚拟世界，其中包括10公?*10 公?共100平?公?的约10万个地?。对于给定的坐标集，您的任务将根据?户的位置，准确性和时间戳等预测?户下 ?次的签到位置。数据被制作成类似于来?移动设备的位置数据。请注意：您只能使?提供的数据进?预测。

2 数据集介绍

在这里插入图片描述

?件说明 train.csv, test.csv
 row id：签?事件的id 
 x y：坐标 
 accuracy: 准确度，定位精度
  time: 时间戳 
  place_id: 签到的位置，这也是你需要预测的内容

3 步骤分析

在这里插入图片描述

import pandas as pd
#数据基本处理（训练集和测试集）
from sklearn.model_selection import train_test_split,GridSearchCV
#特征工程和特征预处理
from sklearn.preprocessing import StandardScaler
#机器学习
from sklearn.neighbors import KNeighborsClassifier

3.1 读取数据

data=pd.read_csv("./data/train.csv") 
data.head(5)

在这里插入图片描述

data.shape

3.2 基本数据处理

3.2.1 缩小数据范围

partial_data=data.query("x>2.0 & x<2.5 & y>2.0 &y<2.5")
partial_data.head()

在这里插入图片描述

partial_data.shape # 明显和原数据相比少了很多数据

在这里插入图片描述

3.2.2 选择时间特征

partial_data["time"].head()

在这里插入图片描述

time=pd.to_datetime(partial_data["time"],unit="s")
time.head()
#脱敏   数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形，实现敏感隐私数据的可靠保护

在这里插入图片描述

partial_data["hour"]=time.hour
partial_data["day"]=time.day
partial_data["weekday"]=time.weekday

在这里插入图片描述

3.2.3 去掉签到数较少的地方

place_count=partial_data.groupby("place_id").count()   # 聚合

在这里插入图片描述

place_count=place_count[place_count["row_id"]>3]
place_count.head()

在这里插入图片描述

# 获取row_id>3的数据
partial_data=partial_data[partial_data["place_id"].isin(place_count.index)]

在这里插入图片描述

3.2.4 确定特征值和目标值

x=partial_data[["x","y","accuracy","hour","day","weekday"]]
y=partial_data["place_id"]

在这里插入图片描述

3.2.5 分割数据集

x_train,x_test,y_train,y_test=train_test_split(x,y,random_state=2,test_size=0.25)

在这里插入图片描述

3.3 特征工程—特征预处理

#实例化
transfer=StandardScaler()
x_train=transfer.fit_transform(x_train)
x_test=transfer.fit_transform(x_test)

3.4 机器学习

3.4.1 实例化一个训练模型

estimator=KNeighborsClassifier()

3.4.2 交叉验证网格搜索实现

param_grid={"n_neighbors":[3,5,7,9]}
estimator=GridSearchCV(estimator=estimator,param_grid=param_grid,cv=10,n_jobs=4)

3.4.3 模型训练

estimator.fit(x_train,y_train)

在这里插入图片描述

3.5 模型评估

3.5.1 准确率输出

score_ret=estimator.score(x_test,y_test)
print("模型准确率为：\n",score_ret)

在这里插入图片描述

3.5.2 预测结果

y_pridict=estimator.predict(x_test)
print("预测值：\n",y_pridict)

在这里插入图片描述

3.5.3 其他结果输出

print("最好的模型是\n",estimator.best_estimator_)
print("最好的结果是\n",estimator.best_score_)
print("所有的结果\n",estimator.cv_results_)

最好的模型是
 KNeighborsClassifier()
最好的结果是
 0.36103403905372417
所有的结果
 {'mean_fit_time': array([0.23680475, 0.24250968, 0.27274141, 0.28223894]), 'std_fit_time': array([0.04789135, 0.05988373, 0.05860585, 0.04193857]), 'mean_score_time': array([0.54308534, 0.54496615, 0.72975917, 0.7652776 ]), 'std_score_time': array([0.02659151, 0.07117335, 0.08149376, 0.08075544]), 'param_n_neighbors': masked_array(data=[3, 5, 7, 9],
             mask=[False, False, False, False],
       fill_value='?',
            dtype=object), 'params': [{'n_neighbors': 3}, {'n_neighbors': 5}, {'n_neighbors': 7}, {'n_neighbors': 9}], 'split0_test_score': array([0.34725698, 0.36438884, 0.36612127, 0.3599615 ]), 'split1_test_score': array([0.34687199, 0.35938402, 0.35919153, 0.35688162]), 'split2_test_score': array([0.35052936, 0.35899904, 0.3574591 , 0.35784408]), 'split3_test_score': array([0.34898941, 0.36458133, 0.36246391, 0.35899904]), 'split4_test_score': array([0.35264678, 0.36381136, 0.36458133, 0.35803657]), 'split5_test_score': array([0.34513956, 0.3572666 , 0.35688162, 0.35514918]), 'split6_test_score': array([0.35437921, 0.36477382, 0.36554379, 0.36997113]), 'split7_test_score': array([0.35264678, 0.35880654, 0.3626564 , 0.36323388]), 'split8_test_score': array([0.34501348, 0.35618021, 0.35463997, 0.35309973]), 'split9_test_score': array([0.35021178, 0.36214863, 0.3567578 , 0.35309973]), 'mean_test_score': array([0.34936853, 0.36103404, 0.36062967, 0.35862765]), 'std_test_score': array([0.00310395, 0.00310417, 0.00392977, 0.00478577]), 'rank_test_score': array([4, 1, 2, 3])}

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-03-15 22:31:54 更:2022-03-15 22:35:59

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/24 2:47:35-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码