IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> pymongo-增删改查 -> 正文阅读

[大数据]pymongo-增删改查

1. 插入数据

参考链接 - runoob.com - Python Mongodb 插入文档

import pymongo
 
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["runoobdb"]   # 创建数据库runoobdb
dblist = myclient.list_database_names()  # 展示数据库

mycol = mydb["sites"]   # 创建集合
collist = mydb. list_collection_names()  # 展示集合(表)


# ======================================== 插入数据 ======================================== 
# insert_one(), insert_many()
# mydict = { "name": "RUNOOB", "alexa": "10000", "url": "https://www.runoob.com" }
 
# x = mycol.insert_one(mydict)   # insert_one() 方法返回 InsertOneResult 对象,
#                                 # 该对象包含 inserted_id 属性,它是插入文档的 id 值。
# print(x.inserted_id)

mylist = [
  { "name": "Taobao", "alexa": "100", "url": "https://www.taobao.com" },
  { "name": "QQ", "alexa": "101", "url": "https://www.qq.com" },
  { "name": "Facebook", "alexa": "10", "url": "https://www.facebook.com" },
  { "name": "知乎", "alexa": "103", "url": "https://www.zhihu.com" },
  { "name": "Github", "alexa": "109", "url": "https://www.github.com" }
]
 
x = mycol.insert_many(mylist)
print(x.inserted_ids)   # 输出插入的所有文档对应的 _id 值


# 插入指定数据

mycol2 = mydb['site2']
mylist2 = [
  { "_id": 1, "name": "RUNOOB", "cn_name": "菜鸟教程"},
  { "_id": 2, "name": "Google", "address": "Google 搜索"},
  { "_id": 3, "name": "Facebook", "address": "脸书"},
  { "_id": 4, "name": "Taobao", "address": "淘宝"},
  { "_id": 5, "name": "Zhihu", "address": "知乎"}
]
 
x2 = mycol2.insert_many(mylist2)
 
# 输出插入的所有文档对应的 _id 值
print(x2.inserted_ids)

2. 查询数据

参考链接 - runoob.com - Python Mongodb 查询文档

import pymongo
 
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["runoobdb"]   # 创建数据库runoobdb
dblist = myclient.list_database_names()  # 展示数据库

mycol = mydb["sites"]   # 创建集合
collist = mydb. list_collection_names()  # 展示集合(表)

# =============================================== 查找数据 ======================
# find_one(), find()

# x = mycol.find_one()
# print(x)

# for x in mycol.find():
#   print(x) 

# ------- 查询指定字段
# for x in mycol.find({},{ "_id": 0, "name": 1, "alexa": 1 }):
#   print(x)

# ------------ 查询指定条件
# myquery = { "name": "RUNOOB" }
# mydoc = mycol.find(myquery)
 
# for x in mydoc:
#   print(x)

# ------------ 高级查询
# myquery = { "name": { "$gt": "H" } }   # 读取 name 字段中第一个字母 ASCII 值大于 "H" 的数据,大于的修饰符条件为 {"$gt": "H"}
# mydoc = mycol.find(myquery)
 
# for x in mydoc:
#   print(x)

# -------------- 正则表达式查询
# myquery = { "name": { "$regex": "^R" } }   # 读取 name 字段中第一个字母为 "R" 的数据,正则表达式修饰符条件为 {"$regex": "^R"}
 
# mydoc = mycol.find(myquery)
 
# for x in mydoc:
#   print(x)

# -------------- 返回指定条数记录
myresult = mycol.find().limit(3)

for x in myresult:
  print(x)

3. 修改数据

参考链接 - runoob.com - Python Mongodb 修改文档

import pymongo
 
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["runoobdb"]   # 创建数据库runoobdb
dblist = myclient.list_database_names()  # 展示数据库

mycol = mydb["sites"]   # 创建集合


# =============================================== 修改数据 ======================
#  ----------- update_one() 方法修改文档中的记录。该方法第一个参数为查询的条件,第二个参数为要修改的字段。
# 如果查找到的匹配数据多于一条,则只会修改第一条。
# myquery = { "alexa": "10000" }
# newvalues = { "$set": { "alexa": "12345" } }
 
# mycol.update_one(myquery, newvalues)
 
# for x in mycol.find():   # 输出修改后的  "sites"  集合
#   print(x)


# -------------------  update_many() 修改所有匹配到的记录
# 查找所有以 F 开头的 name 字段,并将匹配到所有记录的 alexa 字段修改为 123
# myquery = { "name": { "$regex": "^F" } }
# newvalues = { "$set": { "alexa": "123" } }
 
# x = mycol.update_many(myquery, newvalues)
 
# print(x.modified_count, "文档已修改")
# for x in mycol.find():   # 输出修改后的  "sites"  集合
#   print(x)

4. 数据排序

参考链接 - runoob.com - Python Mongodb 数据排序

import pymongo
 
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["runoobdb"]   # 创建数据库runoobdb
dblist = myclient.list_database_names()  # 展示数据库

mycol = mydb["sites"]   # 创建集合


# =============================================== 排序数据 ======================
# sort() 方法第一个参数为要排序的字段,第二个字段指定排序规则,1 为升序,-1 为降序,默认为升序。

# mydoc = mycol.find().sort("alexa")  # alexa 按升序排序,默认升序
mydoc = mycol.find().sort("alexa", -1)   # 降序, 不含"alexa"的,排在name:"alexa"的后面

for x in mydoc:
  print(x)

5. 数据删除

参考链接 - runoob.com - Python Mongodb 数据删除

import pymongo
 
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["runoobdb"]   # 创建数据库runoobdb
dblist = myclient.list_database_names()  # 展示数据库

mycol = mydb["sites"]   # 创建集合


# =============================================== 删除数据 ======================
# ------------- delete_one() 方法来删除一个文档,该方法第一个参数为查询对象,指定要删除哪些数据。
# myquery = { "name": "Taobao" }
# mycol.delete_one(myquery)
 
# for x in mycol.find():   # 删除后输出
#   print(x)


# --------- delete_many() 方法来删除多个文档,该方法第一个参数为查询对象,指定要删除哪些数据。
# 删除所有 name 字段中以 F 开头的文档
# myquery = { "name": {"$regex": "^F"} }

# x = mycol.delete_many(myquery) 
# print(x.deleted_count, "个文档已删除")


# -----------  delete_many() 方法如果传入的是一个空的查询对象,则会删除集合中的所有文档
# x = mycol.delete_many({})
# print(x.deleted_count, "个文档已删除")


# -----------  drop() 方法来删除一个集合
mycol.drop()  # return true: 删除成功

6. 远程连接-索引查询

参考链接 - pymongo 建检索 - 针对大容量数据 ?? ??

import pymongo
import pandas as pd
import datetime

mongo_client = pymongo.MongoClient('mongodb://username:password@hostname/dbname:端口号')
col = mongo_client["数据库名"]["集合名"]      # 集合


test_data = col.find().sort('_id', -1).limit(1)   # 逆序,即查询最后一个
test_data_2 = list(col.find({"$and" : [{'index1':'xxx'}, {'index2':'xxx'}]}).sort('_id', -1).limit(30))  # 按条件查找,最后30个

# ========================= 建索引 ============================
 
# print(col.index_information())   # 查询已建立的索引

start_time = "2022-1-1 10:00:00"
start_time = datetime.datetime.strptime(start_time, "%Y-%m-%d %H:%M:%S")
end_time = "2022-1-1 10:00:00"
end_time = datetime.datetime.strptime(end_time, "%Y-%m-%d %H:%M:%S")

# 已建立的复合索引 index1, index2,index3=datetime(仅这里为了区分)...
test_data3 = list(col.find({"$and": [{'index1':'xxx'},{'index2':'xxx'}, {'datetime':{'$gte': start_time, '$lte': end_time }}]}))


# ===================================== 构成dataframe ==============
data_df = pd.DataFrame()
for i in test_data3:
    data_df = data_df.append(i, ignore_index=True)


  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-13 21:52:47  更:2022-03-13 21:55:14 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 7:26:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码