库引入
Python 要连接 MongoDB 需要 MongoDB 驱动,这里我们使用 PyMongo 驱动来连接。
python
import pymongo
链接数据库
创建数据库需要使用 MongoClient 对象,并且指定连接的ip和端口号。
python
myclient=pymongo.MongoClient("localhost",27017)#连接数据库
查看数据库和集合
python
dbs=myclient.list_database_names()#查看所有数据库
dbs
['admin', 'config', 'local', 'test']
python
mydb=myclient['test']#切换/创建(不存在的时候)数据库test
注意: 在 MongoDB 中,数据库只有在内容插入后才会创建! 就是说,数据库创建后要创建集合(数据表)并插入一个文档(记录),数据库才会真正创建
查看集合
python
colls=mydb.list_collection_names()#查看/罗列集合名
#colls
mycoll=mydb['c1']#切换/显示创建(不存在的时候)集合
显示创建和删除集合
create_collection()创建集合,drop_collection("love")删除集合
python
mydb=myclient['test']
mydb.create_collection("love")#创建集合love
mydb.drop_collection("love")#删除集合love
文档增删改查
查看文档
python
myclient=pymongo.MongoClient("localhost",27017)#链接服务
mydb=myclient['test']#选择数据库
mycoll=mydb['c1']#选择集合
docs=mycoll.find()#查看文档
#打印文档
for i in docs:
print(i)
{'_id': ObjectId('664bef6e3dceef39a819193e'), 'name': 'aa1', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a819193f'), 'name': 'aa2', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a8191940'), 'name': 'aa4', 'age': 20.0}
{'_id': ObjectId('664bef6e3dceef39a8191941'), 'name': 'aa5', 'age': 17.0}
插入文档
插入单个文档
insert_one为插入单个文档。该方法的第一参数是字典key:value 对。
python
d1={"name":"hakgd","age":88,"major":"大数据"}#python中key也需要使用引号括起来
x=mycoll.insert_one(d1)#插入单个文档insert_one
print(x.inserted_id)#打印文档_id
<pymongo.results.InsertOneResult object at 0x000002049FE76278>
664bfe3b32a3dbc8cddeb487
insert_one() 方法返回 InsertOneResult 对象,该对象包含 inserted_id 属性,它是插入文档的 id值。
插入多个文档
集合中插入多个文档使用 insert_many() 方法,该方法的第一参数是字典列表。
python
d2=[
{"name":"aklgd","age":44},
{"name":"vkjz","age":88},
{"name":"uixz","age":100}
]
x=mycoll.insert_many(d2)#插入多个文档 insert_many,参数为数组
print(x.inserted_ids)#打印多个文档_id
[ObjectId('664bff1b32a3dbc8cddeb48e'), ObjectId('664bff1b32a3dbc8cddeb48f'), ObjectId('664bff1b32a3dbc8cddeb490')]
insert_many() 方法返回 InsertManyResult 对象,该对象包含 inserted_ids 属性,该属性保存着所有插入文档的_id 值。
查询文档
查看全部文档
python
dos=mycoll.find()
for i in dos:
print(i)
{'_id': ObjectId('664bef6e3dceef39a819193e'), 'name': 'aa1', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a819193f'), 'name': 'aa2', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a8191940'), 'name': 'aa4', 'age': 20.0}
{'_id': ObjectId('664bef6e3dceef39a8191941'), 'name': 'aa5', 'age': 17.0}
{'_id': ObjectId('664bfd6532a3dbc8cddeb484'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe1132a3dbc8cddeb485'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe3032a3dbc8cddeb486'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe3b32a3dbc8cddeb487'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfeff32a3dbc8cddeb488'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bfeff32a3dbc8cddeb489'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bfeff32a3dbc8cddeb48a'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48b'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48c'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48d'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48e'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48f'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff1b32a3dbc8cddeb490'), 'name': 'uixz', 'age': 100}
因为插入数据时候重复运行了多次,所有数据重复了
按照条件查询
python
dos=mycoll.find({"age":88},{"_id":0})#find的使用和mongodb一致,第一个参数为查询条件,参数2为(不)显示的列
for i in dos:
print(i)
{'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'name': 'vkjz', 'age': 88}
{'name': 'vkjz', 'age': 88}
{'name': 'vkjz', 'age': 88}
还可以使用修饰符,按照范围查询
python
dos=mycoll.find({"age":{"$lt":20}},{"_id":0})#find的使用和mongodb一致,第一个参数为查询条件,参数2为(不)显示的列
for i in dos:
print(i)
{'name': 'aa1', 'age': 18.0}
{'name': 'aa2', 'age': 18.0}
{'name': 'aa5', 'age': 17.0}
正则表达查询
python
dos=mycoll.find({"name":{"$regex":"^a"}},{"_id":0})#,第一个参数为查询条件,正则匹配name为a开头的文档
for i in dos:
print(i)
{'name': 'aa1', 'age': 18.0}
{'name': 'aa2', 'age': 18.0}
{'name': 'aa4', 'age': 20.0}
{'name': 'aa5', 'age': 17.0}
{'name': 'aklgd', 'age': 44}
{'name': 'aklgd', 'age': 44}
{'name': 'aklgd', 'age': 44}
更多查询方法请查看:https://blog.csdn.net/sinat_20471177/article/details/117746948
管道聚合
数据准备
python
c2=mydb['c2']
d3=[
{"name":"张三","age":18,"sex":"男","major":"大数据技术"},
{"name":"李四","age":19,"sex":"男",'major':"大数据技术"},
{"name":"王五","age":18,"sex":"女","major":"人工智能"}
]
c2.insert_many(d3)
<pymongo.results.InsertManyResult at 0x2049c49f470>
python
for d in c2.find():
print(d)
{'_id': ObjectId('664c044a32a3dbc8cddeb491'), 'name': '张三', 'age': 18, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb492'), 'name': '李四', 'age': 19, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb493'), 'name': '王五', 'age': 18, 'sex': '女', 'major': '人工智能'}
聚合查询
语法格式:
python
集合.aggregate.([
{"$管道1":{表达式}},
{"$管道2":{表达式}},
...
])
例如:按major进行分组,统计每个分组中的年龄平均值
python
#按major进行分组,统计每个分组中的年龄平均值
piple=[{
"$group":{"_id":"$major","avg_age":{"$avg":"$age"}}
}]
x=c2.aggregate(piple)
for i in x:
print(i)
{'_id': '人工智能', 'avg_age': 18.0}
{'_id': '大数据技术', 'avg_age': 18.5}
python
#按住major进行分组,统计每个分组中的年龄平均值和计数,并按照平均年龄降序排序
piple2=[
{ "$group":{"_id":"$major","avg_age":{"$avg":"$age"},"count":{"$sum":1}}},
{"$sort":{"avg_age":-1}}
]
x=c2.aggregate(piple2)
for i in x:
print(i)
{'_id': '大数据技术', 'avg_age': 18.5, 'count': 2}
{'_id': '人工智能', 'avg_age': 18.0, 'count': 1}
文档更新
我们可以在 MongoDB 中使用 update_one() 方法修改文档中的记录。该方法第一个参数为查询的条件,第二个参数为要修改的字段。
如果查找到的匹配数据多于一条,则只会修改第一条。
python
for d in c2.find():
print(d)
{'_id': ObjectId('664c044a32a3dbc8cddeb491'), 'name': '张三', 'age': 18, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb492'), 'name': '李四', 'age': 19, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb493'), 'name': '王五', 'age': 18, 'sex': '女', 'major': '人工智能'}
python
#把王五文档sax字段修改为 男
q={"name":"王五"}#查询条件
n_d={"$set":{"sex":"男"}}#新数据
c2.update_one(q,n_d)#update_one修改匹配到的第一个文档
for d in c2.find():
print(d)
{'_id': ObjectId('664c044a32a3dbc8cddeb491'), 'name': '张三', 'age': 18, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb492'), 'name': '李四', 'age': 19, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb493'), 'name': '王五', 'age': 18, 'sex': '男', 'major': '人工智能'}
update_many为修改多个文档方法,只要条件匹配上则全部修改。例如
python
#把所有文档年龄全部增加2岁
c2.update_many({},{"$inc":{"age":2}})#同时修改多个文档 update_many
for d in c2.find():
print(d)
{'_id': ObjectId('664c044a32a3dbc8cddeb491'), 'name': '张三', 'age': 20, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb492'), 'name': '李四', 'age': 21, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb493'), 'name': '王五', 'age': 20, 'sex': '男', 'major': '人工智能'}
更多更新方法【修改器】请查看:https://blog.csdn.net/sinat_20471177/article/details/117746948
删除文档
python
for d in c2.find():
print(d)
{'_id': ObjectId('664c044a32a3dbc8cddeb491'), 'name': '张三', 'age': 20, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb492'), 'name': '李四', 'age': 21, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb493'), 'name': '王五', 'age': 20, 'sex': '男', 'major': '人工智能'}
我们可以使用 delete_one() 方法来删除一个文档,该方法第一个参数为查询对象,指定要删除哪些数据。
python
#删除姓名为 王五的文档
c2.delete_one({"name":"王五"})#删除单个
<pymongo.results.DeleteResult at 0x2049fe8bc88>
python
for d in c2.find():
print(d)
{'_id': ObjectId('664c044a32a3dbc8cddeb491'), 'name': '张三', 'age': 20, 'sex': '男', 'major': '大数据技术'}
{'_id': ObjectId('664c044a32a3dbc8cddeb492'), 'name': '李四', 'age': 21, 'sex': '男', 'major': '大数据技术'}
我们可以使用 delete_many() 方法来删除多个文档,该方法第一个参数为查询对象,指定要删除哪些数据。
python
c2.delete_many({"major":"大数据技术"})#删除多个,如果删除全部,则条件为空
for d in c2.find():
print(d)
delete_many() 方法如果传入的是一个空的查询对象,则会删除集合中的所有文档:
其他
python
dos=mycoll.find()
for i in dos:
print(i)
{'_id': ObjectId('664bef6e3dceef39a819193e'), 'name': 'aa1', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a819193f'), 'name': 'aa2', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a8191940'), 'name': 'aa4', 'age': 20.0}
{'_id': ObjectId('664bef6e3dceef39a8191941'), 'name': 'aa5', 'age': 17.0}
{'_id': ObjectId('664bfd6532a3dbc8cddeb484'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe1132a3dbc8cddeb485'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe3032a3dbc8cddeb486'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe3b32a3dbc8cddeb487'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfeff32a3dbc8cddeb488'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bfeff32a3dbc8cddeb489'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bfeff32a3dbc8cddeb48a'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48b'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48c'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48d'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48e'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48f'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff1b32a3dbc8cddeb490'), 'name': 'uixz', 'age': 100}
限制返回数limit
python
#查询限制返回数 limit,只返回前5个文档
for i in mycoll.find().limit(5):
print(i)
{'_id': ObjectId('664bef6e3dceef39a819193e'), 'name': 'aa1', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a819193f'), 'name': 'aa2', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a8191940'), 'name': 'aa4', 'age': 20.0}
{'_id': ObjectId('664bef6e3dceef39a8191941'), 'name': 'aa5', 'age': 17.0}
{'_id': ObjectId('664bfd6532a3dbc8cddeb484'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
排序sort
python
#排序sort,第一个参数为排序字段,参数2为排序方法,按照年龄进行降序排序
for i in mycoll.find().sort("age",-1):
print(i)
{'_id': ObjectId('664bfeff32a3dbc8cddeb48a'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48d'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff1b32a3dbc8cddeb490'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bfd6532a3dbc8cddeb484'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe1132a3dbc8cddeb485'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe3032a3dbc8cddeb486'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfe3b32a3dbc8cddeb487'), 'name': 'hakgd', 'age': 88, 'major': '大数据'}
{'_id': ObjectId('664bfeff32a3dbc8cddeb489'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48c'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48f'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bfeff32a3dbc8cddeb488'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48b'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48e'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bef6e3dceef39a8191940'), 'name': 'aa4', 'age': 20.0}
{'_id': ObjectId('664bef6e3dceef39a819193e'), 'name': 'aa1', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a819193f'), 'name': 'aa2', 'age': 18.0}
{'_id': ObjectId('664bef6e3dceef39a8191941'), 'name': 'aa5', 'age': 17.0}
跳过指定数量的文档 skip
python
#跳过指定数量的文档 skip,返回剩下的文档
for i in mycoll.find().skip(8):
print(i)
{'_id': ObjectId('664bfeff32a3dbc8cddeb488'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bfeff32a3dbc8cddeb489'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bfeff32a3dbc8cddeb48a'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48b'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48c'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff0e32a3dbc8cddeb48d'), 'name': 'uixz', 'age': 100}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48e'), 'name': 'aklgd', 'age': 44}
{'_id': ObjectId('664bff1b32a3dbc8cddeb48f'), 'name': 'vkjz', 'age': 88}
{'_id': ObjectId('664bff1b32a3dbc8cddeb490'), 'name': 'uixz', 'age': 100}