在 MongoDB 中使用查找运算符连接多个条件

今天,我们将了解如何在 MongoDB 中使用 $lookup 运算符连接多个条件。此外,我们还将探索一些示例来演示 $group 阶段和 $unionWidth 聚合阶段的使用。

在 MongoDB 中使用 $lookup 运算符连接多个条件

如果我们有 MongoDB 3.6 或更高版本,我们可以使用 $lookup 聚合 pipeline 运算符来连接多个条件。

为此,我们有两个名为 userssalaries 的集合。你也可以使用以下命令创建它。

创建集合的示例代码:

> db.createCollection('users')
> db.createCollection('salaries')

users 集合中插入文档的示例代码:

> db.users.insertMany(
[
{
username: 'userone',
age: 30,
gender: 'Female',
city: 'Lahore',
country: 'Pakistan'
},
{
username: 'usertwo',
age: 35,
gender: 'Male',
city: 'Florida',
country: 'United States'
}
]
)

salaries 集合中插入文档的示例代码:

> db.salaries.insertMany(
[
{
username: 'userone',
salary: 3000
},
{
username: 'usertwo',
salary: 5000
}
]
)

users 集合的显示数据:

> db.users.find().pretty()

输出:

{
        "_id" : ObjectId("628deb40c1e812eeeb311439"),
        "username" : "userone",
        "age" : 30,
        "gender" : "Female",
        "city" : "Lahore",
        "country" : "Pakistan"
}
{
        "_id" : ObjectId("628deb40c1e812eeeb31143a"),
        "username" : "usertwo",
        "age" : 35,
        "gender" : "Male",
        "city" : "Florida",
        "country" : "United States"
}

salaries 集合的显示数据:

> db.salaries.find().pretty()

输出:

{
        "_id" : ObjectId("628deb07c1e812eeeb311437"),
        "username" : "userone",
        "salary" : 3000
}
{
        "_id" : ObjectId("628deb07c1e812eeeb311438"),
        "username" : "usertwo",
        "salary" : 5000
}

创建集合并插入文档后,我们可以探索各种场景来加入多个条件。让我们从 $lookup 开始。

使用 $lookup 聚合 pipeline 运算符

示例代码:

> db.users.aggregate([
{
$lookup: {
from: 'salaries',
let: {
user_name: '$username',
user_salary: 3000
},
pipeline: [{
$match: {
$expr: {
$and: [
{ $eq: ['$username', '$$user_name'] },
{ $gte: ['$salary','$$user_salary'] }
]
}
}
}],
as: 'usersalary'
}
}
]).pretty()

输出:

{
        "_id" : ObjectId("628deb40c1e812eeeb311439"),
        "username" : "userone",
        "age" : 30,
        "gender" : "Female",
        "city" : "Lahore",
        "country" : "Pakistan",
        "usersalary" : [
                {
                        "_id" : ObjectId("628deb07c1e812eeeb311437"),
                        "username" : "userone",
                        "salary" : 3000
                }
        ]
}
{
        "_id" : ObjectId("628deb40c1e812eeeb31143a"),
        "username" : "usertwo",
        "age" : 35,
        "gender" : "Male",
        "city" : "Florida",
        "country" : "United States",
        "usersalary" : [
                {
                        "_id" : ObjectId("628deb07c1e812eeeb311438"),
                        "username" : "usertwo",
                        "salary" : 5000
                }
        ]
}

在这里,我们得到满足两个条件的文档。

  1. username 字段在 userssalaries 集合中是相同的。
  2. salary 字段的值大于等于 3000

我们只得到满足这两个条件的文件。你可能已经注意到 usersalary 是一个元素数组,其中每个元素都是 salaries 集合的文档。

我们可以使用 $unwind$addFields$project 从两个集合(userssalaries)中获取特定字段并形成一个文档,如下例所示。

示例代码:

> db.users.aggregate([
{
$lookup: {
from: 'salaries',
let: {
user_name: '$username',
user_salary: 3000
},
pipeline: [{
$match: {
$expr: {
$and: [
{ $eq: ['$username', '$$user_name'] },
{ $gte: ['$salary','$$user_salary'] }
]
}
}
}],
as: 'usersalary'
}
},
{
$unwind:'$usersalary'
},
{
$addFields: {
salary: '$usersalary.salary'
}
},
{
$project: {
username: 1,
salary: 1
}
}
]).pretty()

输出:

{
        "_id" : ObjectId("628deb40c1e812eeeb311439"),
        "username" : "userone",
        "salary" : 3000
}
{
        "_id" : ObjectId("628deb40c1e812eeeb31143a"),
        "username" : "usertwo",
        "salary" : 5000
}

使用 $unwind 运算符的目的是为每个具有相同名称的元素解构一个数组字段,从输入文档到输出一个文档。

如果数组中只有一个元素,则 $unwind 阶段运算符将对象展平,即元素本身。 $addFields 将对象或数组中的 salary 字段连接到文档的根级别。

在了解上面给出的示例中的用法之前,让我们先关注使用 $project 过滤器阶段的原因。如果我们不使用 $project,我们将获得文档根级别的 salary 字段和 usersalary 对象,这是不必要的。

这是我们使用 $project 过滤阶段并指定输出中应包含哪些字段的地方。

如果项目要求限制使用 $unwind$addFields$project,我们可以使用下面给出的替代解决方案。

示例代码:

> db.users.aggregate([
{
$lookup: {
from: 'salaries',
let: {
user_name: '$username',
user_salary: 3000
},
pipeline: [{
$match: {
$expr: {
$and: [
{ $eq: ['$username', '$$user_name'] },
{ $gte: ['$salary','$$user_salary'] }
]
}
}
}],
as: 'usersalary'
}
},
{
$replaceRoot: {
newRoot: {
$mergeObjects:[
{
$arrayElemAt: [
"$usersalary", 0
]
},
{
salary: "$$ROOT.salary"
}
]
}
}
}
]
).pretty()

输出:

{
        "_id" : ObjectId("628deb07c1e812eeeb311437"),
        "username" : "userone",
        "salary" : 3000
}
{
        "_id" : ObjectId("628deb07c1e812eeeb311438"),
        "username" : "usertwo",
        "salary" : 5000
}

我们使用 let 字段(可选)将字段的值分配给变量。我们在 pipeline 阶段访问这些变量,我们指定 pipeline 在不同的集合上执行。

请注意,我们还使用 $match 阶段来利用名为 $expr 的评估查询运算符,它比较字段的值。

此外,$replaceRootpipeline 中的最后一个聚合 pipeline 阶段,我们使用 $mergeObjects 运算符将 $lookup 输出与 $$ROOT 文档的部分合并。

我们只使用了 $and 运算符来连接条件。你也可以使用 $or 或两个运算符。

创建新集合并使用 $group 聚合阶段加入多个条件

示例代码:

> db.users_salaries.insertMany(
db.users.find({}, {"_id": 0})
.toArray()
.concat(db.salaries.find({}, {"_id": 0}).toArray())
)
db.users_salaries.aggregate([
{ "$group": {
"_id": { "username": "$username" },
"salary": { "$push": "$salary" }
}}
])

输出:

{ "_id" : { "username" : "userone" }, "salary" : [ 3000 ] }
{ "_id" : { "username" : "usertwo" }, "salary" : [ 5000 ] }

对于这个代码示例,我们创建一个名为 users_salaries 的新集合,合并两个名为 userssalaries 的集合,然后将这些文档插入到新创建的集合中。然后,按用户名分组以获得所需的输出。

我们也可以在不创建新集合的情况下获得相同的输出(如上所示)。为此,我们使用 $unionWith 聚合阶段,它为两个集合执行联合。

示例代码:

> db.users.aggregate([
{ $set: { username: "$username" } },
{ $unionWith: {
coll: "salaries",
pipeline: [{ $set: { salary: "$salary" } }]
}},
{ $group: {
_id: { username: "$username"},
"salary": { "$push": "$salary" }
}}
])

输出:

{ "_id" : { "username" : "userone" }, "salary" : [ 3000 ] }
{ "_id" : { "username" : "usertwo" }, "salary" : [ 5000 ] }