检查 Python 列表中是否有重复项

Python 检查列表中是否有重复项:

  1. 使用 len() 函数获取列表的长度。
  2. 将列表转换为集合并获取集合的长度。
  3. 如果列表的长度不等于集合的长度,则列表包含重复项。
my_list = ['zadmei', 'zadmei', 'fql']


# ✅ check if list contains duplicates

has_duplicates = len(my_list) != len(set(my_list))
print(has_duplicates)  # ?️ True

if has_duplicates:
    print('The list contains duplicates')
else:
    print('The list does NOT contain duplicates')

# -----------------------------------------------

# ✅ find duplicates in a list

duplicates = set([item for item in my_list if my_list.count(item) > 1])
print(duplicates)  # ?️ {'zadmei'}

检查 Python 列表中是否有重复项

len() 函数返回对象的长度(项目数)。

my_list = ['zadmei', 'zadmei', 'fql']

result = len(my_list)
print(result)  # ?️ 3

该函数采用的参数可以是序列(字符串、元组、列表、范围或字节)或集合(字典、集合或冻结集合)。

我们使用 set() 类将列表转换为集合对象。

集合对象是唯一元素的无序集合,因此将列表转换为集合会删除所有重复项。

如果列表的长度不等于集合的长度,则列表包含重复项。

my_list = ['zadmei', 'zadmei', 'fql']


has_duplicates = len(my_list) != len(set(my_list))
print(has_duplicates)  # ?️ True

如果我们需要在列表中查找重复项,请使用列表推导。

my_list = ['zadmei', 'zadmei', 'fql']


duplicates = set(
    [item for item in my_list
     if my_list.count(item) > 1]
)
print(duplicates)  # ?️ {'bobby'}

我们使用列表推导来迭代列表。

列表推导用于对每个元素执行某些操作或选择满足条件的元素子集。

在每次迭代中,我们使用 list.count() 方法检查当前项目是否在列表中多次包含。

最后一步是将列表转换为 set() 以删除重复项。

或者,我们可以使用 for 循环。

使用 for 循环检查列表中是否有重复项

检查列表中是否有重复项:

  1. 声明一个新变量并将其初始化为一个集合。
  2. 使用 for 循环遍历列表。
  3. 检查每个项目是否包含在集合中。
  4. 如果满足条件,则返回 True,否则将项目添加到集合中。
def has_duplicates(l):
    seen = set()

    for item in l:
        if item in seen:
            return True

        seen.add(item)
    return False

# ?️ True
print(has_duplicates(['zadmei', 'zadmei', 'fql']))

# ?️ False
print(has_duplicates(['zadmei', 'fql', 'com']))

我们使用 for 循环遍历列表。

在每次迭代中,我们检查当前项目是否包含在集合中。

如果满足条件,我们返回 True,因为列表包含重复项。否则,我们将项目添加到集合中并继续循环。

如果从未满足条件,则函数返回 False。或者,我们可以使用 any() 函数。

使用 any() 检查列表中是否有重复项

检查列表中是否有重复项:

  1. 使用生成器表达式迭代列表。
  2. 使用 list.count() 方法检查每个项目是否被多次包含。
  3. 将生成器对象传递给 any() 函数。
def has_duplicates(l):
    result = any(
        l.count(item) > 1 for item in l
    )

    return result


# ?️ True
print(has_duplicates(['zadmei', 'zadmei', 'fql']))

# # ?️ False
print(has_duplicates(['zadmei', 'fql', 'com']))

我们使用生成器表达式来遍历列表。

生成器表达式用于对每个元素执行某些操作或选择满足条件的元素子集。

在每次迭代中,我们使用 list.count() 方法检查当前项目是否在列表中多次包含。

list.count() 方法接受一个值并返回所提供的值在列表中出现的次数。

any 函数将一个可迭代对象作为参数,如果可迭代对象中的任何元素为真,则返回 True。

如果条件至少满足一次,则 any() 函数短路并返回 True。如果从未满足条件,则 any() 函数返回 False。

选择哪种方法是个人喜好的问题。 我会将列表转换为一个集合,然后比较列表的长度和集合对象,因为我发现这是最直接和可读的方法。