numpy.in1d #

麻木的。in1d ( ar1 , ar2 , Should_unique = False , invert = False , * , kind = None ) [来源] #

测试一维数组的每个元素是否也存在于第二个数组中。

返回一个与ar1长度相同的布尔数组,当ar1的元素在ar2中时返回 True ,否则返回 False。

我们建议使用isin而不是in1d新代码。

参数
ar1 (M,) 类似数组

输入数组。

ar2类似数组

用于测试ar1的每个值的值。

假设_unique布尔值,可选

如果为 True,则假定输入数组都是唯一的,这可以加快计算速度。默认值为 False。

反转布尔值,可选

如果为 True,则返回数组中的值将反转(即,当ar1的元素位于ar2中时为 False ,否则为 True)。默认值为 False。相当于(但比) 更快。np.in1d(a, b, invert=True)np.invert(in1d(a, b))

kind {无, '排序', '表格'}, 可选

要使用的算法。这不会影响最终结果,但会影响速度和内存使用。默认值无,将根据内存考虑自动选择。

  • 如果“排序”,将使用基于合并排序的方法。这将具有大约ar1ar2大小总和的 6 倍的内存使用量 ,不考虑 dtype 的大小。

  • 如果是“table”,将使用类似于计数排序的查找表方法。这仅适用于布尔数组和整数数组。这将具有ar1大小加上ar2的最大最小值的内存使用量。当使用 'table' 选项时, assume_unique 不起作用。

  • 如果没有,如果所需的内存分配小于或等于ar1ar2大小总和的 6 倍,将自动选择“table”,否则将使用“sort”。这样做是为了默认情况下不使用大量内存,尽管“表”在大多数情况下可能更快。如果选择“table”,则 assume_unique将不起作用。

1.8.0 版本中的新增功能。

返回
in1d (M,) ndarray, 布尔

ar1[in1d]位于ar2中。

也可以看看

isin

该函数的版本保留了 ar1 的形状。

numpy.lib.arraysetops

具有许多其他函数的模块,用于对数组执行集合操作。

笔记

in1d可以被视为一维序列python 关键字的逐元素函数版本。大致相当于.但是,如果ar2是一个集合或类似(非序列)容器,则此想法会失败:当转换为数组时,在这些情况下 是对象数组而不是包含值的预期数组。in1d(a, b)np.array([item in b for item in a])ar2asarray(ar2)

如果满足以下关系,则 使用kind='table'往往比kind='sort'更快,但可能会使用更多内存。kind的默认值将仅根据内存使用情况自动选择,因此如果可以放宽内存限制,可以手动设置。log10(len(ar2)) > (log10(max(ar2)-min(ar2)) - 2.27) / 0.927kind='table'

1.4.0 版本中的新增功能。

例子

>>> test = np.array([0, 1, 2, 5, 0])
>>> states = [0, 2]
>>> mask = np.in1d(test, states)
>>> mask
array([ True, False,  True, False,  True])
>>> test[mask]
array([0, 2, 0])
>>> mask = np.in1d(test, states, invert=True)
>>> mask
array([False,  True, False,  True, False])
>>> test[mask]
array([1, 5])