数据类型#

也可以看看

数组类型和类型之间的转换#

NumPy 比 Python 支持更多种类的数值类型。本节介绍哪些可用，以及如何修改数组的数据类型。

支持的基本类型与 C 中的基本类型密切相关：

numpy 类型	C型	描述
`numpy.bool_`	`bool`	布尔值（True 或 False）存储为字节
`numpy.byte`	`signed char`	平台定义
`numpy.ubyte`	`unsigned char`	平台定义
`numpy.short`	`short`	平台定义
`numpy.ushort`	`unsigned short`	平台定义
`numpy.intc`	`int`	平台定义
`numpy.uintc`	`unsigned int`	平台定义
`numpy.int_`	`long`	平台定义
`numpy.uint`	`unsigned long`	平台定义
`numpy.longlong`	`long long`	平台定义
`numpy.ulonglong`	`unsigned long long`	平台定义
`numpy.half`/`numpy.float16`		半精度浮点数：符号位，5位指数，10位尾数
`numpy.single`	`float`	平台定义的单精度浮点数：通常为符号位、8 位指数、23 位尾数
`numpy.double`	`double`	平台定义的双精度浮点数：通常为符号位、11 位指数、52 位尾数。
`numpy.longdouble`	`long double`	平台定义的扩展精度浮点
`numpy.csingle`	`float complex`	复数，由两个单精度浮点数（实部和虚部）表示
`numpy.cdouble`	`double complex`	复数，由两个双精度浮点数（实部和虚部）表示。
`numpy.clongdouble`	`long double complex`	复数，由两个扩展精度浮点数（实部和虚部）表示。

由于其中许多具有依赖于平台的定义，因此提供了一组固定大小的别名（请参阅大小别名）。

NumPy 数值类型是dtype（数据类型）对象的实例，每个对象都具有独特的特征。使用 dtype 导入 NumPy 后，可用的、等。>>> import numpy as npnp.bool_np.float32

上面未列出的高级类型将在结构化数组部分中进行探讨。

有 5 种基本数值类型，分别表示布尔值 (bool)、整数 (int)、无符号整数 (uint)、浮点 (float) 和复数。名称中带有数字的表示类型的位大小（即需要多少位来表示内存中的单个值）。某些类型（例如int和 intp）具有不同的位大小，具体取决于平台（例如 32 位与 64 位机器）。在与寻址原始内存的低级代码（例如 C 或 Fortran）进行交互时，应考虑到这一点。

数据类型可以用作将 python 数字转换为数组标量的函数（有关说明，请参阅数组标量部分）、将 python 数字序列转换为该类型的数组，或者作为许多 numpy 函数或方法接受的 dtype 关键字的参数。一些例子：

>>> x = np.float32(1.0)
>>> x
1.0
>>> y = np.int_([1,2,4])
>>> y
array([1, 2, 4])
>>> z = np.arange(3, dtype=np.uint8)
>>> z
array([0, 1, 2], dtype=uint8)

数组类型也可以通过字符代码引用，主要是为了保留与旧包（例如 Numeric）的向后兼容性。一些文档可能仍然引用这些，例如：

>>> np.array([1, 2, 3], dtype='f')
array([1.,  2.,  3.], dtype=float32)

我们建议改用 dtype 对象。

要转换数组的类型，请使用 .astype() 方法（首选）或类型本身作为函数。例如：

>>> z.astype(float)                 
array([0.,  1.,  2.])
>>> np.int8(z)
array([0, 1, 2], dtype=int8)

请注意，上面我们使用Python float 对象作为数据类型。 NumPy 知道“int指” np.int_、bool“意思” np.bool_、“即”float和np.float_“complex是” np.complex_。其他数据类型没有 Python 等效项。

要确定数组的类型，请查看 dtype 属性：

>>> z.dtype
dtype('uint8')

dtype 对象还包含有关类型的信息，例如其位宽和字节顺序。数据类型还可以间接用于查询类型的属性，例如是否为整数：

>>> d = np.dtype(int)
>>> d 
dtype('int32')

>>> np.issubdtype(d, np.integer)
True

>>> np.issubdtype(d, np.floating)
False

数组标量#

NumPy 通常将数组元素作为数组标量（具有关联数据类型的标量）返回。数组标量与 Python 标量不同，但在大多数情况下，它们可以互换使用（主要例外是早于 v2.x 的 Python 版本，其中整数数组标量不能充当列表和元组的索引）。有一些例外，例如当代码需要标量的非常特定的属性时，或者当它专门检查某个值是否是 Python 标量时。通常，通过使用相应的 Python 类型函数（例如，int、float、complex、str、unicode）将数组标量显式转换为 Python 标量，可以轻松解决问题。

使用数组标量的主要优点是它们保留数组类型（Python 可能没有可用的匹配标量类型，例如int16）。因此，使用数组标量可以确保数组和标量之间具有相同的行为，无论该值是否位于数组内部。 NumPy 标量也有许多与数组相同的方法。

溢出错误#

当值需要的内存多于数据类型中可用的内存时，NumPy 数值类型的固定大小可能会导致溢出错误。例如，对于 64 位整数numpy.power计算正确，但对于 32 位整数给出 1874919424（不正确）。100 ** 8

>>> np.power(100, 8, dtype=np.int64)
10000000000000000
>>> np.power(100, 8, dtype=np.int32)
1874919424

NumPy 和 Python 整数类型的行为在整数溢出方面存在显着差异，并且可能会让期望 NumPy 整数的行为与 Python 类似的用户感到困惑int。与 NumPy 不同，Python 的大小int是灵活的。这意味着 Python 整数可以扩展以容纳任何整数并且不会溢出。

NumPy 提供numpy.iinfo和numpy.finfo分别验证 NumPy 整数和浮点值的最小值或最大值

>>> np.iinfo(int) # Bounds of the default integer on this system.
iinfo(min=-9223372036854775808, max=9223372036854775807, dtype=int64)
>>> np.iinfo(np.int32) # Bounds of a 32-bit integer
iinfo(min=-2147483648, max=2147483647, dtype=int32)
>>> np.iinfo(np.int64) # Bounds of a 64-bit integer
iinfo(min=-9223372036854775808, max=9223372036854775807, dtype=int64)

如果 64 位整数仍然太小，结果可能会转换为浮点数。浮点数提供了更大但不精确的可能值范围。

>>> np.power(100, 100, dtype=np.int64) # Incorrect even with 64-bit int
0
>>> np.power(100, 100, dtype=np.float64)
1e+200

扩展精度#

Python 的浮点数通常是 64 位浮点数，几乎相当于np.float64.在某些不寻常的情况下，使用更精确的浮点数可能会很有用。这在 numpy 中是否可行取决于硬件和开发环境：具体来说，x86 机器提供 80 位精度的硬件浮点，虽然大多数 C 编译器提供这种类型，但 MSVC（Windows 构建标准）使得与（64 位）相同。 NumPy 使编译器可用作（以及复数）。你可以找出你的 numpy 提供了什么。long doublelong doubledoublelong doublenp.longdoublenp.clongdoublenp.finfo(np.longdouble)

NumPy 不提供比 C 更精确的 dtype ；特别是，128 位 IEEE 四精度数据类型 (FORTRAN's ) 不可用。long doubleREAL*16

为了有效的内存对齐，np.longdouble通常用零位填充存储，即 96 或 128 位。哪个效率更高取决于硬件和开发环境；通常在 32 位系统上它们被填充到 96 位，而在 64 位系统上它们通常被填充到 128 位。np.longdouble填充为系统默认值；np.float96并np.float128为需要特定填充的用户提供。不管名称如何，np.float96和 np.float128只提供与一样多的精度np.longdouble，即在大多数 x86 机器上为 80 位，在标准 Windows 版本中为 64 位。

请注意，即使np.longdouble提供比 python 更高的精度float，也很容易失go额外的精度，因为 python 经常强制值通过float.例如，%格式化运算符要求将其参数转换为标准 python 类型，因此即使请求许多小数位，也无法保留扩展精度。使用 value 测试您的代码可能很有用。1 + np.finfo(np.longdouble).eps