NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 多项分布

什么是多项分布?

多项分布是二项分布的推广。它表示一系列实验中多个结果的概率,其中每次试验都有固定数量的结果,并且每个结果都有一个给定的概率。它由两个参数定义:

  • n 试验次数。
  • p 每个结果的概率列表或数组。概率之和必须等于 1。

例如,考虑掷一个六面骰子 10 次。多项分布可以帮助确定每张脸出现一定次数的概率。

在 NumPy 中生成多项样本

NumPy 提供了 numpy.random.multinomial() 函数,可以从多项分布中生成随机样本。此函数需要指定试验次数和每个结果的概率。

示例

此处,每一行代表单个实验的结果,显示每个结果的发生次数 -

import numpy as np

# 定义参数
# 试验次数
n = 10
# 4 种结果的概率
p = [0.1, 0.3, 0.4, 0.2]

# 生成样本
samples = np.random.multinomial(n, p, size=5)
print(samples)

以下是获得的输出 -

[[1 2 5 2]
[1 5 2 2]
[0 5 4 1]
[0 4 4 2]
[0 4 4 2]]

理解数学基础

多项分布的 PMF 根据给定参数计算特定结果的概率。数学上,它表示为 −

P(X1 = x1, ..., Xk = xk) = (n! / (x1! * ... * xk!)) * (p1x1) * ... * (pkxk)

其中,

  • n:试验总数。
  • p1, ..., pk:每种结果的概率。
  • x1, ..., xk:每种结果的观测频率。

理解此公式有助于您解释结果并验证 NumPy 生成的样本。

模拟真实场景

多项式随机分布在现实世界中被广泛应用,例如选举结果、掷骰子和遗传概率。

让我们模拟几个例子来理解它的实际应用:

示例 1:模拟掷骰子

在本例中,我们模拟掷一个六面骰子 20 次,并计算每个面出现的频率 -

import numpy as np

# 模拟掷骰子
# 掷骰子次数
n = 20
# 每个面出现的概率相等
p = [1/6] * 6

# 生成结果
results = np.random.multinomial(n, p)
print("掷骰子频率:", results)

每个值代表实验中某个面出现的频率−

掷骰子频率:[5 2 5 5 3 0]

示例 2:预测选举结果

假设一场选举有三位候选人,我们想根据预测概率模拟 100 位选民的选择 -

import numpy as np

# 模拟选举结果
# 选民人数
n = 100
# 每位候选人的概率
p = [0.4, 0.35, 0.25]

# 生成选举模拟
results = np.random.multinomial(n, p)
print("每位候选人的得票数:", results)

这演示了多项分布如何在概率场景中使用 -

每位候选人的得票数:[48 31 21]

可视化多项分布

可视化是分析和解释数据的有效方法。使用 Matplotlib,我们可以绘制多项分布的结果以便更好地理解。

示例:多项结果的条形图

import numpy as np
import matplotlib.pyplot as plt

# 可视化结果
outcomes = ['结果 1', '结果 2', '结果 3', '结果 4']
frequencies = np.random.multinomial(50, [0.2, 0.3, 0.4, 0.1])

plt.bar(outcomes, frequencies, color='skyblue')
plt.title('多项分布可视化')
plt.xlabel('结果')
plt.ylabel('频率')
plt.show()

结果显示一个条形图,显示多项分布中每个结果的频率 -

多项分布

比较多项分布和二项分布

二项分布处理两种可能的结果(例如成功和失败),而多项分布则将其扩展到多种结果。

例如,二项分布可以模拟抛硬币,而多项分布可以模拟掷骰子或具有两种以上结果的分类数据。

主要区别

以下是多项分布和二项分布之间的主要区别−

  • 结果数量:二项式有两个结果,而多项式有更多结果。
  • 复杂性:多项式需要指定多个类别的概率。
  • 应用:多项式更适用于涉及分类数据的场景。

自定义多项式模拟

NumPy 允许通过调整试验次数、概率和生成样本的大小等参数来灵活地自定义模拟。

让我们看一个示例,其中我们模拟了具有不同概率的多个实验。

示例:具有不同概率的多个模拟

以下示例演示了调整概率如何影响结果 −

import numpy as np

# 自定义概率
probabilities = [
[0.5, 0.3, 0.2],
[0.4, 0.4, 0.2],
[0.6, 0.2, 0.2]
]

for p in probabilities:
results = np.概率.multinomial(20, p)
print(f"Probabilities: {p} => {p})结果:{results}")

执行上述代码后,我们得到以下输出 -

概率:[0.5, 0.3, 0.2] => 结果:[ 9 10  1]
概率:[0.4, 0.4, 0.2] => 结果:[ 4 12  4]
概率:[0.6, 0.2, 0.2] => 结果:[12  4  4]