如何在 Python 中将列表转换为 DataFrame 行?
Python 是一种高级、多功能的编程语言,近年来越来越受欢迎,部分原因是它能够轻松处理大量数据。Python 生态系统中处理数据的最强大工具之一是 pandas 库,它提供了易于使用的数据结构,如 DataFrame 和 Series。
在本教程中,我们将重点介绍数据分析中的一项常见任务:使用 pandas 在 Python 中将列表转换为 DataFrame 行。对于任何使用 Python 处理数据的人来说,这都是一项必备技能,因为它允许您快速轻松地将新数据行添加到 DataFrame。在本文的后续部分中,我们将逐步指导您完成将列表转换为 DataFrame 行的过程。
如何在 Python 中将列表转换为 DataFrame 行?
要将列表转换为 DataFrame 行,我们将使用 Panda 的库。首先,确保我们的系统上安装了 pandas。
Pandas 安装
要安装 pandas,您可以使用名为 pip 的 Python 包管理器,可以通过命令提示符或终端访问它。为此,只需输入下面提供的命令即可。
pip install pandas
上述命令将在您的系统上下载并安装最新版本的 Pandas。安装完成后,我们可以使用它来将列表转换为 DataFrame 行。
将列表转换为 DataFrame 行
要将列表转换为 DataFrame 行,我们首先需要创建一个包含要添加的数据的列表。此列表应包含与 DataFrame 中的列数相同的元素数。假设我们有一个包含三列的 DataFrame - "姓名"、"年龄"和"城市"。
考虑以下代码片段来为新行创建一个数据列表:
new_row_data = ['Prince', 26, 'New Delhi]
我们流程中的下一个关键步骤是生成一个全新的 DataFrame 对象,该对象复制我们现有 DataFrame 的列名。确保列名匹配对于使用 pandas 有效地将新行附加到 DataFrame 至关重要。
为了实现这一点,我们可以创建一个空的 DataFrame,其列名与原始 DataFrame 完全相同。
df = pd.DataFrame(columns=['Name', 'Age', 'City'])
现在我们已经创建了一个具有适当列名的新空 DataFrame,是时候向其中添加一些数据了。我们可以通过使用 DataFrame 对象的"append"方法来实现这一点,该方法允许我们将新行数据附加到现有 DataFrame。为此,我们需要将一个 pandas Series 对象传递给表示新数据行的"append"方法。
为了避免覆盖 DataFrame 中的任何现有行,我们必须在附加新行时传递"ignore_index=True"参数。这可确保新行作为具有唯一索引号的全新行附加。
考虑以下代码,使用 append 方法将新行附加到我们的数据框中。
import pandas as pd # 为新行创建数据列表 new_row_data = ['Prince', 26, 'New Delhi'] # 创建一个具有正确列名的新空 DataFrame df = pd.DataFrame(columns=['Name', 'Age', 'City']) # 将新行附加到 DataFrame df = df.append(pd.Series(new_row_data, index=df.columns), ignore_index=True) # 打印更新的 DataFrame print(df)
在上面的代码中,我们首先导入 pandas 库。接下来,我们创建一个名为"new_row_data"的列表,其中包含我们想要作为新行添加到 DataFrame 的值。然后,我们创建一个名为"df"的新空 DataFrame 对象,其列名与现有 DataFrame 相同。
接下来,我们使用 DataFrame 对象的"append"方法将新行附加到 DataFrame。我们将一个 pandas Series 对象传递给"append"方法,它代表我们的新数据行。我们使用"ignore_index=True"参数来确保新行作为具有新索引号的新行附加,而不是覆盖现有行。
最后,我们打印更新后的 DataFrame 以确认我们的新行已成功添加。
输出
Name Age City 0 Prince 26 New Delhi
如您在上面的输出中看到的,DataFrame 形式的结构化数据集由一行和三列组成,每列都有各自的标签。列标签分别为"姓名"、"年龄"和"城市"。
结论
在本教程中,我们学习了如何使用 Pandas 库在 Python 中将列表转换为 DataFrame 行。我们首先确保系统上安装了 pandas,然后创建一个列表,其中包含我们想要作为新行添加到 DataFrame 的数据。然后,我们创建一个新的空 DataFrame 对象,其列名与现有 DataFrame 相同,并使用"append"方法附加了新的数据行。我们使用"ignore_index=True"参数来确保新行作为具有新索引号的新行附加,而不是覆盖现有行。我们为过程中使用的每种方法提供了一个示例。