pandas 中的数据表如何表示?
pandasserver side programmingprogramming更新于 2025/4/5 14:22:17
为了在 pandas 中表示数据表,我们在 pandas 中有一个类似表格的对象,即 DataFrame。 DataFrame 是 pandas 中的二维数据结构,这些数据结构可以以列和行表示形式存储任何类型的数据。
示例
df = pd.DataFrame({"Name": ["Harris","William","Elizabeth",],"Age": [22, 35, 58],"Sex": ["male", "male", "female"],}) print(df)
解释
这里我们使用 DataFrame 对象手动在 pandas 中创建了一个数据表,数据是一个列表字典。在创建表格数据时,我们仅提到了列标签,但并未提到任何行标签(索引值)。但您可以在下面的输出块中看到标签值。
输出
Name Age Gender 0 Harris 22 male 1 William 35 male 2 Elizabeth 58 female
在输出数据表中,共有 3 列,分别标有姓名、年龄和性别名称,还有 3 行,分别标有 0、1、2 索引值。这些索引值是自动创建的值,列名由 use 明确定义(字典中的键名称作为列名)。
我们可以看到,Pandas DataFrame 创建的数据表看起来与电子表格和 SQL 表非常相似。
DataFrame 中的每一列都是一个 pandas Series 对象。它只有一列和多行带有索引标签。
示例
print(df.Name)
解释
我们可以通过使用 df.name of column 语法从我们的 DataFrame (df) 中获取单个列名。结果 pandas Series 对象如下所示。
输出
0 Harris 1 William 2 Elizabeth Name: Name, dtype: object
表格数据 (df) 的名称列中的 3 行数据。此系列的数据类型为 object dtype。
这样,pandas 将使用 pandas DataFrame 对象表示表格数据。