使用 Python 获取股票数据的最佳方法是什么?

pythonserver side programmingprogramming

在本文中,我们将学习使用 Python 获取股票数据的最佳方法。

yfinance Python 库将用于从 Yahoo Finance 检索当前和历史股票市场价格数据。

安装 Yahoo Finance(yfinance)

获取股票市场数据的最佳平台之一是 Yahoo Finance。只需从 Yahoo Finance 网站下载数据集,然后使用 yfinance 库和 Python 编程访问它即可。

您可以在 pip 的帮助下安装 yfinance,您所要做的就是打开命令提示符并键入以下命令以显示语法:

语法

pip install yfinance

yfinance 库最好的部分是,它可以免费使用,并且不需要 API 密钥

如何获取股票价格的当前数据

我们需要找到股票的股票代码,以便我们能够提取数据。我们将在以下示例中显示 GOOGL 的当前市场价格和前收盘价。

示例

以下程序使用 yfinance 模块返回市场价格值、前收盘价值、股票行情值 −

import yfinance as yf
ticker = yf.Ticker('GOOGL').info
marketPrice = ticker['regularMarketPrice']
previousClosePrice = ticker['regularMarketPreviousClose']
print('股票行情值:GOOGL')
print('市场价格值:', marketPrice)
print('前收盘价值:', previousClosePrice)

输出

执行时,上述程序将生成以下输出 -

股票代码值:GOOGL
市场价格值:92.83
前收盘价值:93.71

如何获取股票价格的历史数据

通过提供开始日期、结束日期和股票代码,我们可以获得完整的历史价格数据。

示例

以下程序返回开始和结束日期之间的股票价格数据 −

# 导入 yfinance 包
import yfinance as yf

# 提供开始和结束日期
startDate = '2015-03-01'
endDate = '2017-03-01'

# 设置股票代码值
ticker = 'GOOGL'

# 下载开始和结束之间的股票代码值数据日期
resultData = yf.download(ticker, startDate, endDate)

# 打印数据的最后 5 行
print(resultData.tail())

输出

执行时,上述程序将生成以下输出 -

[*********************100%***********************] 1 of 1 completed
            Open      High     Low       Close     Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000

上述示例将检索从 2015-03-01 到 2017-03-01 的股票价格数据。

如果您想同时从多个股票代码中提取数据,请将股票代码作为空格分隔的字符串提供。

转换数据以进行分析

日期是数据集的索引,而不是上述示例数据集中的列。您必须先将此索引转换为列,然后才能对其进行任何数据分析。以下是操作方法 -

示例

以下程序将列名添加到开始日期和结束日期之间的股票数据 -

import yfinance as yf

# 给出开始日期和结束日期
startDate = '2015-03-01'
endDate = '2017-03-01'

# 设置股票代码值
ticker = 'GOOGL'

# 下载开始日期和结束日期之间的股票代码值数据
resultData = yf.download(ticker, startDate, endDate)

# 将日期设置为索引
resultData["Date"] = resultData.index

# 给出列名
resultData = resultData[["Date", "Open", "High","Low", "Close", "Adj Close", "Volume"]]

# 重置索引值
resultData.reset_index(drop=True, inplace=True)

# 获取数据的前 5 行
print(resultData.head())

输出

执行时,上述程序将生成以下输出 -

[*********************100%***********************] 1 of 1 completed
   Date      Open       High     Low       Close     Adj Close  Volume

0 2015-03-02 28.350000 28.799500 28.157499 28.750999 28.750999 50406000
1 2015-03-03 28.817499 29.042500 28.525000 28.939501 28.939501 50526000
2 2015-03-04 28.848499 29.081499 28.625999 28.916500 28.916500 37964000
3 2015-03-05 28.981001 29.160000 28.911501 29.071501 29.071501 35918000
4 2015-03-06 29.100000 29.139000 28.603001 28.645000 28.645000 37592000

上述转换后的数据和我们从 Yahoo Finance 获取的数据完全相同

将获取的数据存储在 CSV 文件中

可以使用 to_csv() 方法将 DataFrame 对象导出到 CSV 文件。以下代码将帮助您将数据导出到 CSV 文件中,因为上述转换后的数据已在 pandas 数据框中。

# 使用别名导入 yfinance 模块
import yfinance as yf

# 给出开始和结束日期
startDate = '2015-03-01'
endDate = '2017-03-01'

# 设置股票代码值
ticker = 'GOOGL'

# 下载开始和结束日期之间的股票代码值数据
resultData = yf.download(ticker, startDate, endDate)

# 打印数据的最后 5 行
print(resultData.tail())

# 将上述数据导出/转换为 CSV 文件
resultData.to_csv("outputGOOGL.csv")

输出

执行时,上述程序将生成以下输出 -

[*********************100%***********************] 1 of 1 completed
            Open      High     Low       Close     Adj Close  Volume

Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000

可视化数据

yfinance Python 模块是最容易设置、收集数据和执行数据分析活动的模块之一。使用 Matplotlib、Seaborn 或 Bokeh 等软件包,您可以可视化结果并获取见解。

您甚至可以使用 PyScript 直接在网页上显示这些可视化效果。

结论

在本文中,我们学习了如何使用 Python yfinance 模块获取最佳股票数据。此外,我们还学习了如何获取指定时期的所有股票数据、如何通过添加自定义索引和列进行数据分析以及如何将这些数据转换为 CSV 文件。


相关文章