特征工程的重要性
特征工程是机器学习中非常重要的一步。特征工程是指将人工特征设计到算法中的过程。然后该算法使用这些人工特征来提高其性能,或者换句话说,获得更好的结果。数据科学家大部分时间都花在数据上,使模型准确变得很重要。
当特征工程活动正确完成时,生成的数据集是最佳的,并且包含影响业务问题的所有重要因素。由于这些数据集,产生了最准确的预测模型和最有用的见解。
这就是特征工程的全部。
因此,在我们的案例中,我们将创建一些技术指标,
首先是我们自己创建,然后是使用现成的技术分析库。
获取股票价格
首先要安装本文中需要用到的一些库:
google colab环境版命令(本地环境+jupyter也是同样的命令):
!pip install yfinance !pip install ta
本地环境+pycharm版命令(在终端输入):
pip install yfinance pip install ta
导入必要的库:
import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.style.use('seaborn') import warnings warnings.filterwarnings('ignore') import yfinance as yf
导入谷歌股票数据作为案例:
df = yf.download('GOOG') df.columns
如果是科学上网,则用如下命令导入谷歌数据,端口号根据您自己的科学上网代理端口而定:
df = yf.download('GOOG', proxy="http://127.0.0.1:7890") df.columns
然后要重命名这些列。为什么?因为当你要做一些特征工程时,例如你创建一个函数来完成所有的特征工程过程,你需要做一些统一标准的工作。
如果您只使用股票价格,则需要对这些列统一名称。例如,这里我选择了将收盘价列统一名称为“close”
在雅虎财经中,叫“Adj Close”。在 MetaTrader 5 中名称是“Close”,如果你使用其他平台,可能还有其他不同的名称。因此统一标准很重要,这里我们是将所有的股票价格都命名为“close”。
df = df[['Adj Close']] df.columns = ['Close'] df
原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/05-jinrongtezhenggongcheng/.html