05.金融特征工程

特征工程的重要性

特征工程是机器学习中非常重要的一步。特征工程是指将人工特征设计到算法中的过程。然后该算法使用这些人工特征来提高其性能,或者换句话说,获得更好的结果。数据科学家大部分时间都花在数据上,使模型准确变得很重要。

05.金融特征工程

当特征工程活动正确完成时,生成的数据集是最佳的,并且包含影响业务问题的所有重要因素。由于这些数据集,产生了最准确的预测模型和最有用的见解。


这就是特征工程的全部。

因此,在我们的案例中,我们将创建一些技术指标,

首先是我们自己创建,然后是使用现成的技术分析库。

获取股票价格

首先要安装本文中需要用到的一些库:

google colab环境版命令(本地环境+jupyter也是同样的命令):

!pip install yfinance
!pip install ta

本地环境+pycharm版命令(在终端输入):

pip install yfinance
pip install ta

导入必要的库:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.style.use('seaborn')
import warnings
warnings.filterwarnings('ignore')
import yfinance as yf

导入谷歌股票数据作为案例:

df = yf.download('GOOG')
df.columns

如果是科学上网,则用如下命令导入谷歌数据,端口号根据您自己的科学上网代理端口而定:

df = yf.download('GOOG', proxy="http://127.0.0.1:7890")
df.columns

然后要重命名这些列。为什么?因为当你要做一些特征工程时,例如你创建一个函数来完成所有的特征工程过程,你需要做一些统一标准的工作。

如果您只使用股票价格,则需要对这些列统一名称。例如,这里我选择了将收盘价列统一名称为“close”

在雅虎财经中,叫“Adj Close”。在 MetaTrader 5 中名称是“Close”,如果你使用其他平台,可能还有其他不同的名称。因此统一标准很重要,这里我们是将所有的股票价格都命名为“close”。

df = df[['Adj Close']]
df.columns = ['Close']
df
05.金融特征工程

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/05-jinrongtezhenggongcheng/.html

Like (0)
Donate 微信扫一扫 微信扫一扫
朋远方的头像朋远方
Previous 2022年11月13日 下午3:42
Next 2022年11月14日 下午8:12

相关推荐

发表回复

Please Login to Comment