06.Scikit-Learn教程

朋远方 • 2022年11月14日下午8:12 • 学习笔记 • 1239 views

建模案例

导入模块

from sklearn.neighbors import KNeighborsClassifier, NeighborhoodComponentsAnalysis  # 模型
from sklearn.datasets import load_iris  # 导入数据
from sklearn.model_selection import train_test_split  # 切分数据
from sklearn.model_selection import GridSearchCV  # 网格搜索
from sklearn.pipeline import Pipeline  # 流水线管道操作

from sklearn.metrics import accuracy_score  # 得分验证

模型实例化

# 模型实例化
knn = KNeighborsClassifier(n_neighbors=5)

训练模型

knn.fit(X_train, y_train)

测试集预测

y_pred = knn.predict(X_test)
y_pred  # 基于模型的预测值

得分验证

模型得分验证的两种方式：

knn.score(X_test,y_test)

accuracy_score(y_pred,y_test)

网格搜索

如何搜索参数

from sklearn.model_selection import GridSearchCV

# 搜索的参数
knn_paras = {"n_neighbors":[1,3,5,7]}
# 默认的模型
knn_grid = KNeighborsClassifier()

# 网格搜索的实例化对象
grid_search = GridSearchCV(
	knn_grid, 
	knn_paras, 
	cv=10  # 10折交叉验证
)
grid_search.fit(X_train, y_train)

# 通过搜索找到的最好参数值
grid_search.best_estimator_

grid_search.best_params_

grid_search.best_score_

基于搜索结果建模

knn1 = KNeighborsClassifier(n_neighbors=7)

knn1.fit(X_train, y_train)

通过下面的结果可以看到：网格搜索之后的建模效果是优于未使用网格搜索的模型

y_pred_1 = knn1.predict(X_test)

knn1.score(X_test,y_test)

accuracy_score(y_pred_1,y_test)

06.Scikit-Learn教程

06.Scikit-Learn教程

5 / 5
1
2
3
4
5

原创文章，作者：朋远方，如若转载，请注明出处：https://caovan.com/06-scikit-learnjiaocheng/.html

algorithm algorithmic python sklearn 机器学习算法交易Algorithm Trading

Like (0)

Donate

微信扫一扫

0 0

05.金融特征工程

Previous 2022年11月14日上午11:27

07.理解线性回归与梯度下降并做简单预测

Next 2022年11月14日下午9:46

互联网技术

Ubuntu安装 phpmyadmin + Nginx

006850

朋远方
2024年10月12日
人工智能

vLLM的参数列表及其中文说明

003.3K0

朋远方
2025年3月12日
AI绘画

VideoReTalking对嘴型AI工具windows本地部署教程

01534.1K0

朋远方
2023年9月10日
AI绘画

Stable Diffusion常用提示词模板

283.4K0

朋远方
2023年7月5日
学习笔记

Linux常用操作之拷贝和移动文件

003090

朋远方
2022年8月25日
学习笔记

ChatGLM3-6B本地部署教程

003.5K0

朋远方
2023年12月1日

发表回复

Please Login to Comment