03.用于数据科学的 Python 基础知识之matplotlib(上)

简介

Matplotlib 是 Python 中最受欢迎的数据可视化软件包之一,支持跨平台运行,它是 Python 常用的 2D 绘图库,同时它也提供了一部分 3D 绘图接口。Matplotlib 通常与 NumPy、Pandas 一起使用,是数据分析中不可或缺的重要工具之一。

03.用于数据科学的 Python 基础知识之matplotlib(上)
Matplotlib 图标

Matplotlib 是 Python 中类似 MATLAB 的绘图工具,如果您熟悉 MATLAB,那么可以很快的熟悉它。Matplotlib 提供了一套面向对象绘图的 API,它可以轻松地配合 Python GUI 工具包(比如 PyQt,WxPython、Tkinter)在应用程序中嵌入图形。与此同时,它也支持以脚本的形式在 Python、IPython Shell、Jupyter Notebook 以及 Web 应用的服务器中使用。

如果将文本数据与图表数据相比较,人类的思维模式更适合于理解后者,原因在于图表数据更加直观且形象化,它对于人类视觉的冲击更强,这种使用图表来表示数据的方法被叫做数据可视化。

03.用于数据科学的 Python 基础知识之matplotlib(上)
数据可视化

当使用图表来表示数据时,我们可以更有效地分析数据,并根据分析做出相应的决策。

数据可视化

图表为更好地探索、分析数据提供了一种直观的方法,它对最终分析结果的展示具有重要的作用。

数据可视化是一个新兴名词,它表示用图表的形式对数据进行展示。当您对一个数据集进行分析时,如果使用数据可视化的方式,那么您会很容易地确定数据集的分类模式、缺失数据、离群值等等。下图展示了五个常用的数据可视化图表:

03.用于数据科学的 Python 基础知识之matplotlib(上)
数据可视化常用图表

对于组织决策者而言,数据可视化也只是一种辅助工具,从寻找数据间关联到最终做出决定,大致分为以下四步。如下图所示:

03.用于数据科学的 Python 基础知识之matplotlib(上)
组织者决策流程图

下面对图 3 中的流程进行简要说明:

  • 可视化(Visualize):使用不同种类的图表对原始数据进行可视化处理,使复杂的数据更容易理解与使用;
  • 分析(Analysis):数据分析的目的是获取有用的信息,这个过程主要涉及对数据的清洗、检查、转换以及对数据的建模;
  • 文档说明(Document insight):文档说明属于整理、汇总阶段,将有用的数据或者信息整理出来;
  • 数据集转换(Transform Data Set):指将数据进行分类、分级、统计记录格式与编码格式等。

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/03-yongyushujukexuede-python-jichuzhishizhimatplotlib/.html

Like (0)
Donate 微信扫一扫 微信扫一扫
朋远方的头像朋远方
Previous 2022年11月12日 下午3:39
Next 2022年11月13日 上午11:29

相关推荐

发表回复

Please Login to Comment