Page 113 - 高中 信息技术 必修1 数据与计算
P. 113
5.2 数据的采集
拓 展
Python网络数据采集程序使用的扩展库
在众多的数据采集工具中,Python以其简洁、开源和包容的特性在数据采集和分析领
域独树一帜。由于Python可以安装第三方扩展库模块来扩展功能,因此使用Python进行网
络数据采集和分析显得简单易用。以下是使用Python进行网络数据采集和分析所需要的一
些第三方扩展库。
(1)NumPy。
NumPy(Numerical Python)是构建科学计算最基础的软件库,为Python中的n维数组
广东教育出版社
和矩阵的操作提供了大量有用的功能。该库还提供了NumPy数组类型的数学运算向量化,
可以提升性能,加快执行速度。
(2)SciPy。
SciPy是一个工程和科学软件库,包含线性代数、优化、集成和统计的模块。SciPy库
的主要功能建立在 NumPy 的基础之上,因此它的数组大量使用了NumPy。它通过其特定
的子模块提供高效的数值例程操作,如数值积分等。SciPy的所有子模块中的函数都有详细
的介绍文档。
(3)Pandas。
Pandas是一个Python包,旨在通过标记(labeled)和关系(relational)数据进行工作,
简单直观。Pandas主要用于快速简单的数据操作、聚合和可视化呈现。库中有两个主要的
数据结构,一维数组(Series)和二维数组(DataFrame)结构。
(4)Matplotlib。
Matplotlib是Python的一个2D绘图库,以各种硬拷贝格式和跨平台的交互式环境生成
出版质量级别的图形。在NumPy、SciPy和Pandas的帮助下,通过 Matplotlib,开发者仅需
输入几行代码,便可以生成绘图、直方图、功率谱、条形图、散点图等。
在Python模块库中有大量模块可供使用,要想使用这些文件,就需要用import语句把
指定模块导入当前程序中。使用import语句导入模块的语法如下:
import module
关键字 模块名
from import语句也是导入模块的一种方法,是导入指定模块内的指定函数方法。使用
from import语句导入模块内指定方法的语法如下:
from module import name
关键字 模块名 关键字 方法名
体 验
打开并运行配套学习资源包“第五章\课本素材\程序5-1”文件,其截图如图5-5所
示,指出程序中import语句的作用。
105105
9 ֻᅣ JOEE