Page 120 - 高中 信息技术 必修1 数据与计算
P. 120
第五章 数据处理和可视化表达
5.3.1 特征探索
数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制
直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。
探究活动
实 践
price=data2.values[2] 广东教育出版社
打开并运行配套学习资源包“第五章\课本素材\程序5-3数据预处理”,观察数据预处
理结果。程序5-3数据预处理的关键过程及部分程序段如下:
(1)数据清洗,发现缺失值。
x=0
data["price"][(data["price"]==0)]=None
for i in data.columns:
for j in range(len(data)):
if(data[i].isnull())[j]:
data[i][j]="64"
x+=1
print(x)
(2)异常值处理中,利用画散点图发现异常值部分。
data2=data.T
comt=data2.values[3]
pyl.plot(price,comt,"o")
pyl.show( )
(3)求最大值和最小值。
pricemax=da2[2].max( )
pricemin=da2[2].min( )
commentmax=da2[3].max( )
commentmin=da2[3].min( )
112 112
9 ֻᅣ JOEE