Page 120 - 高中 信息技术 必修1 数据与计算
P. 120

第五章  数据处理和可视化表达






                        5.3.1  特征探索





                           数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制
                      直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。



                               探究活动



                           实 践

                             price=data2.values[2] 广东教育出版社
                           打开并运行配套学习资源包“第五章\课本素材\程序5-3数据预处理”,观察数据预处
                      理结果。程序5-3数据预处理的关键过程及部分程序段如下:
                           (1)数据清洗,发现缺失值。



                             x=0
                             data["price"][(data["price"]==0)]=None
                             for i in data.columns:
                                 for j in range(len(data)):

                                     if(data[i].isnull())[j]:
                                         data[i][j]="64"
                                         x+=1

                             print(x)



                           (2)异常值处理中,利用画散点图发现异常值部分。


                             data2=data.T



                             comt=data2.values[3]
                             pyl.plot(price,comt,"o")
                             pyl.show( )



                           (3)求最大值和最小值。


                             pricemax=da2[2].max( )
                             pricemin=da2[2].min( )
                             commentmax=da2[3].max( )

                             commentmin=da2[3].min( )




             112 112







            9      ֻ໴ᅣ JOEE
   115   116   117   118   119   120   121   122   123   124   125