Page 121 - 高中 信息技术 必修1 数据与计算
P. 121

 5.3 数据的分析







                         (4)求极差。

                           pricerg=pricemax-pricemin
                           commentrg=commentmax-commentmin


                         (5)求组距。


                          pricedst=pricerg/13
                          commentdst=commentrg/13


                         (6)绘制价格直方图。

                          pricesty=npy.arange(pricemin,pricemax,pricedst)
                          pyl.hist(da2[2],pricesty)

                          pyl.show( )


                         (7)绘制评论数直方图。

                          commentsty=npy.arange(commentmin,commentmax,commentdst)
                          pyl.hist(da2[2],commentsty)
                          pyl.show( )        广东教育出版社





                      5.3.2  关联分析




                         关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物

                    中某些属性同时出现的规律和模式。关联分析的基本算法如下:
                         (1)扫描历史数据,并对每项数据进行频率次数统计。
                         (2)构建候选项集C1,并计算其支持度,即数据出现频率次数与总数的比。
                         (3)对候选项集的支持度进行筛选,筛选的数据项支持度应当不小于最小支持度,

                    从而形成频繁项集L1。
                         (4)对频繁项集L2进行连接生成候选项集C2,重复上述步骤,最终形成频繁K项集或
                    者最大频繁项集。



                         观 察


                         打开并运行教科书配套学习资源包“第五章\课本素材\程序5-4关联分析”,观察程
                    序的运行结果。程序5-4关联分析的关键过程及程序段如下:
                         (1)自定义连接函数,用于实现L_{k-1}到C_k的连接。





                                                                                                                    113113







            9      ֻ໴ᅣ JOEE
   116   117   118   119   120   121   122   123   124   125   126