Page 121 - 高中 信息技术 必修1 数据与计算
P. 121
5.3 数据的分析
(4)求极差。
pricerg=pricemax-pricemin
commentrg=commentmax-commentmin
(5)求组距。
pricedst=pricerg/13
commentdst=commentrg/13
(6)绘制价格直方图。
pricesty=npy.arange(pricemin,pricemax,pricedst)
pyl.hist(da2[2],pricesty)
pyl.show( )
(7)绘制评论数直方图。
commentsty=npy.arange(commentmin,commentmax,commentdst)
pyl.hist(da2[2],commentsty)
pyl.show( ) 广东教育出版社
5.3.2 关联分析
关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物
中某些属性同时出现的规律和模式。关联分析的基本算法如下:
(1)扫描历史数据,并对每项数据进行频率次数统计。
(2)构建候选项集C1,并计算其支持度,即数据出现频率次数与总数的比。
(3)对候选项集的支持度进行筛选,筛选的数据项支持度应当不小于最小支持度,
从而形成频繁项集L1。
(4)对频繁项集L2进行连接生成候选项集C2,重复上述步骤,最终形成频繁K项集或
者最大频繁项集。
观 察
打开并运行教科书配套学习资源包“第五章\课本素材\程序5-4关联分析”,观察程
序的运行结果。程序5-4关联分析的关键过程及程序段如下:
(1)自定义连接函数,用于实现L_{k-1}到C_k的连接。
113113
9 ֻᅣ JOEE