Page 125 - 高中 信息技术 必修1 数据与计算
P. 125
5.3 数据的分析
(续表)
客户 特征A 特征B 特征C
普通客户 165.2 58.9 25
普通客户 175.2 68.0 27
根据表5-4的资料,得到一个已分类的样本子集:
X=[[182.8,81.6,30],[180.4,86.1,29],[170.0,77.1,30],[180.4,74.8,28],[152.4,45.3,24],[167.6,68.0,26],
[165.2,58.9,25],[175.2,68.0,27]]和Y=[1,1,1,1,0,0,0,0](1代表重要客户,0代表普通客户)。
打开教科书配套学习资源包“第五章\课本素材\程序5-6”文件,把已分类的样本
子集(X,Y)和测试样本[182.8,58.9,26]输入到程序5-6中,具体(高斯朴素贝叶斯)如
广东教育出版社
下:
程序5-6
import numpy as np
X=np.array([[182.8,81.6,30],[180.4,86.1,29],[170.0,77.1,30],[180.4,74.8,28],
[152.4,45.3,24],[167.6,68.0,26],[165.2,58.9,25],[175.2,68.0,27]])
Y=np.array([1,1,1,1,0,0,0,0])
from sklearn.naive_bayes import GaussianNB
clf=GaussianNB().fit(X,Y)
print(clf.predict([[182.8,58.9,26]]))
运行程序5-6后,得到结果为:[0]。由此可以判断这人为普通客户。
程序5-6使用语句from sklearn.naive_bayes import GaussianNB调用了sklearn.naive_bayes模
块,使得程序简单明了。
拓 展
贝叶斯与概率分类
贝叶斯(Thomas Bayes, 1701—1761),英国数学家,发明了概率统计学原理,将归纳
推理法用于概率论基础理论,创立了贝叶斯统计理论,对统计决策函数、统计推断、统计
的估算等做出了贡献。
在概率统计理论中,条件概率是指事件A在另外一个事件B已经发生条件下的发生概
率,表示为P(A|B),读作“在B的条件下A的概率”。贝叶斯发现在事件B出现的前提下
事件A出现的概率,等于事件A出现的前提下事件B出现的概率乘以事件A出现的概率再除
以事件B出现的概率。这就是著名的贝叶斯定理。具体计算公式为:
P(B|A)P(A)
P(A|B) =
P(B)
117117
9 ֻᅣ JOEE