朴素贝叶斯
朴素贝叶斯之所以被称为朴素: 是因为特征向量中, 每个维度都是相互独立的, 这种假设是朴素贝叶斯理论的思想基础.
信息与信息量
概率是对事件确定性的度量, 信息就是对事件不确定性的度量, 信息量化度量问题, 就是对不确定性进行度量的问题.
信息量定义为对不确定性的度量: I(X)=−logP(X)
信息熵
信息熵为对平均不确定性的度量, 离散随机变量X的信息熵H(X)定义为
H(X)=X∑P(X)logP(X)1=−X∑P(X)logP(X)
信息熵是对随机变量不确定性的度量. 熵越大, 不确定性越大. 定值的熵为0.
互信息