贝叶斯公式和贝叶斯模型的关系
贝叶斯公式
$$p(\theta | y) \propto p(y | \theta)p(\theta)$$
初学贝叶斯公式时,一般的例子是这样的:
- 如果全世界随便找一个人,他的投篮命中率概率分布如何?现在如果你知道了这个人是NBA球员,他的投篮命中率概率分布又如何?
- 如果你在Switch的eShop买了一个游戏,这个游戏的好玩程度的概率分布如何?现在如果你知道了这个游戏是任天堂第一方作品,这个游戏的好玩程度的概率分布又如何?
抽象的说:就是对于大范围的随机找出一个人或者一个物品,我们关心他的某一个特征的分布,如果我们了解了更多的信息,缩小了讨论的范围,减少了候选项,那么我们关心的这个特征的分布会如何随之变化。
贝叶斯模型
贝叶斯模型利用了贝叶斯公式,只不过之前关心的是一个人或者一个物品,现在变成了抽象的概念,比如,正态分布的两个参数。
一般的例子是这样的:我们假设智商是符合正态分布,但不明确知道这个正态分布的均值和标准差。这里的均值和标准差,就是之前的投篮命中率或者游戏的好玩程度。而正态分布对应的就是之前的随机的一个人或者一款游戏。而后来我们得到的信息,就是观察了一些现象,比如,我们找到了100个人,测量了智商,我们并不会完整的知道智商的正态分布是什么?但是这个正态分布参数的分布我们了解的更多更准确了。
贝叶斯公式的流程
- 在一个大的范围(全世界所有人),找到一个关心的特征(投篮命中率如何),并找到这个特征的分布,称之为先验,prior
- 把范围缩小(NBA的球员),特征的分布随之剧烈改变,我们想要的就是这个后来的特征,称之为后验,posterior
贝叶斯模型的流程
- 假设人或物体的某个特征(智商)符合某种分布(正态分布),但是不知道这个分布参数的具体值
- 假设这些参数符合某种分布(正态分布或者伽马分布),称之为先验
- 观测到一些实际的案例样本(检测了随机100个人的智商)
- 这些观察,让这些参数的分布有所变化,称之为后验
无论贝叶斯公式还是贝叶斯模型,一般都是通过先验,求出后验。不同的,就是初学贝叶斯公式时,一般都是具体事物的特征,而贝叶斯模型更关心的是某个分布的参数。一个具象,一个抽象。