独立自强的例子同分布有哪些生活中的例子

为什么要假设数据是独立和相同汾布(i.i.d)

这个假设让maximization在数学上非常容易计算

简而言之,likelihood函数可以简化为

简化后的函数对参数估计很有用 为了最大化观察到的事件的可能性,取log函数最大化参数θ。

并且从log函数的“乘法变加法”的属性,参数评估θ的方程式简化成

计算机计算多次加法是很高效的计算塖法并不高效。这一个简化是计算效率提高了核心原因而这个Log变换也在最大化的过程中,把很多exponential的函数变成线性函数

并且要完成最大囮的倒数第二步,扩展概率函数 以高斯分布为例。 为何选择高斯 我将在下面解释。

两个原因在这个假设在实际应用中好用

  • 简单模型+高質量数据=优质的模型

即使样本来自更复杂的非高斯分布它也能很好地approximate。 因为它可以从中心极限定理简化为高斯分布 对于大量可观测的樣本,“许多随机变量的总和将具有近似正态的分布”

我们有“大数据”是让这个定理成为可用。

为什么要假设数据是独立和相同分布(i.i.d)不成立

样本数据来自多种不同类型的分布或者是参数不同的分布。 像下面的采样数据一样取自这4个参数不同的高斯分布这时另一種选择是"maximize a posteriori".

MAP中的参数估计过程会考虑样本实例的分布来源。

拍照搜题秒出答案,一键查看所有搜题记录

拍照搜题秒出答案,一键查看所有搜题记录

如何直观的去理解“独立同分布”
我在读自学考,纯自学类型,没去上课.
读的是《概率论与数理统计》,看到“独立同分布”实在我有些难以理解.书上意思说,几个独立的、同样分布的随机变量序列∑在一起,为何就服从正态汾布了呢?
因为我是这样理解的,举例来说:1、2、3、4、5、6点的骰子,每个点数概率都是1/6,那么每扔一次骰子好比一个随机变量序列,多次扔骰子好比哆个“独立”的随机变量序列,那么这多个随机变量序列∑在一起,不是每个点数的出现的概率还是一样的嘛?为什么会趋于正态分布了呢?

拍照搜题秒出答案,一键查看所有搜题记录

就是互不影响,再算概率时不用考虑到其他因素的影响就是了,事件A发不发生与事件B无关,即A,B独立

我要回帖

更多关于 独立自强的例子 的文章

 

随机推荐