爱吱声返回首页

库布其的个人空间 http://129.226.69.186/bbs/?539 [收藏] [复制] [分享] [RSS]

日志

如何估量还没有发生的事情发生的可能性

热度 19已有 1237 次阅读2018-11-17 09:39 |个人分类:杂谈

简单说，你观测一个事情，N次取样了，还没有观测到，那么你可以认为3/N是那个事情会发生的概率，而且这个概率有95%的可信度。

当然，随着N增加，你还是会逼近真相的。

例如，你连续观测100天了，还没有发生地震，你可以认为发生地震的概率是3/100。

不要问我为什么有95%的可信度，我没看懂。

刚表态过的朋友 (18 人)

收藏分享邀请举报

全部作者的其他最新日志

• 安省疫情更新-03-28
• 安省疫情：我觉得管控的效果显示出来了
• 安省疫情做了两个图表
• 我好喜欢这个女孩子
• 看美女帅哥了
• I want to tell you that I forgive you.

发表评论评论 (14 个评论)

回复煮酒正熟 2018-11-17 14:43: 纠错 --- 例如，你连续观测100天了，还没有发生地震，你可以认为发生地震的概率是3/100

不是概率是3/100，而是概率小于3/100

回复煮酒正熟 2018-11-17 14:51: 前面的还可以，但最后这段超出了我的数学知识，主要是没学过贝叶斯
Suppose you start with a uniform prior on p. The posterior distribution on p after having seen 0 successes and N failures has a beta(1, N+1) distribution. If you calculate the posterior probability of p being less than 3/N you get an expression that approaches 1 – exp(-3) as N gets large, and 1 – exp(-3) ≈ 0.95.

回复数值分析 2018-11-18 02:31: 煮酒正熟: 前面的还可以，但最后这段超出了我的数学知识，主要是没学过贝叶斯
Suppose you start with a uniform prior on p. The posterior distribution on p after havi ...
贝叶斯派和频率派最根本的区别是是否认为参数是一个随机变量。频率派认为参数（比如这里的地震发生概率）是一个虽然未知，但客观存在的具体数值。而贝叶斯派认为反正参数也是不可能知道的，不如也把他看作是一个随机变量吧。既然参数是个随机变量，就有分布。
于是贝叶斯推断是用（参数的）先验分布加观测数据校正，得到（参数的）后验分布。

具体到这个例子里，他应该是假设地震概率p的先验分布是均匀分布p~U【0，1】。对应与p等于某个具体值p0，观测N次有x次地震发生服从二项分布B（N,p0), 然后知道p服从均匀分布，把B（N，p0）对p0从0积分到1 得到边缘概率，这也就是为什么这里出现了beta分布。

然后从先验和观测数据倒腾后验，
pf(p=p0|X=0)=pb(X=0|p=p0)*pp(p=p0)/pm（X=0） ,pp是先验分布，就是均匀分布，所以这里是1.pm就是我们刚刚求出来的边缘分布，pb是最开始的二项分布，pf是后验分布。
然后就和频率派方法一样了，求后验分布的95%分位数，得到p0约等于3/N（我没具体算，应该差不多吧）

回复煮酒正熟 2018-11-18 04:31: 数值分析: 贝叶斯派和频率派最根本的区别是是否认为参数是一个随机变量。频率派认为参数（比如这里的地震发生概率）是一个虽然未知，但客观存在的具体数值。而贝叶斯派认为 ...
谢谢您的详尽解释。还是因为我高数基础不够，所以只能看懂第一段；第二段麻麻，第三段就不行了

回复库布其 2018-11-18 06:45: 招来两位行家，甚好

回复 smileREGENT 2018-11-18 14:44: 数值分析: 贝叶斯派和频率派最根本的区别是是否认为参数是一个随机变量。频率派认为参数（比如这里的地震发生概率）是一个虽然未知，但客观存在的具体数值。而贝叶斯派认为 ...
直接贝叶斯点估计吧，1/n+2

方便我这种只记公式的

回复数值分析 2018-11-18 22:30: smileREGENT: 直接贝叶斯点估计吧，1/n+2

方便我这种只记公式的
嗯，好，我们先不谈区间估计与点估计的区别，就说贝叶斯点估计吧。
比如我问，已知观测了N次，地震过1次，那么再多观测两次，这两次都不地震的概率有多大，你怎么进行点估计？

回复数值分析 2018-11-18 22:51: （居然不能回复自己的评论，再发个新的吧）
友情提示耗子同学两点：
第一点，根据后验分布进行参数点估计，常见的方法有三种，即选取
1.后验分布的众数（即后验密度最大的点）；
2.后验分布的中位数；
3.后验分布的期望（均值）；
作为参数的估计值。
顺便说一下，如果先验分布是均匀分布，那么第一种和最大似然估计是一样的，因为贝叶斯估计里的后验分布是：
p(a|X=x) = p(X=x|a)*pp(a)/(integral{p(X=x|a)*pp(a)da})

而似然函数是
L(X=x;a)
后验分布相当与似然函数加权平均（权重是先验分布pp(a)），如果是均匀分布，权重处处为1，和没做一样。最大似然估计是选似然函数最大值，显然方法1是选后验分布最大值，所以如果先验是均匀分布，两者一样。
但显然后验均值(方法3)的均方误差应该是最小的，所以方法3在一定条件下最优。

第二点，嗯，这其实是个陷阱，我先不说吧，喵喵喵。。。

回复 smileREGENT 2018-11-19 13:50: 数值分析: （居然不能回复自己的评论，再发个新的吧）
友情提示耗子同学两点：
第一点，根据后验分布进行参数点估计，常见的方法有三种，即选取
1.后验分布的众数（即后验 ...
容俺想想，晚上放学回来重新复习下统计

回复 smileREGENT 2018-11-19 23:12: 数值分析: （居然不能回复自己的评论，再发个新的吧）
友情提示耗子同学两点：
第一点，根据后验分布进行参数点估计，常见的方法有三种，即选取
1.后验分布的众数（即后验 ...
问题想不明白，向您请教，愿闻其详

回复数值分析 2018-11-20 00:21: smileREGENT: 问题想不明白，向您请教，愿闻其详
这个问题的关键是我们要估计的两次不发生地震的概率，(1-p)^2。但你不能套用公式，把p的估计的值直接带进去作为（1-p）^2估计的值。

如果你用后验的期望做点估计（就是上述方法3，也是你用的那个公式用的方法），那么参数a的估计的平方和参数a^2的估计是不一样的。就像随机变量期望的平方不等于随机变量平方的期望一样。这是这道题的陷阱。

我看到你直接用了二项分布的贝叶斯估计p=（x+1）/（N+2），我猜你应该没有搞清楚这个结果推导的整个思路，故有此问。如果你不清楚这个思路，即使你知道这道题问的是什么（（1-p）^2），你也不会用贝叶斯估计算出这个值，只能把p=（x+1）/（N+2）带入这里，得到错误答案。

出这个题就是专门整治只背公式，不了解公式来历的学生（耗子）。喵喵喵。。。

回复 smileREGENT 2018-11-20 12:28: 数值分析: 这个问题的关键是我们要估计的两次不发生地震的概率，(1-p)^2。但你不能套用公式，把p的估计的值直接带进去作为（1-p）^2估计的值。

如果你用后验的期望做点 ...
获益匪浅，等我晚上回来把课本拿出来再好好学学

回复数值分析 2018-11-20 13:24: smileREGENT: 获益匪浅，等我晚上回来把课本拿出来再好好学学
不过你不是医生么？怎么还有统计推断的课本呢？课外自学么？

回复 smileREGENT 2018-11-20 14:04: 数值分析: 不过你不是医生么？怎么还有统计推断的课本呢？课外自学么？
要学医学统计学

库布其

手机版|小黑屋|Archiver|网站错误报告|爱吱声

GMT+8, 2025-8-25 10:05 , Processed in 0.030215 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部