设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 4398|回复: 2
打印 上一主题 下一主题

[科普知识] 本福特定律验证疫情数据

[复制链接]
  • TA的每日心情

    2024-12-7 02:20
  • 签到天数: 389 天

    [LV.9]渡劫

    跳转到指定楼层
    楼主
     楼主| 发表于 2020-2-13 10:00:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    YouTube有一期李永乐老师教大家用本福特定律验证淘宝双十一数据是否作假的视频,我看了以后有点心得。
      t8 B* c5 e+ K4 o, f觉得用来验证一下现在的疫情数据可能有些参考意义: l$ F. o6 f3 @) T8 H* S- J* g

    " M. r/ ^& G  K* o) P, i' S" c* N! Q% }: G4 m- u+ O
    什么是本福特定律
    ! Y: k1 }; }; t3 W6 k- D**********************3 Y: \! [% Y* E% Z  @/ R( B' N/ @; d
    1935年的某一天,物理学家富兰克.本福特(Frank.Benford)在图书馆查阅资料,他在翻阅对数表时,发现对数表的头几页要比后面的页脏一些。; A9 V1 m& N. s9 u6 |$ N
    话说聪明的脑袋是一样的,愚笨的脑袋各式各样。牛顿的脑袋被苹果砸中,于是发现了万有引力。本福特也是如此,他拍了一下脑袋,发现了“本福特定律”。5 u" X. M  j# L: v5 g
    对数表的前几页比后面的脏,这说明有更多的人查阅头几页,这说明以1、2、3开头的数据比7、8、9开头的数据多。
      m  D# n% P6 m' \$ g本福特搜集了人口、地理、经济等许多统计数据进一步分析,发现自然数据源,只要样本足够多,数据中以1为打头的数字出现的频率并不是1/9,而是30.1%。以2开头的数字出现的频率是17.6%。往后出现频率依次减少,以9为首的数字出现的频率最低,只有4.6%。
    ( Z% o2 k* S$ C' [# @& p
    数字
    出现频率
    # r: ?# a( g, U  r/ v, |2 u
    1
    0.301

    . |! `+ O, Q3 Y: ^& V, v" p
    2
    0.176
    , w' A) @9 {& r; o7 ]
    3
    0.125

    ; O! H( C' c/ C/ D& k* c
    4
    0.097

    : n4 g; ^( C& T) o/ ^: H: c
    5
    0.079
    ! F9 J% n, z3 o" f( s$ v
    6
    0.067
    1 F! R! v9 {# T( d: W+ O: m
    7
    0.058
    8 b( m$ Y7 J3 ~; H, Y* y5 V
    8
    0.051
    / t1 g+ y5 J  m: A6 S; m
    9
    0.046

    3 ?. w! e, U8 ~- r2 L
    合计
    1.000
    本福特定律的应用条件是:  @+ q9 q( K* U
    1.数据不能是规律排序的。9 e; }" z3 G& v3 V( c* s/ _) {
    2.数据不能经过人为修饰。* C" x0 Q: X  g, X8 G9 S2 x' @
    & @: q% g" k9 D4 X
    ************************************
    * [* T3 {3 q& Z
    % X3 N" V( j, X2 s3 A7 g2 q
    3 g8 n% }- _6 R, b, ~' z' v3 L) T4 N  G4 X9 M! r
    我从网上找到了一个疫情数据的统计表,刨去了比例计算的列,统计了其他数据里面首位出现的次数,粗粗比较一下两个数据的柱状图,感觉拟合是不错的。结论是疫情数据看不出有造假的痕迹。
    $ Z. d6 ~+ j% N. K* D; E& I# P) W! N0 D$ D. i) E
    8 B- \$ x+ d2 a' s9 Q4 i0 i8 d7 J  Z
    ! `: \# [2 N! q# f- @
    原始数据表
    8 [2 t  X' j2 H; a" s. j3 K
    ( u' {1 h, e& G3 i7 Z- ?

    评分

    参与人数 8爱元 +52 收起 理由
    常挨揍 + 10
    莱茵河 + 6
    馒头笼子 + 4
    南京老萝卜 + 2 涨姿势
    MacArthur + 8 涨姿势

    查看全部评分

  • TA的每日心情
    奋斗
    2025-7-1 17:22
  • 签到天数: 2652 天

    [LV.Master]无

    沙发
    发表于 2020-2-13 10:29:34 | 只看该作者
    拟合如何应该有检验指标以及参照的critical value?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2024-12-7 02:20
  • 签到天数: 389 天

    [LV.9]渡劫

    板凳
     楼主| 发表于 2020-2-13 11:51:33 | 只看该作者
    龙血树 发表于 2020-2-12 18:29
    9 ~7 C5 \# W: [9 G9 v& N; K拟合如何应该有检验指标以及参照的critical value?

    2 Q+ g0 N2 Q* k. p等明天上班后算一下correlation coefficient 和 p
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-9-12 20:46 , Processed in 0.040211 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表