|
|
本帖最后由 Menuett 于 2013-12-22 15:59 编辑 ( X# P! K# O; }. T
煮酒正熟 发表于 2013-12-20 12:05 - T0 v, ?8 q( G3 w- e
基本可以说是显著的。总的来说,在商界做统计学分析,95%信心水平是用得最多的,当95%上不显著时,都会去 ... 7 ^$ `: [5 |2 n2 M0 g6 _
% [ f9 y: I7 p% l4 x
这个其实是一种binomial response,应该用Contigency Table或者Logisitic Regression(In case there are cofactors)来做。只记比率丢弃了Number of trial的信息(6841和1217个客户)。 . |6 K2 r' Z# q% X9 j" e1 x# x
9 y. O% e3 Q- y0 P
结果p=0.5731。 远远不显著。要在alpha level 0.05的水平上检验出76.42%和75.62%的区别,即使实验组和对照组各自样本大小相同,各自尚需44735个样本(At power level 80%)。see: Statistical Methods for Rates and Proportions by Joseph L. Fleiss (1981) j/ S ~' F# M. s K: J
5 u$ m( \, h, q% k- FR example:& F, k2 u E" s3 f
7 h$ Z' |2 f5 q% V) g
> M<-as.table(rbind(c(1668,5173),c(287,930)))
! @ w& U1 c3 g$ [5 [! H> chisq.test(M)
6 ?1 W; E$ N* H" l
3 g: N+ B' U. K$ d7 ? Pearson's Chi-squared test with Yates' continuity correction( T/ s5 m) @1 D, y2 Y9 P1 Z
) x" A V% y Q/ q: Q' v. h- Rdata: M
, h: S) T) G D' K& AX-squared = 0.3175, df = 1, p-value = 0.5731
# o; `7 x. V' y+ C: I& `6 h. l3 s& N" Z$ \7 w$ {
Python example:
( k7 [1 `! j' N" l, k3 q1 q% S6 \0 A6 e) c
>>> from scipy import stats" h' L7 n2 @- _: V# n/ m, Y
>>> stats.chi2_contingency([[6841-5173,5173],[1217-930,930]])
6 w3 u: v$ T# R0 j O/ [% Y, `(0.31748297614660292, 0.57312422493552839, 1, array([[ 1659.73628692, 5181.26371308],
$ K, i3 |% e( N [ 295.26371308, 921.73628692]])) |
|