爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 , }* A' X4 i! ~$ ~" [% X% Z6 i" ]
0 X$ G: j+ y' L* R1 U
其实是个概率问题。+ q. [* I0 H- ]" E/ l) _9 g% a7 \
那本CLRS算法导论中,第 5-2 练习题。
3 L4 s% Q) [$ I( D/ r) u) w在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。' b7 I* `  d: h% c
问题就是这个人的表述
+ X0 i5 ^/ K1 B+ R% R, _  Yhttps://math.stackexchange.com/q ... orithm-running-time
( N; ^, A$ b0 k' G$ C4 p
) p) h# |: V& D5 K7 n3 u0 W按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)4 V3 v/ f7 O( w1 ?6 \

: I4 D3 |& w0 ~+ C, E" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
& E& s1 P3 @! {- w! U3 Z/ z5 N
) M7 c$ }* j  |7 r没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。  W1 M( S  q, K' `: H: q0 ]; m
: M8 H) G( G& k
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
) q! E- P) l$ k. K* j) w% E+ b: c
您对答案的理解似乎有误。# K) }( }$ R- ^4 {# e/ y. s8 W- I3 Y
随机变量X是测试过的元素的数目
; R$ e- N1 q. |$ i- C! ]而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
8 A5 _# E  J- A; M所以才有E(x)=sum(E(Xi))。! @* T4 |4 P8 h" S8 X# c
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)$ [4 Y& v0 l, }0 R6 C5 ?' v  n
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:! ^8 W% c2 ?1 D- D% Y' P- v
$ I* A1 w( k, }+ e. n
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
* |1 ]0 f( ?; I9 A; }8 g% i" T5 `" K  u" B
然后从头开始:
, C- M/ F7 R. p0 W' ?2 Z6 cE(k|k)=1, Y4 K1 _! z1 ~; N: x0 }) p
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
* G' w$ `; w* i( z& A. F. F5 j' s* N7 bE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)- K1 `6 g4 p+ H" Z$ K, m- z
Finally, we can easily get E(k|n)=(n+1)/(k+1). O/ n) S- i6 ?) v

3 y, n) }- ^4 ?$ C7 e5 r4 D$ ~原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
" Z) t  P& P- M9 \您对答案的理解似乎有误。
0 _3 L( a+ \, w3 p- Q随机变量X是测试过的元素的数目
/ W& B, O* t% c# [8 x" T而随机变量Xi是另一组随机变量,每一个都是个ind ...

" j5 k, i+ P' q+ E8 Q. p3 a明白了。
5 w! j2 ^! }( J3 X$ l是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)$ W5 u5 b8 j6 M$ ]) \1 W
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:446 B7 n/ \  s9 L/ Y; x; k6 O
这个题目可以用递归的方法解决:
) K7 ^5 ]. y, p$ ?- d. T  `( t6 e' y7 k5 N7 D9 p/ M4 s% Z2 ]4 m
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

$ b5 s: ]+ w- [6 R6 Y( ]
+ D# ^9 X1 @9 u' f) G' F: i递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
% m0 f0 Z1 d. U1 L递归法也是可以的。

" z4 `/ D  ], h# Z其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
& O8 a- f* \0 @  z0 r
老福 发表于 2022-3-26 12:01: R: F1 j' _% I3 ]- z4 B) ^$ w5 J
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

# P& J. I( y+ }1 n# n7 ~; M
" {6 n" v  V, P* j4 A- l我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。9 S( Z+ L2 m; K
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
/ `/ G# A( i' |* t- @7 C: S2 b5 }; D' e, Q" n; @0 r) ?
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
% m8 n# i; P  p; E所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
% A" K7 ~+ i: |" m+ b  h4 q0 D# O0 J, k6 _0 F4 r- L8 b: W8 z/ [
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
6 A: d: x- A" d: |5 j' D7 @$ Y; ~/ c: r; N7 `1 ~" V' G% N
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
) @: ~2 D1 C1 }6 D* w0 q
- I/ g& o  _& \- \2 N2 dFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).  M2 q# J7 I! _$ H0 _

) T8 v3 g, g) p: g3 r2 [There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
9 ^; s0 c6 i! l% x2 L- [! a
- }! P6 P7 m, |9 H理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2