爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 $ H  q5 K! k4 ~

. N9 `+ t  j/ F- k; ~( N其实是个概率问题。" `. b* N  q, c- ?( p' P
那本CLRS算法导论中,第 5-2 练习题。
! E. K0 a  p' R) z' E- Z! D5 N* X  R在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
9 Z, f4 G( n5 j' U6 ~9 V问题就是这个人的表述
4 g) O: g, w1 t: h) `  _https://math.stackexchange.com/q ... orithm-running-time1 ?) Q0 G) X& H# Y$ k/ y
1 v& R6 R2 [9 [4 r( O( I
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)! c: G! K4 B, l5 z& Z4 x) ?# _5 G
/ D) }; n" s! l% o* R( `& R* J
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 8 k1 H- e3 [  U- N! \
3 w' Q/ r8 A- X/ @; \1 k; k5 h
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。+ s2 p/ U6 ?; |& O% X8 z
9 T# v# D4 a/ \7 i& Q. H, {$ y5 D* o
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
' t. C: S% g# l+ k) m% w
, h: L  r; r$ ]" r  A您对答案的理解似乎有误。! Q- @6 _& J) f$ U: ]; |4 w
随机变量X是测试过的元素的数目
% U+ T+ [0 l$ ^0 R5 v" |而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。* B0 ]$ Y" ~; k0 v
所以才有E(x)=sum(E(Xi))。
( N7 s2 t1 h/ X而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
5 K: s0 s4 V0 s您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:( W* R( a( l- s7 O9 _6 y" h
6 v; f/ ^; v2 \' w/ Z5 @9 z
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)6 `5 S# G! u2 V6 [  V5 \

4 H: o6 O7 ^9 d2 N# `% G然后从头开始:4 ~$ v3 x; V4 A: e' L/ [7 {5 }
E(k|k)=1: \9 M3 u  d/ N( W; O! b8 \
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)4 h, d* P2 R& u/ {; Z" ?* ~7 L
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
0 \3 O" a% R) M/ O. S$ hFinally, we can easily get E(k|n)=(n+1)/(k+1)
: R& l, y& S8 S" r. P7 f! [+ h; d6 o4 X: w) ~
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
" ?0 ^) {1 m2 s  T3 ]4 u& `+ B您对答案的理解似乎有误。/ x7 t, a) ~9 \/ W1 V  ~
随机变量X是测试过的元素的数目+ A( ^! I+ Y, j5 I. I9 A
而随机变量Xi是另一组随机变量,每一个都是个ind ...
; e! r9 H$ ?1 b5 z( U
明白了。$ S) |4 }3 N& `+ f5 o. W! S
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
' G. c1 Z9 K( I: ~. K: `多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
- L- _' n1 G: C6 q这个题目可以用递归的方法解决:: v, `' V/ ^* W/ _2 c0 w; N

3 o7 @" k0 L$ h9 y4 n: q4 |+ VE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
: ?& w# a# e* h6 a  ^0 O& L
/ ?" x, F( A0 |! G
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
) P0 [) g# f2 w' F递归法也是可以的。
3 _' b9 U# N- t& R1 g5 m
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
! M! L8 Q$ Y9 e/ T) n
老福 发表于 2022-3-26 12:01; ?% E4 ?! c, @" _
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

. [( D# u9 j: }0 p% Q
9 c+ k/ ^  k  \9 ~# Z我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
" B' r/ g8 K& b* W# _, r" a否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。: r# h6 H8 V: J% c$ k1 v

3 {+ q0 M9 O# e/ h" D6 U而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
$ \4 a+ Z. ?- k0 ]5 P$ e2 {所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。4 y3 q. _( Z- T+ a# Q9 ]" C% m
# t/ C8 O- O, s. v( |' b* H
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
& J$ f% s; J% K& S$ [" B! i1 t3 ^+ g4 ^9 U( z
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.- P# e* Z" k, P3 Z6 L
1 q- L) Z. N2 }0 d2 z% c
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).$ q9 U! Y0 ?: T1 R6 _1 P

* e9 T7 O" _, ^+ m  n) ZThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
7 o& q' R" v/ \" Y% r( n  J6 }
0 M9 `! }9 A& E! T; B: w理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2