爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 7 V2 H) f6 a: d" C+ j% j, L3 K  O

5 t% z2 m0 M, |5 J" o) d, p& u其实是个概率问题。
5 W1 f+ W5 k+ X/ B- v' K% j那本CLRS算法导论中,第 5-2 练习题。
3 L8 p2 K2 ~* Z2 Q6 T+ _在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。# k) D" H8 I8 o" \8 g- N  k* W
问题就是这个人的表述# `  X0 T/ Q- G1 S4 k+ M( f: D
https://math.stackexchange.com/q ... orithm-running-time
2 t* T; A0 {+ q/ H' H9 Y; R% e! x
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
5 l4 K6 a* j7 b2 T# e2 `0 {% c- ?) }3 }$ u: r  q: ]
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
) }( C" ^% r6 j& N5 M4 J
, e5 q- t8 p% E" Y& r8 \. l没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。+ u( X; `0 S( t" h. A" n
7 R/ X4 F" d$ d8 F
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 6 v5 h! ^# }3 r4 l8 b/ `# }

* S! E5 I% J) J您对答案的理解似乎有误。
8 K4 B7 [" S/ M! j随机变量X是测试过的元素的数目
; C5 c+ a% x' z+ [  j4 H而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。7 A% a, T  m. E- O# s: {8 n. y
所以才有E(x)=sum(E(Xi))。( {& I) t1 W. |/ T( t& f6 ^0 W
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
6 v8 J6 u2 q+ J+ F7 O5 F$ x您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
. @! D  ~3 r" s' t/ {( [$ h
' u8 k' O1 ~& s, [, FE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1): o& |. A! h% g/ F+ j2 Z
# g( |: s& l/ X: Y, s1 H* `8 d
然后从头开始:6 B) L3 V' ~! z) u# h; h
E(k|k)=1' j8 q$ i7 y& z
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
/ {! B( G# Q4 f. M! a4 B0 j( hE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
3 v1 ^8 z0 I, r/ L, t" B2 wFinally, we can easily get E(k|n)=(n+1)/(k+1)
1 {' d7 i% D2 r$ [  N5 t. F. i* {  d+ ^" n( g" z
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32" @$ E' U( H( B7 ?1 g7 n  K
您对答案的理解似乎有误。7 @6 s( F+ p* X( a7 k
随机变量X是测试过的元素的数目' ^4 B, E) F' K3 y! c' D3 n8 L: ?
而随机变量Xi是另一组随机变量,每一个都是个ind ...

0 z6 a+ W# P5 l$ U% Y& ]明白了。
  K- |7 V  T( ]0 |9 U2 J是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
' m4 y1 n- N; o/ Q- }% n; y$ t多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
$ _9 s4 ^9 F9 k! n这个题目可以用递归的方法解决:
* @8 S& U+ {, [% _. ?
, L: w  I0 Y' J2 T# VE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
' H7 j( n  [6 \) e

' ~$ J( U* N: Q8 P( H& s! a- [* Q递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
* U) u- ^) n9 V* D8 t; S3 h递归法也是可以的。
; Z7 `( C5 f4 E1 ~3 Z- T# w
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 - ]( t6 U3 @1 `% q# q
老福 发表于 2022-3-26 12:01
' }, u- ?( d- d! D- _  ~其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
6 o& J: ^1 W! M3 ?& s; C1 f

% P  l2 o* S2 F' k我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
# d" \( m' D% |: d否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。7 h. u( j7 h* O5 B) B
& h1 o9 |1 M5 i3 r( q. H# G
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
: H8 w. w4 v9 R* |: q% K1 m% E1 L/ t+ ?所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。' b( O. V" J, w6 \# T" T
6 Z0 I5 c6 s+ \2 ~
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
3 i3 L" S, Z5 J. ?9 t( d
' i6 k) _% J! ~For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
0 J) L& J( A1 z
/ D$ H2 ^- M. c, c. a$ DFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
2 g3 _3 u6 p7 _4 m7 `
3 L* T0 b! D# z7 p% @There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).5 w+ I0 S+ p$ O& m+ K4 F7 [" X3 j

+ l/ Z1 w% g. t6 v- A; S6 I1 v理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2