爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 4 N; ?& m! x! W: }; [8 w
) @4 L: J! U5 V! m0 e
其实是个概率问题。
" Y8 Q) V* v9 _& X- `; g那本CLRS算法导论中,第 5-2 练习题。( c! |1 s4 _$ ]; q! g$ |
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。7 R8 o4 k0 C9 r& @- I) @- q  a+ R9 I
问题就是这个人的表述! B$ {) x7 |' x. B9 q
https://math.stackexchange.com/q ... orithm-running-time
0 M; Y' z1 \. l" S  S
# k- Z4 {: t! N1 M  n: d) V6 E" Y按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
. ^3 ]$ {! e2 q* `8 f$ d* q" q9 g
& l# }* |( B9 ?7 V+ r! n! J+ p" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
9 a! @5 d) Q  [% V$ K" c. x& w! N. n: H* {3 y
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
8 [7 |3 ?2 B- r+ y7 P. F; a
/ s3 q1 v1 c( v1 w9 y2 O老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
- m3 G+ ]' u) q, F+ ^3 ]
  g6 a, y8 {  q+ C! t1 h. k2 B8 e您对答案的理解似乎有误。! B# X$ Y- E+ V
随机变量X是测试过的元素的数目
/ J1 F: S; _" j9 y+ K) r" ?而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。1 p% Y% ?7 k- n5 p  s
所以才有E(x)=sum(E(Xi))。! g% J3 y6 |6 T; H( q
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)2 X2 E, n' v8 \2 e& L/ i
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:: U) Y2 s& H( F* ^9 A* L4 H

6 x7 v( u: S( i, A3 Q% kE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
7 z5 M+ q6 T! M8 ^  ~1 z  A8 H
/ J* Z) E% i9 p: X* S7 H然后从头开始:: A$ B$ L( _2 i, S" C- I
E(k|k)=10 J, ]7 m: K% x  K+ s. t( S4 e
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
& Z- m% q% R) g/ l8 xE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
1 m5 M( l; B+ ?7 h1 c3 lFinally, we can easily get E(k|n)=(n+1)/(k+1)
9 Y! R+ Q) ~( X+ U0 m3 O2 q
) p1 L  q) U2 k& C# b) ]原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32- T: ~9 ^! Y$ g5 Z# |' O9 w
您对答案的理解似乎有误。
' {5 ~; n* Q/ s随机变量X是测试过的元素的数目* C: S1 M# G, q. L
而随机变量Xi是另一组随机变量,每一个都是个ind ...
; g4 E0 K3 k3 M
明白了。
9 Y" e( ^9 q2 J* n1 T* c5 ~. j2 O; X- L是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1): M0 D2 s  d* U1 R) G, N0 ]
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
5 m) B' y- h& J! d7 G这个题目可以用递归的方法解决:
. v. `: N1 {3 i7 R% B7 p6 e# H, B; r
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

$ r7 _, X9 [" ^/ F+ |% T2 k$ @& ?2 U) N, ~
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07( d1 k4 T; p  ]' Q& t+ c& b
递归法也是可以的。

0 Y4 U, d. j1 H0 z: Q其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
) i; c- G) P8 k( F9 N& i
老福 发表于 2022-3-26 12:01" n$ y/ n/ _/ ~0 p6 d/ |  F
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
0 G0 v5 W2 a* n# d

4 W3 C1 T% E& z7 R, P我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
/ W1 o* \6 A. F否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
& r$ o1 n8 V6 B# P" F
( o, w  m1 f" E而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
* p: }! `) i/ v! C5 y0 Q0 r所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。( C3 J: S' Q; y
6 r* W" w* Z+ u+ R5 Y  h4 z
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. 6 n% q7 L& D/ f  ~& e9 t# X

1 j6 e/ e* a6 ]# v- KFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.& e; I! a$ O- z' J

) D9 N5 T1 l5 {For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).) F. y* c: L& a+ ~! S8 K1 X( L

7 X' _, E$ h! E- h% `There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
3 Z% |$ N" p  j' T1 z: `! ?, |- [1 y: J5 D+ c) L& R  Y. n
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2