爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 4 H8 F0 S' H" [9 |

' h9 k4 ]5 c8 M, M4 q) g0 f* c其实是个概率问题。4 [& m1 M9 F: P7 Z& h, ^9 H
那本CLRS算法导论中,第 5-2 练习题。
7 n$ ?3 n1 P1 ^9 T+ h在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。) @# l- c9 i5 U2 o5 v3 d' b
问题就是这个人的表述, `% x0 o6 t0 |9 W
https://math.stackexchange.com/q ... orithm-running-time; K/ s6 m. T) s* R2 S6 `

$ E) B' L% a8 @按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)9 B/ }3 i* q! v/ X

1 \6 |8 Z4 b* ?, H" U' x" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
# d1 U; O9 q# p! T- l5 l3 d% [/ S+ K* ?: S" R9 w" x7 ?
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。5 }8 ~4 y4 S% G( [1 Z1 ?
( C8 u9 M9 }' C7 _! j4 b
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
( Q- Z3 a/ n  K. w3 T2 D! g/ s7 G
您对答案的理解似乎有误。, `2 @# B" w5 i6 \- W) D; K
随机变量X是测试过的元素的数目9 J. Z" }  ?! B2 a- m" r0 D3 h
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。+ @+ I* J/ s& e5 D' U0 w
所以才有E(x)=sum(E(Xi))。1 U  ?2 r6 M! a9 b/ G
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
! y$ n! c' p7 {. ]( A您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:/ G* e  w, _6 q) K1 L. I
; x1 {: {7 ~! d# g. U0 ^4 A
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1); E9 y7 W6 }1 i$ H& w. s  b4 P

0 _$ v6 D9 b% j4 q' C9 y然后从头开始:
& v( s( g+ \! \E(k|k)=1$ Q7 q' F6 |( h9 Q
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1); _* c+ K% R4 y2 w6 P: O, f; K2 |
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)' h8 d: y7 Q1 }: \- y1 f
Finally, we can easily get E(k|n)=(n+1)/(k+1)
& Z1 g7 w. V% R9 z9 D# Z5 j5 S
! @. W" U' b, k6 Z) d: `, b: r原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
- O; N! w; ]% I您对答案的理解似乎有误。
2 l! w; q# Q4 P- ^随机变量X是测试过的元素的数目* M8 ^" @3 Q/ \+ X9 V& O' H
而随机变量Xi是另一组随机变量,每一个都是个ind ...
5 q/ g& \+ H3 O: l- Z
明白了。
3 r8 x7 k$ S  n: Z5 z% B是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
0 x* B: B. }3 c4 C5 O- C, d- n5 F% Q多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
& N, b; g+ e% S# H0 l  M这个题目可以用递归的方法解决:9 t5 N/ Z  R7 T5 G- A# `

, M" }8 m+ ?$ J/ d9 g% nE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

$ K' Z0 D/ d+ U, \) l  D7 p5 ?, r* U  }, f
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
- L5 E: {. z" m' k. F% m递归法也是可以的。

4 s9 {" Z, C9 P其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 4 g7 i) M, R4 ]0 B. B2 s
老福 发表于 2022-3-26 12:01
6 w7 k3 m9 @& m# v; Q- y) H$ V! o6 H其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

4 T: {& h5 f- E9 P
* A( }  f" ^# t* T- F. M我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。- c9 K1 B1 r' i& D# j8 K3 V
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。0 j7 D. V1 x; s; H& Q: L

) ~! l; K9 i" L% B, L- z5 e6 I) v而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
, s. _+ W1 I- ~( U9 D所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
' j6 A2 a! a) Q2 S" T* v0 V/ R, ^  w3 }7 `
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. ) z9 N1 h/ ^/ B8 v! ^0 g& T
, m7 C. a2 c" O+ ?" z* |
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
8 h# r! b) X' x5 m) C8 i# |2 }9 I3 K2 A9 H0 ?
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
: ^4 k( b- j4 e. B, i2 \, R) d3 X: W1 o2 W  y
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).- i" w2 [+ y5 R7 v- w+ }

8 V; Q6 X/ _! N4 D理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2