爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 0 }: m$ ~9 s) o

$ {# w  o3 G( L" t" Q% j- d其实是个概率问题。
" h" W6 K' N! w3 ^1 T. m那本CLRS算法导论中,第 5-2 练习题。. G: z! C+ J) m; t3 u4 S
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。7 D6 I) X) M7 v: Q5 Y
问题就是这个人的表述
2 L( o5 s( @' h& }7 C! p5 Uhttps://math.stackexchange.com/q ... orithm-running-time" f# i; q( Y# s3 ?

: K: x/ f5 `( @" P5 x2 Z- ~+ h按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)/ J5 |7 J0 `5 K! _- N( ^1 E

5 @0 x) l7 O4 b2 e& V' J" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
7 A6 Q- x- Z% K9 `' O
7 a3 z. D$ P, P2 E没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
& ?( V% e6 n; x5 J( N/ y6 m, h
& L0 E$ d" y0 L  S5 M5 ]- Q, F老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 3 ?. N+ W( m! u, Z" Z

2 h6 }7 m0 b0 D3 t您对答案的理解似乎有误。
5 f! S0 A; s2 {0 f随机变量X是测试过的元素的数目
7 E+ f2 Y. x  d而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。0 J+ k/ D* v( s$ m" S: d4 e
所以才有E(x)=sum(E(Xi))。+ x0 D! A' o& R' h2 v
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
! K2 h; D5 h, V8 [: L% p您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:0 P. K, J7 B* N; {" ^
* `4 h  l: \9 P5 O, ]0 a7 `
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
8 n7 \) A! }" w, K# m" }% H" W* p! `, s% G- S5 L
然后从头开始:
" f! m1 d  ?/ k4 V! ?* J3 F  G/ fE(k|k)=1# Z7 q3 c1 `! F8 j& ~
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
! y/ A9 o8 r0 }9 o) T7 RE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
0 M$ p/ c% z0 q7 U. yFinally, we can easily get E(k|n)=(n+1)/(k+1); Z5 W* x( B7 D: A
) H( ~7 W& V* D9 T1 I
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
3 O7 ~+ C( m* L  R8 J; V您对答案的理解似乎有误。
' O; s2 G1 N( `3 v3 S随机变量X是测试过的元素的数目8 M/ {7 d2 Y( ?1 _6 I' W" q5 P8 p6 u
而随机变量Xi是另一组随机变量,每一个都是个ind ...
, F: Z) R" C% T: w5 a  y* {8 U3 ~
明白了。9 L) e+ N( M7 d: U' l6 B3 ?: q
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)4 f& w( j% x) h
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
  I/ _5 G# ^. E0 e这个题目可以用递归的方法解决:0 \8 G: p# ^8 q0 L; Y

4 c# L, d/ y6 E; \+ oE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

! G+ G+ _8 ~$ r4 X& {0 F) ?
: S* p3 S5 h/ H, C- E递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07$ P! w$ Z- I% _/ r8 l! o
递归法也是可以的。

. X, ]# j  F" U2 b其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 1 {: e( n/ p& S" }: p
老福 发表于 2022-3-26 12:013 M; n3 u9 Y: n" F6 U( P3 I- d
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

6 B& R5 G: p0 w/ f7 p0 |3 q8 S2 e) r6 z
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
6 a; K$ z, `' T9 G9 g) q7 r否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
, x2 M: Y% e1 {3 Q9 \5 {
- ?/ t! e6 \: ~0 Z( G3 y而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
1 m. h. o  Q* }8 w2 o! C! Z所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。% [# I" z% x/ }8 l- V
* n* ?) z" A; N5 W
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
# B5 Y5 s8 n  T1 W# z6 N) T
% B/ \3 E# n! }9 _5 A9 Z7 ?For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.9 I7 g, c" p$ }( N- D* v! _

+ F( i  Y, l3 ?3 K" m, y: ^( oFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
" k1 P' C  V0 N/ F' @4 A$ b5 _
- _- H+ W* F4 L0 z( cThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).' X; J7 I( P* P# M" Z7 D
- X. m3 c) `  s" ]9 K
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2