爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
" O/ I! M; U7 I# `/ a+ J! ~3 a+ b' ^9 A3 L& V
其实是个概率问题。
7 Y0 [! M2 h& n' ]0 ~  ]那本CLRS算法导论中,第 5-2 练习题。
' L" l" e' C6 y; c: }4 G在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。: A2 f* x7 D1 N* I0 I8 [2 X
问题就是这个人的表述1 \8 H4 [. I8 x( @" M, h
https://math.stackexchange.com/q ... orithm-running-time
- {* }: F1 V$ j7 S. H+ k9 Z1 I4 t, f! o9 ]( q9 T2 u
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
/ q9 X, V6 d$ Q7 Z* D+ F( [) t, F: ~, X0 @( C# P3 P
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". + J1 F% D- U8 V- ~; U/ X
3 o9 u3 q' E+ x
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
' j6 s- B( s  T0 f' E
" b2 I: P( X6 M2 a! U& V老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 ! h+ e. B+ h4 p0 r# V& a: d

4 I" F* L! k# ?% I- B您对答案的理解似乎有误。
4 K  H% U$ i% {7 |: w4 s  c随机变量X是测试过的元素的数目
0 j: T1 g# z* {3 s. {8 w而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
+ e  j- Y5 M. {% s所以才有E(x)=sum(E(Xi))。0 N4 j4 L. j# p/ o; V" v+ g* u
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
: ~, H7 _* }4 Y您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:& S+ o* r4 r9 g4 z; @5 T

7 u& M; a! f" |. b+ l$ h; `: bE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
+ D6 a1 L5 ^% A: a& Z' b& c6 E+ V. |$ I0 A2 G
然后从头开始:  I1 g  p! M, ?
E(k|k)=1
/ K' j: l- ]/ [  ^* n8 }E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)4 ]6 C8 ^! T3 u, h/ _* R
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1), ^( [, P! \7 M) [4 z
Finally, we can easily get E(k|n)=(n+1)/(k+1)
7 ~, v3 N& |" K7 A2 q. P$ [, w8 G& p" p$ q" j4 k
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:320 |! ~! I: u9 @: u- Z
您对答案的理解似乎有误。# b' h( ?9 M5 P! J
随机变量X是测试过的元素的数目
# K# S2 \4 F$ e4 p7 }& P) [0 X. {而随机变量Xi是另一组随机变量,每一个都是个ind ...

! E6 |3 `; u& i, i/ r- s8 |( C明白了。
6 I, f+ t6 x. N) E* l% a1 S是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
8 L" r6 L- I# s* }$ g' Z多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
9 M  A' j/ _3 e这个题目可以用递归的方法解决:$ |# _' l6 h/ P  G+ H

/ u8 S/ o. Q: s7 }# E3 @$ }E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

$ r6 s  a+ r  S! S8 f" p+ _
1 D" ?, q, |, {, m( D4 \' d" A! z5 v3 ~7 t递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07' i$ x, p" O& V+ n
递归法也是可以的。

) M8 w; b9 ^. n" z$ s5 Z其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 6 I( H; D! i! }" O( R" X$ h
老福 发表于 2022-3-26 12:010 A: p% ^' R; T6 q" ?- K3 d+ Z
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

4 F6 P. x& r4 N; I! [) X
0 P$ {& k0 m! B4 r1 w我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。7 a8 p' Z0 \: m; B+ M1 V
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。- t7 H. s6 A) ~/ F+ e2 }

% m: o4 b- m5 U2 O  r而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。, N& I! A. M: S1 N1 D- r/ q
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。/ q2 l: R  o( K" `
) l3 o* @$ }( W1 I6 f
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. ' G2 y. @, ~' [

6 f! S' w& s5 O# FFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.* q# A: I7 M) `0 x7 J

" |- d+ H- @4 A( S8 U+ nFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).5 @6 ~; l/ S8 G# m1 [4 z  D/ O
) R6 r" ~3 t0 a. h3 z
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
% w2 X/ H5 d: c. X" @
% D; j, H1 u# M* X/ l. c9 U理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2