爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 5 ?/ ?' `8 i0 M! n) \  `
* z% S7 R" J4 n8 ^* V: t& j
其实是个概率问题。4 n5 i9 e4 m4 T, H  k
那本CLRS算法导论中,第 5-2 练习题。
; I; \1 ^$ h0 }" d在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。6 O  N  e! M1 k) _- q7 K
问题就是这个人的表述
% |, [! \7 @1 Nhttps://math.stackexchange.com/q ... orithm-running-time- x8 _) e* Y2 W% s! n
: w/ q6 Q' z0 Q! L; k
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
( _/ a1 T; v* t/ P
; \9 u! g) p0 V" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
5 P( Q  M5 |' W0 U$ w/ w7 [" B# z2 X. U) d
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。/ `8 Q3 v* G, i- l/ F  j
0 M  L- i! e# J
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 1 V- [! h& s: L4 t+ T: T2 M2 x; `

2 V8 K  O! k1 m( V! t! t  K您对答案的理解似乎有误。+ X. m/ X1 z; p7 Q2 x* y$ ^
随机变量X是测试过的元素的数目1 y+ O4 ?. a, k- I/ V0 Y0 y
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。: X5 D' Q$ r: g( y, r0 p' |
所以才有E(x)=sum(E(Xi))。
/ J4 e% {% [1 z7 d; O而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
9 n& ]1 [0 ^  q0 T& K您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
/ N5 h  R& `+ O3 P: [8 g+ N% S' C' a7 P% d8 u) e" s, }5 A
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
# t  b2 Y% \" j% _  Q$ N7 I/ v' K
" j: x" x; d0 _& K" U" P然后从头开始:
8 D+ J, p- L* a$ V) VE(k|k)=1
: X) q- b' m6 H5 o- {  v( _E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
5 `* S! Z4 C, {0 n5 d5 yE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
$ ]/ z9 l) {3 V+ u$ P  B; k& U1 eFinally, we can easily get E(k|n)=(n+1)/(k+1): X0 i: s$ p. G2 `. s

3 c  ^/ j2 U& V1 P4 f: q5 G原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32% N, O( m- `2 f. u' ^8 R
您对答案的理解似乎有误。& t+ Z2 m9 g% Y0 V
随机变量X是测试过的元素的数目* J! Q0 x6 q( h6 W$ W
而随机变量Xi是另一组随机变量,每一个都是个ind ...
7 K# n- S1 R! M- z
明白了。
* h7 T! z4 }2 J$ n; q5 d* n* B是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
* j2 r4 w5 g0 Z; b$ i2 u多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
2 d' G% |+ W: m9 U7 Q( h" J! V这个题目可以用递归的方法解决:1 d9 h9 _8 B2 t2 V0 r/ |; {+ h

% N/ l4 H8 w* H! X$ t, ?; r$ [* ?E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
1 ^4 B& b5 F) ^9 B0 n1 z

0 X2 {# v# j0 {3 f* G递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
9 [+ q$ u, s. x! T递归法也是可以的。

' u4 k0 e, V# N其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
* {' I" Z( j1 h6 r
老福 发表于 2022-3-26 12:01
1 `1 |0 y- Q+ L( {  a$ O6 a: O& F( d其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
2 L) y( ?( z; T2 V# D) [3 d

3 H2 [# O" g( x7 [: R我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。" e) N9 i5 D: w6 w4 [+ a% Q
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
4 v- p7 [$ K7 {& w
( R; h( x3 n) u' l7 p2 U7 E1 P6 K7 r而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
) B& A( K2 t8 w所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
: R$ s! a0 `; X, A5 j9 T8 Q7 C5 w! Z) u; P7 K
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
7 z. x# ^: Z: v" J2 a% O, J4 Y' x# L( F) D3 p+ d
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.. n* ?8 y" F7 w0 [* ~
% [3 l0 x" C( Y8 O3 `( @
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
  s% D, B1 K9 |! ^4 B- n6 N' y8 x( r9 n: K$ |0 i
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
* E: Z# G" |1 W
2 S; \& e5 @; x2 H4 n理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2