爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
; r) [" k: S) R) y9 \
: Q; `) h" z' h8 a7 \其实是个概率问题。
+ v, N! y( a8 p; e+ H那本CLRS算法导论中,第 5-2 练习题。$ ^# b8 m7 M- e. v* ]  z' {$ n& F! v  J
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
) l  `0 F8 ^. j! p: f* K' U/ o问题就是这个人的表述
9 {' i/ K: J1 N! x( r( b* A5 }https://math.stackexchange.com/q ... orithm-running-time
+ [# b3 P6 V: Y; o6 V& ^! \0 X" p7 K/ N. O; \/ w
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)% T% j& E' n# p! v$ x+ n

+ |/ m1 p& _% F" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 0 T9 \( R7 `: m' C' A) F8 P: K
2 e  ~' X* o1 t3 @
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。! Z# E. y/ |7 q* m$ d7 G5 a
6 u  p- z+ v; T* @1 Z
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
" N- _3 N# ?) m+ B: S# X
2 `+ @3 K, R7 |# K# I  N您对答案的理解似乎有误。
* x% N# h' _% i" q2 u9 z$ D随机变量X是测试过的元素的数目# N" Z: }7 _8 r1 g2 T* a* K
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。$ f( u2 f3 i( `' r
所以才有E(x)=sum(E(Xi))。) n5 @" K; p& N
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
- @9 i$ \; v& u6 _$ T您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:/ ~# p; N& L0 I6 X6 E. x
7 \3 x6 y- B1 v. q7 A( ~2 c0 J
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)! n* X1 _5 ~/ x+ K6 [- j4 v' V, x

# @1 ^2 g; `2 V9 \, |然后从头开始:
6 O! Z/ E! X. U  u, j& C6 o& VE(k|k)=1; q  q0 E: v4 C4 y. R+ K, X
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)) }/ r/ Q3 B' J
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
; G9 H$ y/ Q; G% o! }Finally, we can easily get E(k|n)=(n+1)/(k+1)
# z6 J* V4 M' v; W8 q3 Y/ S' h' |) b2 ^9 R% ~
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32: d6 [- I7 w! N4 {  o8 q" }
您对答案的理解似乎有误。( ~# U' X- W/ Z# m, J' j
随机变量X是测试过的元素的数目+ e3 u1 d+ C$ O! }
而随机变量Xi是另一组随机变量,每一个都是个ind ...

' ^3 d- F+ S: w5 w8 r$ i( q, B明白了。
# ~# B1 x( g0 L/ Q/ l: r1 E0 C是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
1 @/ b  T6 F$ G, Q" I0 N. a多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
, ^; `' V1 A1 B% V. a这个题目可以用递归的方法解决:
) e$ @6 g2 g8 L: K4 ]/ s( k8 ^5 F
6 A8 ~8 s, f. h& Q5 oE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

( r' D9 B( A* b& |/ h
; Z4 z9 N# Z1 f! G! S9 O递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
5 \: ?! V8 f( g1 |8 Y- k递归法也是可以的。
8 m0 Y6 p* i) L
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 * [8 _  J+ a, N$ ~# E
老福 发表于 2022-3-26 12:01
4 M( A4 t3 ^: j5 T0 H其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

, W) o) a7 s, U) l+ H0 z2 M& d. Q# i% m; M* `
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
0 r6 }5 ]* L/ c+ R0 l' j8 ^, X, s否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。, r" d/ y% a8 m" x& B2 b

" t% m+ k4 @# s& W, u而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
/ G( F% E/ ?( x( N4 @8 \/ v所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
0 s! `) f; \3 W9 F4 ^* x- e! `. H/ j9 J9 U0 z9 K5 y
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. 3 L1 m' I, @  I2 t, U% i0 ^* O

9 W" S8 N3 a  J' r* Q* jFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.8 ]4 f1 |; V# M' K: g
) Z7 A. S6 l) M9 d
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).- E* \% x+ u, d1 |9 z

7 @% t; q/ ~( k- l6 j" Q; uThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1)., o- E7 {" E- ^& ?4 E/ r8 X9 Z

8 U) A) o6 `, }0 u  o! H理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2