爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 ' B* y- y( X/ x  r& B$ g
/ I/ u1 |* k' z: o$ N3 R* p
其实是个概率问题。5 Q* j" H+ H' h1 d& o+ r  y3 E
那本CLRS算法导论中,第 5-2 练习题。9 {" K0 G1 h9 N+ r7 v$ P  P9 M
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
: @4 a& M4 T/ W+ d% |4 }问题就是这个人的表述
; l0 T& y& P( T5 H% ehttps://math.stackexchange.com/q ... orithm-running-time: o7 _( H; Q  U: a; t3 N% ?5 P1 \

6 G' g: Q1 M* P( d' q按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
- }( [& U  b; |3 j; K3 M6 A, I9 W( ^8 \% I) g: W# D- [$ t3 }7 h
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".   _3 x7 m1 c4 J2 z4 P: E: M: p8 v2 E

" X. I9 H% W* l$ a" ]5 l6 ?) {没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。. T1 ]! m$ J3 e5 [, e. Y

" d, u: H6 Q. y/ O# m9 u老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
9 W' D4 A# q. J# G; L4 @1 e" Q( q2 {; H0 d
您对答案的理解似乎有误。6 X" p# E  Q0 c) v! l/ q' C
随机变量X是测试过的元素的数目
2 A" Y6 I9 T1 W9 f2 u. |, b而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
$ `# i2 v* }% d% W$ y6 w2 S/ X所以才有E(x)=sum(E(Xi))。
/ H/ ?; @& O  T( M5 ~而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
2 {; _" P' v8 t6 F+ j0 y您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
# @+ `1 t( ?) `' \' ?
2 K7 l- z/ {5 N4 JE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
& M8 n8 ^# b8 w  S4 q% M5 H. `. u
4 ^" n+ W" I3 a9 A然后从头开始:9 K$ M% }2 w% z
E(k|k)=1
3 w3 j7 ^. d; z6 G7 sE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
2 f! u5 E/ G  V7 C7 {E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)! o5 r/ [- Q  y9 h
Finally, we can easily get E(k|n)=(n+1)/(k+1)
+ y2 q' p  A( z8 R) \- Y9 c$ g; d9 W" ?6 O
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
7 B3 L7 J. ], a您对答案的理解似乎有误。
/ j: z. F5 y. c8 z随机变量X是测试过的元素的数目
, ]2 ^! O5 o# H. B2 F而随机变量Xi是另一组随机变量,每一个都是个ind ...

7 K( Q! Z/ e( ~; Q* G# x, X& A明白了。
0 n$ Q' l3 B  n- [( d+ Z# |+ p是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
3 l3 q2 ~, z1 p4 X% C& N多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
0 L8 N3 @9 W" Z, O! T1 \1 X8 [这个题目可以用递归的方法解决:
' o' L0 \# M7 Y  k! p' n
* w- Y+ [4 \" k  iE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

- x& x" G* H+ @2 D
, u8 w7 ?8 x! f. p8 P0 V8 ?- T递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
; D! R* z2 ^) D递归法也是可以的。

' a! O5 s( a& r/ o. i其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
0 S$ h/ t1 \. `
老福 发表于 2022-3-26 12:01
$ ]$ ?$ z! G6 t4 [: ?& M其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

( N  `6 N$ k/ ^0 j9 s# F% T; ?8 }& S
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。0 m- G) i1 {" ]# U# M
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
* t2 |/ v/ D2 B* q2 R% L* J7 e" j6 N
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。# _' |; I& W) \: H5 A# L3 ^, W# W
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。4 P' g# i7 K1 X% G" X

, S2 N5 o# S7 A; J% z* _) nLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. $ D& Q, @' G9 Q6 R: D8 {( X
/ a: W/ P/ R9 d9 S. J
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.1 _9 Z( ~2 d1 a
& r/ R' |+ z# H
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).; ?  I: Y: [$ A/ c' I' q

7 l8 R# c2 b. w# ~$ PThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
! z% h* h1 w4 M6 ?1 ?2 k) V) S& [) a" D7 p. D1 \( J4 u' Y
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2