爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 . O0 Z" m+ b( m/ i" k9 s
8 G8 h7 c( g9 w
其实是个概率问题。5 z0 e: |* o7 K6 G
那本CLRS算法导论中,第 5-2 练习题。
6 p0 j3 i8 k! j- W在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
) x, v% Q1 [: b% h' l& x问题就是这个人的表述
3 k! }" a. g$ xhttps://math.stackexchange.com/q ... orithm-running-time+ J" M- [4 w+ c2 B- E% V( V; }+ z$ y5 K7 N

8 w8 l! ^# P& q4 `) Z, a. s按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)/ K1 g4 [  F. }3 C: w' L0 a

" s6 e3 t" U9 S& L3 {' t% U" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
) U" n$ M1 J! y$ @4 H+ F) j$ {, T- F1 ?9 S5 J6 q  Y- y* j
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
. D- H1 h2 }6 ?3 ?6 T- k" r/ \- o3 q( N3 t  x' J% h7 N8 M( n5 f7 p
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
! {! G/ Z( v- d# n7 W; E  w( Z
您对答案的理解似乎有误。; a- R/ [% C5 I, u0 {* G
随机变量X是测试过的元素的数目' @  I3 S0 Y7 p1 [+ l' ]% h
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
* _& s$ l' [6 l; e7 @/ ?所以才有E(x)=sum(E(Xi))。& o% ?. M8 N* v3 ~
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1). f* ~, p) u$ q" D
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:2 E- S) j+ |4 I' G/ T6 X. v& N
5 N& K3 p5 \- V5 K! D# J
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)4 h* L% e8 y& ~  |; `6 B  D
+ ~/ E, R+ @0 R5 `
然后从头开始:
; k! z# ]" J& KE(k|k)=1
2 F2 L; E$ l3 t+ [3 RE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
/ S, u; |& d" [; d6 {. X5 B" IE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)0 h/ u- Q% O% W$ T" m$ t
Finally, we can easily get E(k|n)=(n+1)/(k+1)8 x& y0 n; m0 L. v
$ ]8 I! \% p5 c* @4 D
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32$ s7 H* [. `/ C) b& ]$ s
您对答案的理解似乎有误。
# f9 k1 p2 I" R1 C% F. {( C随机变量X是测试过的元素的数目9 O" J# j  Z) J! o3 }* a& Q! V! s
而随机变量Xi是另一组随机变量,每一个都是个ind ...

# [+ t* d7 p8 o8 L8 M明白了。1 G" K( f; w  i+ y& I; j+ L" {
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)3 w. c! C5 V4 G; D1 |
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
! ^# Y. h5 C9 f' `# q' K这个题目可以用递归的方法解决:
( x+ f8 Z6 F. i$ T. H
7 K4 f; k$ L/ l# {. N: l- ZE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

9 F' F  P$ {  H6 z( D* J' A; x6 p
. s5 s6 H* z# |递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
5 n! r! A* H2 z& q' W+ g递归法也是可以的。

. ~# L; f& r2 d, x其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
% d! t6 d5 y2 }; [% i. ~
老福 发表于 2022-3-26 12:01
9 t% U1 k, H: o& \其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
. J/ |* p  v4 S- |
9 N7 P4 Z0 y, E
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
- t8 m% Z$ ~5 |% n否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
8 e4 C3 @$ N+ P/ F3 k6 D* H9 F- w5 n1 X  C& N7 v: l' p# }
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。* O/ J! ?1 Y6 V
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
1 L& ?( t: W. v! s: `' l1 ?% ~/ m* c/ g# X
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. + m: x- H% [, z. E9 z% U
7 C, c3 v' l  u
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
  C6 Z* B, ~% _! x" ?# k
& P& |" ]( ]. [' FFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).- ]( P  y% N% L; u' S5 j
6 ^- E& K- v! K/ n  h
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).5 {/ H; P1 o2 x) |, i* i  |: g# t! u3 X

0 z0 O7 W3 A6 _% D理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2