爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 4 g; `- H% ^7 y" R! c& X

& Q3 v: I, f$ b/ X" j. c+ t5 s, a其实是个概率问题。1 \+ `! Y, \7 q# `5 T2 U
那本CLRS算法导论中,第 5-2 练习题。
5 i% J/ }& _; ~1 ]8 @! K3 P在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。, b1 G, R. j2 z
问题就是这个人的表述
6 Y" L3 p- A0 }; n+ uhttps://math.stackexchange.com/q ... orithm-running-time
8 G+ M! @5 p9 `4 w
" Q  h0 _( u8 `% X按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)+ R% g& n7 C* [$ O3 c, f
4 A$ r5 \- t& Q$ O& N
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". ! g  U4 g/ {% }" M# G: a# I

. o4 k4 l0 n0 \: B没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
! Y: M: B) [* e+ K" t; q, e2 n. `/ C' y3 H
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
( }+ W; f9 ]. @' e- U) X: C3 S- w* p3 v+ V: I" P
您对答案的理解似乎有误。
$ _3 i- w" W0 W" g5 }随机变量X是测试过的元素的数目+ s- ]) e5 V) {6 r
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
  @4 O1 ^/ }: N6 U/ ]2 ~所以才有E(x)=sum(E(Xi))。
9 j0 J0 F. z6 J; X% Q/ ^3 i9 [+ h而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)5 l7 l: H! i* Z5 t: Z2 P, J
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:4 I, G3 q8 y" o: q
" U7 h: w9 Y" w1 G  V
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
; i( p3 X' h8 [$ Q5 w; b  w( _. r; [& [
然后从头开始:" D3 H0 E: E4 J, z# G1 J: E
E(k|k)=1- r% ~' X/ u- M7 Y* M* g1 ~8 h
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
1 |8 z8 _- G& p( kE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)5 `" g! z- U6 i( }0 M5 b
Finally, we can easily get E(k|n)=(n+1)/(k+1)8 u# b8 p' |& O) @  S

; f& R( d5 Q; S3 b& {% Z# y原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32, o0 O8 |1 ]9 V8 e: Q/ {
您对答案的理解似乎有误。
5 R, B4 ^4 p+ P6 n1 z随机变量X是测试过的元素的数目
! l$ p6 t' ?) [( F4 a$ J) s/ Z8 A  j而随机变量Xi是另一组随机变量,每一个都是个ind ...

4 {1 D' q  A# r: t4 _/ E. w明白了。' ]2 l* f: {% G7 r* i
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)- S% v; R1 e/ `' M
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
* M! h: S( z! I  L1 Y# a1 n8 s这个题目可以用递归的方法解决:
* O9 u1 A( y7 M+ z! F' F
1 y! e6 {2 s' {0 S5 D6 ~E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

* e  ~! b/ d; ]# M. V0 V5 o( e
4 D8 {6 q, g, L8 @递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07) [/ t9 S/ I2 a4 _
递归法也是可以的。
+ `5 f# E2 W+ k
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
) Q0 v2 I. s, F
老福 发表于 2022-3-26 12:01- Z0 R+ {, T4 P* n7 Y0 P
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
5 z. \- R* q- _) Q/ w. a: ^( @' x* \

1 P0 W2 Q  S8 S% e我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。; [5 t5 S6 u" ?! |* q) t2 S! f/ d
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
4 [* O/ U% m5 V7 t  A9 O0 W0 e. m) D+ O* @) `8 x# n& \
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。; O; @9 j  G3 i5 y' F9 a7 E
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。' z# y# X8 b$ l8 ?) }9 R

8 c, O' B& B7 C; e3 ^/ X  lLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
- J, E7 `) y0 a. h
& M& `/ Q5 G8 pFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
* [$ z" _/ x! B% H4 z! g' R$ m! J, U1 O, d& D) y8 {
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
5 g3 i  r3 H4 Y5 U+ r, N9 p. }5 P0 k; O2 M& V7 R& P. d
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).( v0 ]2 A3 z+ u3 S

0 l# w3 Y5 \9 O) t理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2