爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 / p) u) G3 B$ s0 P0 k* P

: b, U* W6 ^! G, R& W其实是个概率问题。  o& h' K; q! Y: H
那本CLRS算法导论中,第 5-2 练习题。
, ~% T" t6 e. Q/ w, P在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。$ ^7 `5 j8 g9 T5 D# v8 P
问题就是这个人的表述" g$ ]# S  Q$ a+ M
https://math.stackexchange.com/q ... orithm-running-time+ z- J( c" @! e% Y( H

: g9 \/ y! C% O  a$ M按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)) f& N6 Y5 d/ r3 `& e6 b
9 Z$ w: k- a  U$ x
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". ' J- d/ N" `: f9 `" D# |* ?0 e
5 V0 @7 R0 b9 D+ F
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
) D( p3 a" H6 y! r% Y5 A( `1 f: l% d/ I7 f9 B" [8 u
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
& R- z% a, Y  z- u1 y" O1 Z
8 O# J( D' c: G- @% y6 g您对答案的理解似乎有误。* M8 q2 X4 o' ~- q2 C& `
随机变量X是测试过的元素的数目% l% u- P0 E1 Y* T* M+ B3 P: L" o- @6 P
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。7 |: V* M# \! g7 B0 d
所以才有E(x)=sum(E(Xi))。
) g2 _* W3 `& T2 l而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
* O! R. f  ]9 ]9 J: a. _您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
& Z2 C+ Q. i1 y( a$ H: V
" f6 b3 Y7 m& |+ r. e* HE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
7 F9 ^: q' T6 {1 b1 n" l1 b" C, n. u$ m2 H% L' ?9 g
然后从头开始:. ]7 w, N7 |1 ]: v( e* Q3 v" D/ J
E(k|k)=1
$ q" I1 R. ~  o* R9 ?8 H. CE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
. a" C0 y& @/ cE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)  M0 M9 F+ J9 w; |9 P) b
Finally, we can easily get E(k|n)=(n+1)/(k+1)$ I' A1 Y( Z, I: E! r2 n' C) F

( H3 u0 {+ A1 K5 v原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
. x' }1 ~; Y! k. t+ X  s8 z您对答案的理解似乎有误。
7 k/ T: V2 [& P$ c: d( O) y随机变量X是测试过的元素的数目
* F! R4 i* A& V  M; r而随机变量Xi是另一组随机变量,每一个都是个ind ...
1 f( @% x5 |' n3 K! C( Z
明白了。( h% g1 X# O8 Z3 V; Q/ q0 C
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1): Q, A5 ]( F" `) e1 |- ?& J
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
2 w5 r+ L' N5 u( V3 M! ]* @这个题目可以用递归的方法解决:, [& d* c/ F* y! N' W

+ A3 U8 ?( P4 T% kE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

6 k6 ~& V: w2 q- D. P5 @% M7 H! [, Y* x
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
, [- E! N2 j, V6 I5 C9 O递归法也是可以的。

9 e* d8 `# [# i2 x8 G3 S) S其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 7 W4 h1 W( ?! |. g
老福 发表于 2022-3-26 12:01
% ], a$ D4 R6 n+ G* A3 C& q其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

, v! y' E- \/ X, Y
" g) K6 T2 J( V3 ]4 L我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。1 `/ ]% {  u) h+ x
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。: h/ G1 S8 v0 G6 a- W

' f. v$ ]0 }+ s: G7 v' |! h而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
6 p& B6 Q  b  ]# j所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。, ^2 c' {2 g  A7 P# R
1 A4 a3 K% k  q& p
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
5 l, a: M+ M, ~) d9 w* }/ M! w- }7 h8 W3 V; V
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
; S3 y! e9 |# ~7 I# V+ v
$ x% @( m8 L/ Z- E$ s. v/ cFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
3 l  L* H! q% D8 Z* c7 L
- V: F% u: [# x! {" lThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
5 e- N9 Q, }3 L/ y7 J& ^6 j8 l' L6 }( |/ i- X# e; f
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2