爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
* x8 m, v2 J, k  a2 e3 G* h' q- v4 H* `* x: X8 @. ^
其实是个概率问题。
# k: b* w! h- h5 O% q/ Z* @那本CLRS算法导论中,第 5-2 练习题。
8 h% a4 f+ N/ w$ e% P在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
& _, }0 {; W8 M. l! l4 A问题就是这个人的表述3 H  z' W9 v  ~) r9 |# B" d- K
https://math.stackexchange.com/q ... orithm-running-time* K; x1 ^; ~! }# y# a3 g

& m6 k! v2 |( y按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)  t/ H+ h8 N( J# p% x5 j

! V5 X/ t+ }( p( j) |" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
, X, \8 Z5 @% L' I' W
6 L7 V" @& b# K2 H没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
$ r$ _' W- |! L, Y. e5 n
' B1 ^) W: |% T" C老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 * |( s3 k# T" A/ A

. t) s4 A) g/ x: N您对答案的理解似乎有误。
! X1 F' V1 A- |* p2 ?  @随机变量X是测试过的元素的数目
8 l: l# p/ ?1 b1 Y: K# l* J3 B而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
. \7 u' \0 y3 X( z$ ]$ {所以才有E(x)=sum(E(Xi))。1 a% p: r4 D7 U  c: Y7 _
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
/ r" N4 e& B0 _( [6 G6 i您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
4 L) }' |* s. }( q  @, b0 h6 `! m4 x5 I8 P
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
8 Z5 g) u) T" b7 g5 Y! X3 V: h* h. |2 s: ]# O/ ?9 h1 N7 J
然后从头开始:5 ?7 \0 ^5 V, E
E(k|k)=1
9 u, x9 e6 b# ]0 TE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
4 ]- w9 a' l# l9 V; Q4 LE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
6 F: v4 y! t) y! t, FFinally, we can easily get E(k|n)=(n+1)/(k+1)
, V, n! o  }- h: ^1 ]- t6 ]% h  g4 Q3 b: i
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:328 L# e" R; n+ D( B
您对答案的理解似乎有误。
- r4 Y: R, C# e# R, x随机变量X是测试过的元素的数目4 e8 L- M8 n3 {1 {( i+ k6 X
而随机变量Xi是另一组随机变量,每一个都是个ind ...
/ ~7 k& W' K8 j& y* B1 Q" b
明白了。7 N6 O4 Y+ z* U7 ~
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
2 ?9 Z- D  @3 r; B多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44" i9 @2 Y. {' H3 g) ^, O; A* S- e6 u
这个题目可以用递归的方法解决:
% D3 ?0 G0 ^1 i, Z, R7 ]8 w' f* u  A4 x6 u9 {
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

8 t$ y& M. E/ Y$ [) @/ k! x/ u' S4 K9 M  p# m; S
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07; R7 u3 {7 H: A/ D. r1 @0 `
递归法也是可以的。

3 f  E( w) H. t) v6 f' V2 i) U% d其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
9 @- t+ H) w+ n" r4 m5 l
老福 发表于 2022-3-26 12:018 V8 y  ~* A3 n5 ^, U2 ]" h
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
! R5 r# y4 r  H( ~# t' z
: x: M5 o! c: G+ B/ X+ I9 \. I6 u
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。! s3 F# {+ C0 j
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。5 `7 ^4 S1 {3 |- m
" q" o+ N, y4 }! X/ {. x7 u& h
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。' }! u' [/ X' Q) }, \
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
) [& J. P4 G$ g& F
) k/ v' f" C4 W4 M8 j( Y5 Y2 B/ y7 qLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. ) m* X2 c# ^( d. X* b8 Q7 m
9 ?0 Y9 r8 F# y
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
; a# O( H+ {4 j$ u! ^2 r5 J0 }. I2 D  T# E
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
$ H( z3 h8 u6 J7 o  h
, u, s, p7 f* @There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
  p$ Q& F, u! Q+ Y! e+ d9 i' |0 q2 C) d
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2