爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
9 r, T! d$ f  M2 H2 f% c/ |% q, X# C7 E, P
其实是个概率问题。
# b7 {7 n4 b+ H那本CLRS算法导论中,第 5-2 练习题。
* m+ J& k9 F) q% U9 v2 x2 C; m在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
/ C! C- T6 _+ \1 H问题就是这个人的表述
+ p/ q" H1 D4 a# r; k9 fhttps://math.stackexchange.com/q ... orithm-running-time
7 N6 m# X  f* A/ K' l% m
. f; ]) O" Q6 q6 ]6 m+ Q6 R按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)4 P8 o6 n* S$ v$ }) b' Y) k

, `6 E; S# c9 d! }! o8 t" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
' T& O1 h" r  y! M! N/ b* x
( Y9 b5 y: v- G" @; ^7 |没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。/ W9 n) a- |  s% G) t
3 ~4 \$ y# l8 n# I7 R+ p1 l
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
% G1 _, ?: Y' v: \9 N5 ?) P* ~% l' C. _4 `
您对答案的理解似乎有误。
; z$ {/ K! H- H1 ^$ J随机变量X是测试过的元素的数目
# @( q6 Q5 ?2 T而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
5 o% X9 j' V; ~9 Z! [$ G所以才有E(x)=sum(E(Xi))。" Q; [8 u4 b! b" a5 @* ^6 m
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
. ^* I8 f/ ?$ N! o1 _, o. a5 ?您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
- k% P- A/ O( q  G. R. f8 l9 l4 P9 \/ U# w! p/ w& N9 z
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)! ^$ |: `/ H/ ~  B% Y

$ I6 v' c4 }* {7 h; P" G4 G然后从头开始:8 ~" D6 G& b. P" p7 Y6 X2 t
E(k|k)=15 b2 \1 \4 ]; L4 _( f3 y3 i
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
% o3 C- S' G7 H9 SE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
# [. ]1 F8 s8 U; c0 D% O9 ?Finally, we can easily get E(k|n)=(n+1)/(k+1)5 s$ H8 z! z: ~/ ^* w; i7 x' T0 E& v

8 G2 ~) Q* `' D原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
; {7 G4 X% l( ~4 ]( D您对答案的理解似乎有误。
$ G) o& {/ p# x; O) v' N$ p随机变量X是测试过的元素的数目3 ?6 y# u# a4 m/ x+ O5 t; ~# q
而随机变量Xi是另一组随机变量,每一个都是个ind ...

8 g# _2 R. L2 n5 f( j明白了。
  h2 Z1 A9 E2 d5 C  Q是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)1 V9 U$ g: s, ]. b9 J, ?$ {/ M. \
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44# P6 ?# s( a* V( @- G2 h9 \
这个题目可以用递归的方法解决:% U( h2 g. ~/ E* P- H, t0 s, i
& u+ U7 A+ `/ ?5 K! b2 g# x: P
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

5 Q4 t( r  j7 H' z. j
+ s* d# G+ ^; C递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
0 @; e7 P4 Y2 [' d$ n; ?: \: }8 k  j递归法也是可以的。

( U3 h0 E8 f: I; K. v# {其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 ; {6 b2 X) V- N+ P. S
老福 发表于 2022-3-26 12:01
2 |0 G8 ~& h! ?/ j9 K其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
& u7 o4 K6 e3 ]7 M7 z2 E
  u* l9 x' `( x- M- @
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
4 w$ r) p/ X$ Q6 R否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
; d! d) ~+ ~& K( o0 ]( |  p
& \8 p1 D; Y0 i而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
# {( }: f/ W0 A. o4 i# Q所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
- @  P2 X3 H. H4 H. ~; m0 ?& c3 L2 f
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
& M. P( f4 F! P* h9 d( V0 l& [
; u: O: [1 e+ K0 CFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.' @' B4 j5 y$ F4 L9 K/ A

* N( @& C* k9 l( bFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1)." F$ a  q" e/ R" T$ n

2 D5 q0 z8 I1 g) BThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).' d, w  t* \) q2 c2 g" R. p9 j8 f5 h
7 A, k3 S4 C+ I" J2 w1 t& y
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2