爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 ) _* V2 ]; E# o5 S1 _& L
) M: _2 G5 G( a2 ^1 p
其实是个概率问题。
5 l) ^7 u  R; t3 G" B那本CLRS算法导论中,第 5-2 练习题。. r: _9 m9 g8 i& H2 _
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
+ F+ {7 i" k+ s1 @问题就是这个人的表述' D9 f; K5 {0 d
https://math.stackexchange.com/q ... orithm-running-time4 B( `' ^9 v+ B# U$ h' O6 m
9 a8 h/ s' m! m
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)2 t/ F7 w' n# n" w" ~
; a4 V. M& _- M4 I' _& b
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
8 [$ ^4 h' {# A9 W6 L( G- _6 W# U8 F2 K/ ~8 B) t6 o2 N" p9 m
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。- W% {" s7 R" x5 u
. e' M+ d: Q* k& V6 X& V9 e
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 4 N( P! C1 @9 Y% P

, X: ^+ l* B0 d* t您对答案的理解似乎有误。5 z4 P0 m' N2 I4 v9 p6 h
随机变量X是测试过的元素的数目
6 F( c$ t1 Z3 ]4 {* y% X而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。5 e1 _# k% Y- R( _& X$ L* t2 W& d
所以才有E(x)=sum(E(Xi))。
  N9 \) }: B! H" S8 m. H而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)* n: a. B) [, b6 f. u6 `  f7 S
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:1 R4 Y# v$ ]0 d, D9 t) _/ j

( s! o+ e2 D8 J( k& A4 QE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
# J" p0 G7 T1 J) K
0 @: r: U( r2 I* p* \/ ^6 Y- W: H然后从头开始:3 l; B% D: _9 w( T
E(k|k)=1
0 t8 ~' W* T# Z# Z! x6 `. N! eE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
. \6 z  W4 V  v3 ~3 X7 [E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1); w2 D6 G# C' l% E
Finally, we can easily get E(k|n)=(n+1)/(k+1)
- {) y8 ?7 v& S. a( o% V4 _
6 Q; X9 a4 i* M# X" }* q2 I! {原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32# H; o# a: j. L+ ~. x* C# E7 h
您对答案的理解似乎有误。7 ^) \; t! T9 |! L5 f
随机变量X是测试过的元素的数目* i1 ^; n2 H7 t
而随机变量Xi是另一组随机变量,每一个都是个ind ...

8 ]* m3 Z; P" V/ K+ _) w明白了。1 _+ m9 x3 R3 _2 Z" h# U. ^
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
2 o9 ^1 C; U8 m' Z" ~0 `; b8 Y4 ^多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:444 Q; [3 u/ i9 D7 F$ D6 O
这个题目可以用递归的方法解决:7 V* E  K! s* _( L' ~& K
& M7 x1 t/ P, c; O
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

6 e" t# v/ _$ G, R/ I0 Z- }
/ f3 ~  i. D+ ?# i8 l8 V9 s/ w递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07& N; t  K0 S, S9 f1 G
递归法也是可以的。

4 K- ]! o: g% d& o其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 * ~: A# g* r# U6 \% |8 ?4 p# q
老福 发表于 2022-3-26 12:01$ {% B) W. \* T9 j0 I0 W' o, |; Z
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
+ e$ `8 c$ z. P" E
1 ^# \$ X+ ?# G1 a# J
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
% t. F1 t' ^9 |& Q. [  Z4 Y否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。6 `6 D& U$ O% Z, m1 w# j* m/ l
4 P9 i0 ~! f+ e4 I) {: X3 s  [
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。. L' ^/ Q# r8 T/ J: a( n9 ]
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
0 r+ y# P- q" S& V1 D2 r+ \( ?
7 o7 q, }) }& Z2 Z# i' J$ ]Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
$ o3 {: g  e% Q! A6 _7 Y/ Y* F, U+ y
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.- Q& L. X" ?; `
! g1 O* m1 \$ M1 M0 Z
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).; O! r: P( `+ v3 o# S- I5 Y* O# e

9 U: _+ R" Y& z* Z4 |, ?% B8 W' \There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).9 W1 L; c- Y( y0 |1 V' r* ^6 {

+ R, C& }- P1 C0 f, j理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2