优惠论坛

标题: 随机赛程的最佳策略 [打印本页]

作者: 狗咬尾巴    时间: 2010-12-4 11:08
标题: 随机赛程的最佳策略
引言
) j) R& d9 G, |2 n5 f& q& W1 N% o% Y! ^
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。 ; v: ]/ U) p# S, J8 y

/ }. F) ^5 ?- u# x( n问题 0 X7 V0 j6 a  U8 E0 _  K/ \( r0 ?) m
0 U1 K4 L5 S! F+ [
0 ~% f" O; C" E, u- j" O3 [
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
5 `9 l1 K) m" F( Z9 u
7 U; E3 ]" P/ ~+ a7 s1 q当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。 4 w9 `; C, M3 O/ Q  j1 q
8 t/ ^+ [" D+ _6 Z/ d
本文
$ t" Z, ~/ E4 ~+ i6 f2 U% U# z- g$ J3 b9 C
; ^$ W" j, W2 f2 p# l2 G6 A9 ^
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
& y2 v  |0 ]7 L; a+ z2 V
/ n" q6 H! B, l. b6 u( b为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
9 v, Z1 D/ n- `$ j8 B! j6 C* G  N6 i. q- y# |. N- N
) b, z, [! v& T1 g5 b
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
" h6 o* N4 v% \7 b. b) \3 ?# u方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。) . y1 s7 ~8 ^0 f: p5 K2 n
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
" ?/ v- F! t& V你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。 & E* N- n, C6 q
: R, R4 j0 z- e' b* l6 Y6 e) F
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。 % h7 t: E8 a/ V- B! l' F
8 y0 C& _/ b% l8 C% E5 j6 S& L
++,
$ z+ P3 I4 V1 W$ {( {1 |+-++,-+++, 8 [" {+ M+ K0 D% y3 Z0 e
+-+-++,+-+++,-++-++,-+-+++,
) \6 s( N( i% ?2 J  |                                                                                                。 $ W2 V! V  F  e5 ]
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为 # E9 ~  @5 d! T, N+ G$ r

8 V! K: ~5 S* ^# ^9 l/ R5 m' z7 i- \4 x# n: r* ?- S

; C3 _6 o- D3 F. ~; u
; @0 n. |+ c. O3 p2 x- D* t
+ S$ Y; l6 v. F% H8 n( `
6 P4 d, j# W+ U
: q( m0 |4 L; D/ r$ p( r) l' ~/ e: B0 b: b6 {7 t

' a7 f: r) N0 s" ^* ~
; {/ ]+ b" M' R现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。 ; ^. X. n' ?, a
, m/ b1 f7 N0 w3 s( d
++,+-+,
9 M+ W' u# q1 t! y) E% F. d& D# V-+++,-++-+,(注意:甲第二次仅能下注 1 元)
; K+ d. u! A8 Y' p$ v/ L1 n-+-+++,-+-++-+,
  i) E* l# f2 I" t$ @! e) K6 }                                 
6 d+ p  Z( {7 s- E5 N8 B& a# G, ,
5 t& J8 [* u# b' D- \                                                                                。
9 |! I1 c7 d5 {% N- T$ V; W
& b3 w( v/ ?$ X3 v- ?仿上之计算,可得此时甲赢的机率为   m. e  H- z7 x/ R' [- |2 d! E
1 {: q$ r0 x2 k( ^: k; \
5 p; }" g2 x. a& h- q' X
/ g8 x8 p! \0 i" I3 k
9 L$ u3 U6 C7 v/ j
; _' `+ R2 e6 L% r( Q# Z4 v
! k! W* |. R! f! V0 M

% @9 r, C  ^# E
3 U3 E& V3 X" O6 k+ w最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。 ' g9 t( f1 e! K, g

; w  C, @( G1 S( W现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当  时,三者之值皆为 ;而当  时,三者之值依序为 、、;至于当  时,则其值依序为 、、。这些数值告诉我们,当  时,三种下注法没影响甲赢的机会;当  时,则以保守法较好;当  时,却以极端法最佳,保守法最差。
& v3 A4 F& ^" C
4 i* B9 j+ H8 G. l1 d. ]7 b这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢? 3 P( \* p! s) v" }* V4 D7 H) y6 a0 D
* Y0 t6 j3 O- O2 C/ _4 p
现在,先把最一般性的结果写在下面,其中  代表当甲有 i 元时会赢的机率。 ( _. E- S8 r" [/ V6 M) d+ `

5 F, e' X2 X+ Y) ^+ s# a! H2 T8 A$ [; Y2 T! v
情况一:  ) W( C! e/ c0 C  l$ P& J: }
此时不论甲如何下注, 恒等于 c/(m+c)。 0 R& e7 s4 d, T6 D
2 v1 y! W9 T  c+ Q. q. e1 M
情况二:  0 C. @) G9 ~+ o
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。 - J0 d; c. l$ _! _5 V' ]* b

( d8 ?! D+ j: c' l. b情况三:
  w% o! _# k4 Y0 U7 W; w' Q此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
; P% n. J) }+ b8 [- o; m' X/ o. C4 q( v5 e/ G) u% }" o4 N
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。 % A; _4 q+ P" `: P1 g% y

5 I% _3 x7 w# P7 S0 V由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
- F; P2 p9 g; h6 j$ r7 m% V* y2 f0 C3 k8 A: s
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而  为我们最早所想求得之机率。
( _( X. s% H( A. A- C# D9 J: G
' Q% z6 x$ i5 I3 q5 ~9 V, n7 i" R* V4 `* _8 L* f
情况一:  
; [1 K! s4 C' L1 a, P假定某甲现有 i 元,那么有  的机会,他的资本会成为 i+1 或 i-1 元。因此 3 n9 W/ O/ \7 a' d) D/ ^# b
3 O9 n3 P$ f1 v* J; Z
! i4 d+ W% u" O' @/ }

/ f( _) v# l) @6 C  A7 r( i; i2 d5 D( k+ T. _
' t3 B. t! _6 o  [% A: P4 }
8 Q; H4 F! O; A- r
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。 ; w- g! |! Q9 p( `6 t
6 K( U( j1 \/ U0 ]7 D
情况二:  
! {3 l7 R( g% p令 q=1-p。此时对 ν 我们有方程式
4 ~& e2 H; f: X6 c' g8 U/ k' c: }. v) g, q+ Y( U

, O. S( ]( J) n7 ?# a9 S0 {; u7 C% U* |4 _, J
7 Z' v$ d. A  D3 ?! T; n( c

$ L2 ]" G/ A# c, D8 K9 k. Y
: O& Q4 m. j9 G- i$ ]$ f6 ^/ K这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。 + \4 O7 |' ^! n3 w
利用p+q=1,上组方程式可改写为 ' R- ~6 ?  o+ Z1 k9 v/ m" T

! _6 L4 I  K2 k' l3 E7 X, X
; c" j/ P& L9 G" a" H3 p9 Y; I* p% V. c( ]
, r) t: |  [9 u
3 S  F: b$ |( z' ]

" U: }6 C- x6 d: J& X两边相加,并利用 、,得 3 {: Q5 x/ h, T1 ]. p- K
6 A) n2 `' \& K/ U. ~

3 ]; u6 S) l0 ~% U; u4 x7 `$ ~( l$ z8 _1 h4 z

( ]! {& Q0 {9 u" K$ x1 E7 ~9 \, @- Z+ c
5 d% K) j  w1 I- k, s
若取前 c 项相加,则得
* u4 _7 S6 n. K1 S8 F- [+ i  H! @0 \5 v, ^
5 M$ z9 g6 s4 P7 f/ q, X

4 }" @5 h$ x- ?. B) d! N6 U& B0 A/ z% i% O: n
5 r2 [: j% U7 M6 s' z+ q) @- d3 J2 U
2 n' \8 M. N# O+ B
情况三:  
* B( A5 z. n, s3 i! v0 ]( [仿二之解法,可求得 ! U8 Z- i% G* x
4 y/ S4 l) ~+ l" r8 C
) F: x* f2 W6 z0 m4 g: L2 L; h; j% T1 |
4 O, c6 G" {1 L
6 Y( p/ J7 a$ |( O3 a% ]

- `: W7 \7 c" l, o  B& m$ |4 n( k9 V: @% S

( K# I: Q2 ^0 A! Q保守法的  已求得,现在我们来研究为什么在情况二时,以保守下注法的  为最大;而在情况三时,反以保守下注法的  为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
+ S/ W% R, Q- l4 _
) ^( a& \- K; U' m$ A首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
! v6 R/ S/ b6 Q! I  d
: n' ~$ T3 z6 `3 F4 U$ b. Z" r
: d8 t# v% R% Z5 O/ _$ x定理:
  k3 k% \# ?* F. \设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
7 q' ]' N4 i) ]+ r% f0 s此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
; N. N# @" R9 U( Y/ K
5 j3 ~" j$ U9 t5 j2 I, C现在我们就拿这定理来证明先前我们所下之结论。 ' \& w5 _8 b8 j$ J6 m$ d  p  G" E& ]
7 u) A9 X4 i1 H$ B' G
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但  = ,所以知不论以何种方法, 。 - l) K5 e8 k8 }
& S1 d, C$ G( Y7 j8 ~' t
至于在情况二或三时,我们取 。此时若给定 Sn,则
7 }: O; O7 f' X5 Z5 f+ q1 J* C$ V' [6 }. k$ Z
& V$ C% E( _& |/ b

" Z2 {6 k, A0 t" A1 z$ Z0 f: V% H
) X& }1 O7 k- J9 @8 E! D: ^  b9 F  X- s/ ?* j8 y* m
0 t5 `3 _& ?; `- Y: t8 j

. _; k4 o9 _7 @* K2 ]$ i( e5 ~6 \7 X/ a5 K
其中  为所下注之金额。利用
% v$ G+ K/ c6 w& I! P( e& L0 v" [: f& ^! h. [) {
/ C/ |0 |: n/ S9 T. I7 n) ~+ s
- A9 m: ~0 t4 u0 r

4 l3 G' r! a: W4 C4 O' `
+ f* k- d) r0 v% L
1 Z! O; p3 `* v4 ~. @. u$ f$ V) Y' B$ C

  K; f5 x& I8 G5 r7 _% O& i$ U9 f可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
/ x. n/ ^# s1 {7 p  {$ l* w" t& \3 L! E5 _9 F- }
9 m3 m3 \) T' ?- @* I

6 ^# B" `9 K: S7 t' ]- h. m  c. I$ d% n

. n! N2 j3 @9 b/ \* K: I9 m/ p3 k* k7 ]: D& @
& P9 [, T+ }1 [$ C, I; Q
; T! f% k! J* h$ C3 U- w# o
因此可得在情况二, 时,
1 S$ y# l* f8 R$ e/ F* k2 _3 u9 w: {
9 I6 A2 C$ _/ N8 y- |  o; z. q" m/ s+ t7 m% r- G
+ ^1 [& I7 `+ \4 E+ U& g4 A

# x' U0 q( N; p& V: V6 X6 ^
  L1 M* i4 \" K/ }" C: q) x
8 c! l0 J" b2 F) Q5 a0 q* Y
+ J2 Z" g( H+ d% t% U& f( a
# G/ @  n7 p  n% g而在情况三, 时, : ^5 E! j- x$ {* d& w8 p

3 }( U, t1 `9 t+ k0 a0 y/ Z0 X% i4 G) [* z

$ p3 }; v. \5 {) U3 c- P& O* k$ E8 {' N& [

8 h1 I' S5 L& ^( f: h/ L+ ^9 @  Q4 H8 v9 b& ^8 I

! c/ b/ l) x- U- L  R" A  h0 X, }) q) {
但  为採用保守下注法时赢的机率,所以知在情况二时,以保守法的  为最大;但在情况三时,却以保守法的  为最小。
& l+ ?+ t: b: a! U; n4 Q" E/ O( X) L- s+ a
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
  B7 k9 R# `! l& F- N: i1 K5 {; v9 J
附录 ( r9 `- B  ~6 e0 p: r6 j
; ^8 k! ^. k6 [' i

  E' d  m; ]: _6 L2 B在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当  时为 T=cm,当  时为 2 w5 O1 ?' [. Y2 r7 f8 W! o
) F) t" Z0 r8 W' m' b7 \) E
2 o9 W% z, g8 d% Q0 p) l
# D9 G4 F4 e& i  d- ]! m! K; l: P

! |6 n% D5 f1 }2 N2 u2 |- e% M- P+ n! y1 l! R

+ R' ]3 s6 K8 y' w$ C& N( m2 y
5 S3 y/ x( A% Y, u
# r6 T' y% j- K  c& [4 U另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者: 爱拼猎人    时间: 2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者: tb35891    时间: 2010-12-4 16:55
好文章,学习了.
作者: tb35891    时间: 2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者: 牛二哥    时间: 2010-12-5 23:11
我也来学习下
作者: ck6767    时间: 2010-12-6 09:46
太深奥了!!!!!!!!!!




欢迎光临 优惠论坛 (https://tcelue.cc/) Powered by Discuz! X3.1