首页 >> 其他 >> 数学 >> 文章

从庄家不输钱谈起Comments>>

发表于 2009-05-04 06:50 | Tags 标签:, , ,

经常有人说"概率是毫无意义的事情,如果事情发生了,概率就是百分之百,如果没有发生,就是零"。这样的想法是对概率完全错误的理解。为了解释概率,我们从赌场坐庄开始。

我们知道开赌场几乎没有输钱的。尽管有人从赌场赢了钱,但是输的人更多。很多人认为是赌场有"赌神",或者赌场能"出老千",其实都不是,赌场赢钱的原因在于概率的应用。换句话说,概率决定了赌场是占便宜的一方。赌客越多,赌场就越不容易输。

我们来玩一个游戏:如果有14张牌,其中有一张是A;现在我来坐庄,一块钱赌一把,如果谁抽中了A,我赔他10块钱,如果没有抽中,那么他那一块钱就输给我了。有人赌吗?

这样的一个赌局,为什么说我占了便宜呢?因为在抽之前,谁也不知道能抽到什么,但是大家可以判断抽到A的可能性要小得多,14张牌中才有一张,换句话说概率是十四分之一,而抽不中A的概率是十四分之十三。概率就是这样一个对未发生的事情会不会发生的可能性的一种预测。如果你只玩一把,当然只有两种可能:抽中了赢10块钱,没抽中输一块钱。但是,如果你玩上几百几千甚至更多把呢?有的抽中,有的抽不中,几千几百把的总结果是什么样的呢?

这就是概率上的一个概念,叫做数学期望。可以理解成某件事情大量发生之后的平均结果。现在我们来看上面的那个例子,抽中的概率是1/14,结果是赢10块钱(+10),抽不中的概率是13/14,结果是输1块钱(-1)。把概率与各自的结果乘起来,然后相加,得到的"数学期望"值是(-3/14)。这就是说,如果你玩了很多很多把,平均下来,你每把会输掉(3/14)块钱。如果抽中A赔13块钱,那么数学期望值是0,你玩了很多把之后会发现结果最接近不输不赢。如果抽中A赔14块钱,那么数学期望值是1/14, 对你有利,大量玩的结果是你会赢钱,我当然不会这么设赌局。

赌场的规则设计原则就是这样,无论看起来多么诱人,赌客下注收益的数学期望都是负值,也就是说,总是对赌场有利。因为有大量的人赌,所以赌场的收支结果会很接近这个值。比如美国的轮盘赌,38个数随机出,你压一个,压中了赔你35倍,没压中你的钱输掉。其它的赌局规则可能更复杂,比如21点,但是背后的概率原理是一样的,就是赌客的数学期望值是负数。像我们通常见到的彩票,如果所谓的返回比是55%的话,那么花一块钱的数学期望是赔掉0.45块。无论是赌场还是彩票,幸运儿的产生必定伴随着大量献爱心的人。赌场和彩票生意兴隆的基础,是每个人都认为自己会是那个幸运儿。

数 学期望的概念是作理性决策的基础。我们做任何一项投资,做任何一个决定,都不能只考虑最理想的结果,还要考虑到理想结果出现的概率和其他结果及其出现的概 率。否则,如果只考虑最理想的结果,大家都应该从大学里退学--从大学退学的最理想结果是成为世界首富,那个叫比尔盖茨的家伙。

概 率问题的关键是随机性,比如扔一个硬币,谁也无法预测是正面还是反面。同样,掷骰子、摇奖也是。有个最搞笑的职业叫"彩评家",号称分析彩票号码的规律, 预测下一期最可能的号码。电视里的"彩评"节目往往是专家侃侃而谈,主持人做兴致盎然崇拜状。经常听到的话是"这几个数字前两期出现了,根据概率,下一期 不大可能出现"。这可以称之为一本正经地胡说八道。按照概率理论,两件不相干的事情都发生的概率是各自发生概率的乘积,所以两件不相干的各自概率为万分之 一的事情都发生的可能性是一亿分之一。但是,如果一件已经发生了,那么另一件发生的概率还是万分之一,跟已经发生的事情无关。只要彩票的摇奖没有丑闻,那 么中奖数字是无法预测的。不管前几期出现了什么号码,下一期的号码仍然是随机的。出现过的数字不会避嫌,没出现过的数字也不受到照顾。不过观众还是会觉得 "彩评家"的"预测"是对的,因为他说不会出现的号码后来确实没有出现。其实这种"彩评家"每个人都可以当--你随便写几个数,说"下一期这几个数不会出 现",再找个神神叨叨的理由,你也就成"大师了"。因为你不管你写什么数字,中彩的可能性都是非常非常小的。

据说概率是起源于赌场的学问,但是它的价值已经远远超出了赌博。这里举一个很现实的把概率知识转化成经济效益的例子:要在人群中普查一种病,检查方式是抽血检测其中是否含有某种病毒,这种病在人群中的发生率比较低,比如说1%。对于这样的一种普查,成本最高的地方是检测血液,如果能减少血液检测的数量,就能节约大量成本。我们很自然地想到抽每个人的血,然后检测,这样有多少人就验多少份血,简单明了。为了形象起见,假设有1000万人,那么直接检测的方案是测1000万份血。现在我们换一下思路,把抽来的血两两混合,送去检测,如果检测结果阴性,表明原来的两份血都没问题;如果结果阳性,表明至少有一份血有问题,就把两份都重测。这样也可以确定每个人的带病情况。这样作的总检测量是多大呢?两两混合之后,要检测500万份,然后结果阳性的那些重测,大概是20万(1000万人的1%是10万人带病,导致20万份血重测),总共检测520万份的样子。实际上还有一部分阳性的样品是混合的两份血都带病,这样实际的阳性结果比10万份还要少。总之我们看到,检测总数几乎减少了一半,能省很多钱了吧?如果把10份血混一起再测呢?同样的分析,先要检测100万份,加上结果呈阳性的最多10万份混合样品重测--共100万份原始血样需要重测,总共最多检测200万份就搞定了。

在这个例子里,多少份血混在一起最划算,取决于人群中的发病概率,跟要检测的总人数无关。另外一个考虑因素是血样混合之后,病毒浓度被稀释了,是否还能被检测出来。综合考虑这些因素,运用概率和并不复杂的优化计算,可以精确地算出把几份血样混在一起最省钱而又能完成任务。

图片来源:It's A Gamble by MarkyBon

相关文章
  1. 抽样调查很常见,但把样品混到一起来测量的主意还真是第一次听说,听上去很有道理呀。不过再一想,如果把十份血样混到一起检测 ,恐怕会有个检测灵敏度的问题。一个有异常的血样被另外九个正常血样稀释了,会不会就变得正常了?

    • 标本混合检验技术,其实在血液筛查领域已经有广泛的应用了
      俗称叫做Pooling混合检验技术

      至于混合操作导致的标本稀释作用是否会影响阳性标本的检出,或者说带来假阴性结果
      这个问题可以通过两种手段来避免
      1.混合方案验证,通过大量样本的对比实验,确定对灵敏度影响最小的标本混合方式
      2.开发具有更高灵敏度的检测试剂盒产品

  2. 相当不好的文章,属于“硬写出来”的一类了。

    庄家并不是赌,而是“聚赌”。所以不会输钱。因为庄家的钱是从“营业额”中出。就好比是证券交易市场,那也是一个有限股份公司,收入从营业额中抽,不论做交易的人的亏或赢。

    至于后半部的抽查,需要导入个可信度的概念。根据这个“可信度”的要求决定检查抽样的多少。

    • 不是吧,
      可能不同的赌场有不同的模式,
      但是大赌场应该还是庄家~

    • 你的理解不对。
      1. 四川的那种茶馆才是聚赌,收场地费。赌场是作为庄家参赌的。
      2. 文中说的是普查而不是抽查,因此和你说的置信度没有关系。区别在于普查不能漏掉任何一个病毒感染者,而抽查只是要得到比例值。

        • 对于赌场,抽头是一种盈利方式,而利用概率则是另一种。在现在,为了吸引赌徒,赌场很少抽头,大多是利用概率的方式来盈利。
          关于赌场中的概率论,可以参看《机会的数学原理》一书,里面对于各种赌博方式有比较详尽的分析。

          普查和抽查的确是不同的概念。国家的计划生育普查也是要求到每户的,而不是小范围抽样。当然,在优化的计算中可能需要引入灵敏度和特异性,这样才能更准确地计算。当然这个就是因应各种不同的检查方法而异的。对于一些检查方法,也许可以进行近似计算。

          我觉得kk的说法大部分是没有问题的。

          • 合法的赌博都是商业运作,非合法的不论。也就是说,“分红”是刨去成本后的再分配。

            至于“我觉得kk的说法大部分是没有问题的”,只能说明各位没有做事情的经验。如果是“要在人群中普查一种病”,不确定到个体的人就没有“普查”的意义了。因为是要普查某种疾病病、是要有些医疗的作为才能有行动。而云女士所说的做法显然是不能达到识别个体的要求。也就是说云女士例中的目地与所采用的手段不匹配。

            做一个事情是需要成本的。要达到一个什么目的,需要投入多少成本才合适?这是个需要考虑的问题。问题的所在不在与“普查”还是“抽查”,而是要达到什么样的目的,以及达成目的所需成本的合理性。

          • 关于普查,可能你漏看了一样东西:如果出现阳性反应的话,每份混合的血都是需要重测的。但即使是这样,由于阳性反应的概率很低,所以只要优化方式选择得合理的话,即使偶尔需要进行重测,这种先混合再检测的方法也还是更有效更节省成本的。

            至于赌博的例子,我实在看不出来你的说法跟我们讨论的赌场究竟是主要利用概率来赚钱还是主要利用抽头赚钱有什么关系。利用概率也是合法的。这个是周瑜打黄盖,一个愿打一个愿挨。

          • 这位 mirror ,您搞错了吧?
            本文作者不是一位女士。

            这里有他的简介:http://songshuhui.net/archives/7039.html

        • 怎么老有这种人呢,
          自己想问题就是用脑子,
          别人想问题就是用屁股?

          讨论问题归讨论问题,
          别动不动就众人皆醉我独醒的样子,
          您这么牛逼怎么不去得诺贝尔奖?

          • 我记得好像MIRROR同学好像一直这样,抬杠,刻薄...
            关于概率和抽查普查的问题,我想,如果要一丝不苟的不留攻击缝隙的写出来,怕是老云要累死...

  3. 我还是觉得不确定的东西是不可能存在的……概率只是一种近似的模型而已……虽然它现在工作得很好,而且的确也能解决问题……
    但是只要我们把一切所有可能影响到目标的参数都考虑进来,那么它的结果就是确定的了。。。。。问题是,现在的技术水平还达不到,甚至从理论上几乎已经证明了不可能达到(最简单的例子就是测不准原理了吧),所以只好退而求次用概率了。。。。

    • 所谓的预见未来不是不可能的啊,比如我们预见地球的轨道等等

    • 概率不是要确定存在与否吧,是做出数学上的分析而已
      告诉我们发生A的机会比B的机会大,大多少

    • 就我自己的理解,概率存在的很大原因之一是构成这个现实世界的系统是多变量、强耦合的非线性,在很多环节还是很严重的非线性。即使知道了所有过程的原理,求解也需要很大的计算量。更何况在很多领域,人类只是摸到门口而已。

  4. 独立性严格定义是P(AB)=P(A)P(B)。也就是说只有确知A,B两事件出现的概率互不影响,才能说他们相互独立;

    而在彩票问题上,彩民和数学家的分歧是:数学家认为每次抽奖的号码是“天然地”相互独立的,他们认为独立性是一种先验的性质;而彩民(多数彩民)则认为每次的号码之间有某些冥冥之中的联系,这种联系既不能被证实也不能被证伪,从而每次的号码的出现是有规律可循的——除非有人给出了∞年的号码分布并证明其没有规律,否则谁也不能否定他们的信仰。。。

  5. “概率是毫无意义的事情,如果事情发生了,概率就是百分之百,如果没有发生,就是零”。

    对于开赌场的人来说,这句话当然完全错误。但是,对于你,一个小小的赌民,也许怀揣的巨款是挪用的公款,一旦填补不上就要锒铛入狱,那么,这句话就是正确的——哪怕胜率是99%的赌博也不能参加,因为风险和收益是不对称的,

    其实我是纯粹来找茬的,哈哈~

  6. 话说我一直就想弄明白这个问题,就是“独立性”的判断标准是什么?
    比如最简单的单纯随机,扔钢蹦
    按说每扔一次算是独立的吧,因为周边条件,比如空气阻力,扔的力度,角度,高度,落地碰撞,应该是不受上一次扔的结果的影响。所以说就算当你扔了九次之后,第十次扔,出现正面和反面的机率仍然应该是各为50%
    但如果前九次扔的结果通通都是正面,那我想要是押注的话,一般人都会押这次该是反面了吧,因为连着十次出现正面的机率是2的十次方,而连着出现九次的机率是2的九次方,这之间的差别可大了去了,这样看的话,似乎前面的结果又对第10的结果有影响,也就是不是独立的。
    云无心能不能给说说,比如遇到这种情况,我们到底该押正面,还是反面,为什么?

    • 假设你是第九次扔了硬币之后才来参加这个赌局,你不知道前九次的结果,你怎么押?

    • 有一个地方你没有理解,
      连着十次出现正面的机率是2的十次方,这一点是正确的;
      同时,连着出现九次正面,第十次是背面的机率也是2的十次方

      • 正解。我的错误在于假定连续十次正面的概率是2的十次方分之一的话,就认为相反结果的概率会大的多,而事实上,像james所说,九次正一次负的概率也是2的十次方分之一,应该说,十次里面任何一次结果的正面反面的所有组合,每种组合发生的概率都是2的十次方分之一,没有差别,当然,扔出五正五反的组合数比扔出九正一反的组合数多的多,概率也更大,但对于已扔过的,已发生的是100%,确实最后一次正反概率都是50%。lazy说的专业一点

    • 哈哈,
      要是这么好的事情被你碰上了,
      千万别和大多数人一样压,
      一定要和庄家保持一致,
      庄家吃大不吃小~

    • 首先纠正一下,连着十次出现正面的机率是2的十次方分之一。
      你所讲的是频率,而不是概率。这两个概率是不一样的。而且,我们所算的概率也只是在理想情况下,只有当实验的次数很多很多时,频率才会于概率竟似相等

    • 如果扔了连续9次的正面,最大的两种可能是:1.见鬼了;2.硬币两面不是均等的。如果庄家没有更换环境、设备,押正面才是正解。

    • 能不能这样想呢:
      如果前九次扔的结果通通都是正面,我们可以认为这个硬币有点问题,也就是说它并不是那种正反都是 50% 的标准硬币!
      这样我会猜第十次还是正面……

      P.S:已知前九次都是正面,那么能不能算出来这个硬币出现正面的概率最有可能是多少?

  7. 还是50/50
    简单地想吧,假设后面还要再仍10000000000000次的话,10次连续不算什么了吧,
    那这个假设会影响你么?

  8. 风险对冲……

    例如赌足球,如果一个实力不足的庄家接到一个很大的单子,会分一部分去“上线”下注。

  9. 一直坚信
    概率才是描述真理的最接近表达方式

  10. 楼上讨论的扔硬币连着出现九次正面是一个“已经发生了的前提”,对于已经发生了的事件,其概率是100%,而非一般人想象的2的9次方分之一。
    所以第10次出正面的概率仍是50%。

    反过来假设命题:假如连续9次出现正面,第10次出现正面的概率是多少。这种有前提的概率事件专门有一个公式计算。这种概率到底是多少呢?简单的说,其值是连续出现9次正面概率的1/2,即也是一半。
    哪怕你假设连续10万次正面后,下一次出正面的概率仍是你假设前提的一半。意思就是说,这种假设是个“伪前提”

    所有的概率假设都基于一个前提:即影响参与事件的对象的因素是不可控的。
    假如仍硬币的是一个高手,或者硬币正反两面密度很不同,都会影响事件发生的结果。
    “测不准原理”发生的原因,是在于测量微观世界时,用于测量的观测工具会影响到被观测对象本身的运动,所以产生测不准。比如宏观世界里,你观测一个被观测对象的动量,可以用另一个已知的测量物体去撞击被观测对象查看动量的改变情况(动量守恒原理),假如你用一个原子弹撞击被观测对象,能测的准么?被观测对象都炸没了。

    • Totally agree with you. It is called coin-tossing fallacy.

  11. 看到最后,突然联想到了最近正在看的genome-wide association studies(GWAS)全基因组关联分析方面的paper,分辨率足够的情况下,混合样品测序的方式确实能极大的降低成本呢。
    学好概率:)

  12. 庄家占期望值优势也未必一定赢钱的,如果所有的赌徒赢钱就走,而输钱则继续(赌资足够),直到赢钱为止……,那么庄家怎么可能赢钱呢?

    • 这一点很重要。且不说概率,通常赌徒手头的钱是远远不及赌场的。虽然各有输赢,但赌徒承受风险的能力要小很多,输光了就不得不走没有翻盘的机会;而赌场可以营造一种气氛,令赌徒难以收手。只要赌徒不懂得及时收手,那赌场肯定是最后的赢家。

    • “如果”后面的事情不可能真的出现——用数学上“取极限”的方式来分析一下,会发现庄家还是赢的。这个跟超生一直到生男孩是不是会造成男女比例失衡是一样的。

  13. 赌博和彩票有何不同。。
    为什么赌博违法,彩票合法,不明白。。

    • 只是在我们国家不合法, 基于有可能导致的一系列可预见与不可预见的社会问题决定的

      这些年来已经放宽很多了吧, 深圳的彩票投注点分布密度差不多赶上公交站了

      加上各类媒体不大负责任地夸大宣传,,

      总归是个快速圈钱的好方法

  14. 14张牌中才有一张,换句话说概率是十四分之一,而抽不中A的概率是十四分之十三。概率就是这样一个对未发生的事情会不会发生的可能性的一种预测。如果你只玩一把,当然只有两种可能:抽中了赢10块钱,没抽中输一块钱。但第一种赢的可能性只有十四分之一,而第二种输的可能性却高达十四分之十三。

  15. Pingback: » 也说庄家赢钱的奥秘 | 4G spaces

  16. 彩票也是赌博
    呵呵
    只不过心理期望不一样,可能引起的社会问题小一点。

  17. Pingback: 转载:也说庄家赢钱的奥秘 » 中国数学建模网—SHUMO.COM

  18. 看完回复,只有一种大家都对赌博的研究很有建树的感觉……

  19. 抽血检测那个方法以前就听说过。
    至于概率这个问题,不上一定得量是无法统计的。至少我这么认为。

    对“彩评家”的评论,应该更狠一点!

  20. 概率对事件的预测,出于一个基本的假设。就是存在随机事件。但什么是随机事件?真的存在随机事件吗? 当然,在一定精度下答案是明显的。比如在以人不借助任何仪器来观测抛硬币事件这样的精度下,硬币正反面的出现显然是个随机事件。 但是如果我们提高精度,借助测量工具和超级计算机,在考虑了出手的力度,角度,当时的风速,硬币的质量分布,甚至手上汗水对硬币重心的影响等因素后,硬币正反面出现的几率还是随机事件吗?

    所以我说的是,概率学家在通过概率预测物理事件是,总是很草率的假定一个基础概率进行分析,而根本不去考虑隐藏在事件背后的物理模型。要知道,最终是物理模型决定着每一个事件的概率。

    抛硬币真的正面出现的概率真的是0.5吗? 俄罗斯轮盘赢的概率真的是1/38吗?

    即使是物理规律起不了作用的时候,某些事件的概率也不是那么无懈可击的。从13张牌中抽出一张的概率真的是1/13吗? 发牌的毕竟是人,洗牌次数,方式深浅都可以影响到最终的结果。而一个人是不可能保证他洗牌的序列有足够的离散度的,从而也就无法保证这1/13的概率正确。

  21. 楼上说的影响概率发生的因素是客观存在的,但基础科学研究的是理想情况下发生的情况,比如牛顿定律等等。
    概率学不是简单统计分析几分之一的结果,还有更广泛应用。

    验血的例子,用的是每组n个人同时未患病的概率。

    比如一条生产线能自动检查坏品。坏品率不可能是0%。那么当坏品率达到什么情况时,能说明生产线出了问题?

    概率还有一个用处,就是AI的自动学习,根据已经发生的事件的几率,自动预测下一次事件可能发生的情况,提前作出预处理。
    比如某自动包装设备,要将流水线传过来的产品,根据检测的好坏进行不同的材料来包装。假如已经连续检测到100个正品,那么可以预期下一个是正品,提前准备正品的包装材料,以节省时间。(我只是举例,不要抬杠说该设备的功能设计合理与否)

    所以说,不要认为科学没用,关键看你怎么用。

  22. 那请问三个人斗地主。。。是地主赢的机率多还是农民//