本篇文章3517字,读完约9分钟
展出品|新浪科技“科学大家”
写作|蒋东辰北京林业大学新闻学院讲师,硕士学生导师
youcannotbecertainaboutuncertainty。
——弗兰克knight
人类本能地追求明确性。 明确性有助于人们理解和掌握事物变化的规律,提高预测,评价未来快速发展的可靠性。 在现实世界中,多个事物的迅速发展都具有不明确性:有些不明确性来自事物本身,另一个是因为外在影响因素太多。 完全正确地预测这些不明确的东西是不现实的。
不明确性给人们带来麻烦和不安,给人们带来挑战和喜悦。 人类早期的模糊性分析和讨论往往与赌博和骰子等随机游戏密切相关。 根据文案,两河流域的西亚人从几千年前开始就使用距骨、植物等原始材料制作骰子进行娱乐。 古埃及人掷骰子玩“猎狗和狼”(类似于现代的“蛇和梯子”)游戏。
吉罗莫·卡尔达诺( girolamo cardano )是文艺复兴时期意大利百科全书的学者,在西方最先给出了二项式系数和二项式定理。 据说卡尔达诺年轻时一个人赌博,他经常借钱,但总是通过赌博和国际象棋偿还债务。 卡尔达诺通过掷骰子理解不明确性和概率,使用发生比( ODS )描述赌博中出现有利或不利状况的可能性,预测赌博结果。 卡尔达诺于1564年左右完成的《关于赌博游戏》( liber de ludo aleae )一书是第一部为概率论的创立做出贡献、被认为是概率论创始人的概率论著作。
17世纪,赌博游戏在欧洲宫廷盛行。 法国赌徒谢巴里·埃梅内( chevalier de méré)在赌注分配上与别人产生了分歧,因此咨询了数学家布莱斯·帕斯卡( blaise pascal )。 1654年,帕斯卡与皮埃尔·费马( pierre de fermat )讨论了赌博中的积分分配问题,将期望的想法纳入了推理和计算中。 在帕斯卡的鼓励下,荷兰数学家克里斯蒂安·惠更斯( christiaan huygens )深入了积分分配等游戏游戏游戏,决定了期望的概念。 1657年,惠更斯将研究结果总结为成文《关于赌博中的计算》( de ratiociniis in ludo aleae ),作为弗朗西斯酒店( frans van schooten )《数学练习》的附录出版。 该文得到学术界的广泛赞同,在欧洲多次再版,作为概率论的标准教材已经50年了。
《推测术》( ars conjectandi )是概率论快速发展史的另一部经典著作,由瑞士数学家雅各布·伯努利( jakob i. bernoulli )完成。 这本书既包括总结和整理伯努利前人的工作,也包括对他自己概率的哲学思考。 伯努利认为概率不是作为事情明确性的尺度事先已知的,而是必须在事后明确。 基于这一看法,伯努利给出了许多法则的最初描述,认为事物的概率可以通过许多独立的同种随机实验的频率统计来描述。 因为人们朴素的认识经验可以用数学语言来表现。 1837年,法国数学家西蒙娜·泊松( siméon d. poisson )发表了《关于犯罪和民事判决概率的研究》( recherchessurlaprobabilitédesjugementsenmatièrescriminellesetiè 塔尔苏斯定律为“根据频率估计概率”理论奠定了基础,支持未知的参数估计。
为了快速计算二项式展开系数,法国数学家亚伯拉罕·杜莫夫( abraham de moivre )参考级数和微积分的做法定义了斯特林公式,计算了概率论中常用的n! 。 在此基础上,雅马莫夫发现了中心极限定理的特例:他在《机会论》( de mensura sortis seu )第二版中使用“正态分布”近似投掷硬币正面朝上的频率,实现了二元展开中间项系数的近似表现。
1801年,德国数学家约翰·高斯( johann k. f. gauß )结合观测数据,使用最小二乘法等计算方法发现了谷神星的运行轨迹。 之后,高斯集中于曲面、曲线的计算:在假定观测值的算术平均值具有最大可能性的基础上,成功地得到了用于使用最小二乘法描绘误差的高斯表型曲线(即正态分布曲线)。 高斯认为,如果观测误差符合正态分布,使用最小二乘估计计算出的回归系数有可能达到最大。
根据吉莫夫和高斯的事业,法国天文学家、数学家皮埃尔·西蒙·拉普拉斯( pierre-simon marquis de laplace )说明了可以用正态分布近似计算二元分布(这个结论后来与吉莫夫拉斯中心极限定理 1901年,俄罗斯数学家亚历山大·利亚普诺夫( aleksandr m. lyapunov )利用随机变量严格解释了中心极限定理。 中心极限定理被认为是概率论最重要的定理之一,为人们开展认知误差、统计分解提供理论支持,正态分布也具有良好的数学特征,因此被广泛应用于误差估计。
随着数学公理化的加快,俄罗斯数学家安德烈·科尔莫戈洛夫( andrey n. kolmogorov )将样本空之间与测度理论结合,于1933年建立了概率论基础( Foundationsofthetheoryofprobas ) 人们可以根据具体的概率假设,通过严格的逻辑推理和数学计算得到特定随机变量的数学特征,进而实现未知问题的分析和预测。
概率论有助于基于概率假设实现不明确的事情的分析和预测,但是为了得到对其的基本认知需要很多统计方法。
是统计学的另一个分支,通过收集、整理、解释和分解数据,使人们能够正确评价事物的特征和规则。 古希腊思想家茨基迪德斯在《伯罗奔尼撒战争史》( history of the peloponnesian war )中写道,公元前5世纪雅典人根据斯巴达城墙的砖数计算士兵,判断斯巴达城墙的高度。 中世纪,阿拉伯哲学和自然科学家艾肯迪( al kindi )使用频率统计的做法解读了加密信息。 1662年,约翰葛兰特( john graunt )和威廉配位( william petty )将统计方法应用于人口普查。 1710年,约翰·阿布斯诺特( john arbuthnot )将统计推断用于伦敦地区新生儿的性别调查,这也是假说检查方法首次用于统计分析。
随着概率理论的完善,统计学也向更科学的方向迅速发展。 英国统计学家弗朗西斯·戈尔顿( francis galton )和卡尔·皮尔逊( karl pearson )是现代数理统计的主要创始人戈登提出了标准差、关联性、回归分解等概念,并将相关统计做法应用于人类心理特征的研究 皮尔逊迅速发展了回归分解和关联性理论,提出了曲线整体参数估计的矩估计法。 1900年,皮尔逊还提出了著名的卡方假设检查,以检测随机变量的分布类和独立性。 随后,英国统计学家威廉·戈塞( william s.gosset )提出了学生的t分布假设检查,处理了未知方差小样本分布的参数估计问题。 英国统计学家罗纳德·费舍尔( ronald a. fisher )基于方差分解完成了极高似然估计,提出了基于F分布的假设检查方法。
假设检查是重要的统计估计方法。 根据假设,根据随机变量的统计特征推测假设的可靠性.假设检查是基于不明确性的显着差异评价,其推测基础不是逻辑推理中的排他性,小概率的事情在一次实验观测中不可能发生。 通过这个估计假设,人们可以以较少的价格和较低的风险进行数据估计。 1930年前后,埃贡·皮尔逊( egon pearson )和耶日内曼( jerzy neyman )系统地解体了假设检查的做法,他们认为假设检查有两种错误:第一类是“假的”,即检查假设h0是真实的 第二个是“假为真”,即检查假设h0不成立,但统计推断为h0成立。 因此,人们经常使用一致的最大效果( ump )检查、无偏差检查、似然比检查等方法来降低发生两种错误的可能性。
现代统计学已经广泛应用于各种决策行业,与概率论一起成为许多学科实验数据观察的基础。 随着大数据和深度学习技术和做法的高速发展,概率论和数理统计越来越受到关注,用于处理聚类、相关分析、异常检测、特征学习等诸多问题。 人工智能的研究正在进一步深化,概率论和数理统计将对基于数据收集的新兴学科的迅速发展产生巨大影响。 (本文由北京航空空宇宙大学王东明教授审查)
注:阿狗数学是北京航空宇宙大学数学系统科学学院王东明教授团队运营的微信公众平台,致力于算法数学的介绍、宣传。 欢迎有趣的伙伴活跃投稿! 帖子请发送到邮箱xiarilun@buaa.edu。
“科学大家”专栏投稿邮箱: sciencetougao@sina投稿请注明姓名、单位和职务
标题:【要闻】科学大家
地址:http://www.erdsswj.cn/oedsxw/15175.html