概率计算公式(小学概率公式大全)
文末扫描海报二维码领【零售指数体系思维导图】
hyn | 作者
知乎专栏 | 来源
从小在文科,的我一听说数学知识就头疼,没有统计数据。基础,我以前用Excel做零售分析的时候从来没想过统计和数据分析有什么必然的联系。直到这段时间,通过各平台搜集的数据分析相关资料和书籍,了解到学习数据分析对于统计基础来说是必不可少的今天,这篇文章将简单谈谈我最近学习的统计学中描述性统计分析和基础概率的知识。
描述性统计
统计描述性分析是统计分析的第一步。在日常的数据分析中,我们经常会用到一些特征值,尤其是在做周分析或者月分析的时候。这些描述性统计分析特征值对我们有一定的帮助。描述性统计分析是正确统计推断的先决条件。可以通过数据的分布类型和特征、集中程度和分散程度进行初步分析。
描述性统计有几个常用指标,分别是:平均值、四分位数、标准差、标准分。
(1) 平均值 (:读作“miu”)。平均值是统计学中最常用的统计量,也是集中趋势最常用的度量值。除了平均值之外,还有众数、中位数等集中趋势的共同值。
- Average:是一组数据的总和除以这组数据的个数。缺点是对异常值不敏感。
- Mode:指一组数据中出现频率最高的数据。一组数据可以有多种模式或没有模式。
- 中位数:按大小顺序排列一组数据,形成一个系列。如果这组数据的个数为奇数,则数列中间的数据为中位数;如果数据数量为偶数,则中位数为中间两个值的平均值。
(2)季度:一组数据按从小到大的升序排列,分成四等份。1/4、1/2和3/4处的值是四分位数。我们分别称这三个值为下四分位数、中位四分位数和上四分位数。
四分位数有一个非常生动的表达,那就是 boxplot 。我们可以通过boxplot比较不同类型的数据。
蓝色范围为极度异常值,红色为中度异常值。
(3)标准差(读作“适马”),方差的算术平方根,反映一组数据中个体之间的离散程度(也称为波动大小)。
(4)标准分用来表示一组数据中某个值离平均值有多少标准差:
概率
Probability,简单来说就是用一个数值来表示某件事情发生的可能性,这个数值必须在0到1之间。
简单的概率计算可以总结为一个公式:
复杂的概率计算有两种方法:
方法一:寻找业内权威机构发表的概率作为参考
方法二:数据分析
生活中可以应用的几种概率思维:
赌徒谬误
赌徒谬误,又称蒙特卡洛谬误,是一种错误的信念,认为随机序列中某个事件的概率与之前的事件有关,也就是它。如果一枚公平的硬币反复抛,反面反复抛起来,赌徒可能会误以为下次抛正面的几率会更大。
独立事件的概念可以详细解释为什么上述观点被称为谬误。独立事件是指事件B的发生或不发生对事件A没有影响,这意味着事件A和事件B之间存在某种“独立性”,其对象可以是多个。
大数定律
想要了解大数定律,首先要了解什么是小数定律:
本章内容只是笼统地总结了与数据分析相关的统计基础知识,关于统计学还有很多值得我们去探索、学习和乐趣的地方。理解统计学可以为我的数据分析打下坚实的基础。还有很长的路要走。坚持住。
本文为