盖呀盖呀概率论|´・ω・)ノ

1. Data Representation (数据分析)

1.1 4种测量的scales

Nominal

  • 特点:非数字,不可排序
  • e.g. 性别,颜色

Ordinal

  • 特点:非数字,可排序
  • e.g. 调查问卷中的选项:非常不赞同,不赞同,中立,赞同,非常赞同

Interval

  • 特点:数字的,可排序,比值无意义(没有true '0')
  • e.g. 摄氏度,华氏度,IQ

Ratio

  • 特点:数字的,可排序,比值有意义(有true '0')
  • e.g. 重量,长度

总结

FeaturesNominalOrdinalIntervalRatio
Distribution
Orderx
+ -xx
x /xxx
true 0xxx

1.2 集中与离散的测量

Mean 平均数

$$ \overline{x} = \frac{\sum_{i=1}^{n}x_{i}}{n} $$

Median 中位数

  • 总之就是中间那个数。
  • 数据总量为偶数的话最中间两个取平均

Mode 众数

  • 出现次数最多的那个数
  • 众数可以有多个

Range

Quartiles split

$$ Range = Max - Min $$

IQR (Interquartile Range)

$$ IQR = Q_{3} - Q_{1} $$

Variance $s^2$ 方差

$$ \sigma^{2} = \frac{\sum\limits_{i=1}^{N}(X_{i}-\mu)^{2}}{N} $$

Standard deviation $s$ 标准差

$$ \sigma = \sqrt{\frac{\sum\limits_{i=1}^{N}(X_{i}-\mu)^{2}}{N}} $$

1.3 Graphs

Qualitative 定性的

  • barplots(条形图)
  • piecharts(饼状图)

Quantitative 定量的

异常数据判断

boxplots

只有在以下范围内的点才认为有意义。

$$ Q_{1} − 1.5IQR < x < Q_{3} + 1.5IQR $$

2. Permutation and Combinations (排列组合)

2.1 Permutation

$$P(n,r)=\frac{n!}{(n-r)!}$$
包含顺序信息
e.g. 从{3,4,5,6,7,8}挑组成3位数,有 $P(6,3)$种可能性。
个,十,百位位置是有差异的

2.2 Combinations

$$C(n,r)=\frac{P(n,r)}{r!}$$
不包含顺序信息
e.g. 从{3,4,5,6,7,8}挑3个不重复的数,有$C(6,3)$种可能性。

2.3 Probability of Counting

e.g. 六面筛子投四次,只有三次为6的可能性为$(\frac{1}{6})^{3}\cdot C(4,3) - (\frac{1}{6})^{4}$或者$(\frac{1}{6})^{3} \cdot (\frac{5}{6}) \cdot C(4,1)$

3. Experiments, Outcomes and Events

3.1 Definition

  • Experiment 实验 = 任何形式的观察
  • Sample Space 样本空间 = Exp 所有的可能事件
  • Trial 一次试验
  • Event 事件 = Sample Space 下的任何子集

栗子

掷六面骰子:

  • Sample Space = {1,2,3,4,5,6}
  • Event A = {2,4,6} outcome为偶

3.2 Set Theory 集合

The union (OR) 并集

$$ A\cup B=\left \{ x:x\in A\;or\;x \in B\right \} $$

The intersection (AND) 交集

$$ A\cap B=\left \{ x:x\in A\;and\;x \in B\right \} $$

集合遵循distributive(分配律)associative(结合律)

Venn Diagram

一种理解set非常直观的方式,很有用。
->百度百科


参考课件:
MTH102_18-19_Lecture 01_v01_Data_Analysis.pdf
MTH102_18-19_Lecture 02_v01_Combinatorics.pdf
MTH102_18-19_Lecture 03_v01_Sets Intro-Probability.pdf

作业及答案:

Last modification:July 7th, 2019 at 12:13 pm
If you think my article is useful to you, please feel free to appreciate