Skip to the content.

统计学可以分为描述统计学和推断统计学。

描述统计学:数据整体的认识;全部数据。

推断统计学:通过抽取样本数据特征来描述整体特性;假设检验。

应用:有数据的地方就有统计学。经济学、医学、心理学、互联网等。

1. 描述统计学

1.1 集中趋势

如何表述集中趋势?

类型 优点 缺点
均值 适用性强 易收到极端值的影响
中位数 不受极端值影响 不敏感
众数 有明显集中趋势的时候好;不受极端值影响; 缺乏唯一性;可能有多个或者一个都没有;

如果数据比较集中或者对称,这几种方式都能很好的描述;

1.2 离散趋势

1.3 偏态

小结

2. 推断统计学-假设检验

2.1 基本思想

小概率思想和反证法思想。

2.2 无罪推定原理

无罪推定(presumption of innocence),又可称为无罪类推(与有罪类推相对应),简单地说是指任何人在未经依法判决有罪之前,应视其无罪。

希望假设论断成立,使用备择假设;希望不成立,选择0假设。

2.3 假设检验的步骤


In [4]: from scipy import stats as ss
   ...: df=DataFrame({'data':[10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9]})
   ...: ss.ttest_1samp(a = df, popmean = 10)
   ...:
Out[4]: Ttest_1sampResult(statistic=array([ 0.65465367]), pvalue=array([ 0.52906417]))