教你如何成为数据科学家(二)

来源:互联网 发布:腾讯手游模拟器mac版 编辑:程序博客网 时间:2024/05/17 23:07

由于数据科学家需要和大量的数字打交道,所以统计学方面的知识要求很多


  • Statistics
  1. Pick a Dataset (UCI Repo)                                                      选取一个数据集(给了一个加州大学欧文分校的数据集链接)
  2. Descriptive Statistics(mean, median, range, SD, Var)            描述统计学(平均值,中位数,范围,标准差,方差)
  3. Exploratory Data Analysis                                                       探索性数据分析
  4. Histograms                                                                              直方图
  5. Percentiles & Outliers                                                             百分位值和异常值
  6. Probability Theory                                                                   概率论
  7. Bayes Theorem                                                                      贝叶斯定理
  8. Random Variables                                                                  随机变量
  9. Cumulative Distribution Function (CDF)                                累加分布函数
  10. Continuous Distributions (Normal, Poisson, Gaussian)          连续分布(正常,泊松,高斯)
  11. Skewness                                                                               偏斜度
  12. Analysis of Variance (ANOVA)                                               方差分析
  13. Probability Density Function (PDF)                                        概率密度函数
  14. Central Limit Theorem                                                           中心极限定理
  15. Monte Carlo Method                                                              蒙特卡洛方法
  16. Hypothesis Testing                                                                假设检验
  17. p-Value                                                                                 p值(统计学内的概念)
  18. Chi-square Test                                                                   卡方检验
  19. Estimation                                                                             估计
  20. Confidence Interval (CI)                                                       置信区间
  21. Maximum Likelihood Estimation (MLE)                                 最大似然估计
  22. Kernel Density Estimate                                                       核密度估计(统计学内的概念)
  23. Regression                                                                           回归
  24. Covariance                                                                          协方差              
  25. Correlation                                                                          相关性
  26. Pearson Coeff                                                                     皮尔森系数
  27. Causation                                                                           因果关系
  28. Least Squares Fit                                                               最小二乘法拟合
  29. Euclidean Distance                                                             欧氏距离
可以看到不少概念都是我们概率和统计学里面学过的,但是英文表达方式就不是太认识了……



原创粉丝点击