数据科学家最常用的10种算法

图1:数据科学家最常用的10大算法,所有算法见文末表格

每个受访者平均用到了8.1种算法,这相比于 2011 的相似调查显示的结果有了巨大的增长。

相比2011年对数据分析算法的调查,我们注意到最常用的方法仍然是回归,聚类,决策树/规则以及可视化。比例增幅最大的是(增幅=%2016/%2011 -1):

  • Boosting算法,提升了40%。由2011年的23.5%提升倒2016年的40%
  • 文本挖掘(Text Mining),提升了30%。从27.7%提升到35.9%
  • 可视化(Visualization),提升了27%。从38.3%提升到48.7%
  • 时间序列/序列分析(Time series/Sequence analysis),提升了25%。从29.6%提升到37.0%
  • 异常检测(Anomaly/Deviation detection),提升了19%,从16.4%提升到19.5%
  • 组合方法(Ensemble methods),提升了19%,从28.3%提升到33.6%
  • 支持向量机(SVM),提升了18%,从28.6%提升到33.6%
  • 回归(Regression),提升了16%,从57.9%提升到67.1%

◆ ◆ ◆

2016年新秀中最为流行的是