如何利用Excel中进行高级数据分析(上)


2. 添加趋势线,并且显示回归分析的公式和R平方值:

如何利用Excel中进行高级数据分析(上)-36大数据9
如何利用Excel中进行高级数据分析(上)-36大数据10

从图得知,R平方值=0.9995,趋势线趋同于一条直线,公式是:y=0.01028x-27.424
R 平方值是介于 0 和 1 之间的数字,当趋势线的 R 平方值为 1 或者接近 1 时,趋势线最可靠。因为R2 >0.99,所以这是一个线性特征非常明显的数值,说明拟合直线能够以大于99.99%地解释、涵盖了实际数据,具有很好的一般性, 能够起到很好的预测作用。
3. 使用Excel的数据分析功能
1)点击【数据分析】,在弹出的选择框中选择【回归】,然后点击【确定】:

如何利用Excel中进行高级数据分析(上)-36大数据11

2)【X值输入区域】选择访问数的单元格,【Y值输入区域】选择销售额的单元格,同时勾选如下所示的选项,包括残差、标准残差、残差图、线性拟合图和正态概率图。

如何利用Excel中进行高级数据分析(上)-36大数据12

3)以下内容是残差和标准残差:

如何利用Excel中进行高级数据分析(上)-36大数据13
如何利用Excel中进行高级数据分析(上)-36大数据0

4)以下是残差图:

如何利用Excel中进行高级数据分析(上)-36大数据14

残差图是有关于实际值与预测值之间差距的图表,如果残差图中的散点在中轴上下两侧分布,那么拟合直线就是合理的,说明预测有时多些,有时少些,总体来说是符合趋势的,但如果都在上侧或者下侧就不行了,这样有倾向性,需要重新处理。
5)以下是线性拟合图

如何利用Excel中进行高级数据分析(上)-36大数据16

在线性拟合图中可以看到,除了实际的数据点,还有经过拟和处理的预测数据点,这些参数在以上的表格中也有显示。
6)以下是正态概率图

如何利用Excel中进行高级数据分析(上)-36大数据17

正态概率图一般用于检查一组数据是否服从正态分布,是实际数值和正态分布数据之间的函数关系散点图,如果这组数值服从正态分布,正态概率图将是一条直线。回归分析不一定得符合正态分布,这里只是仅仅把它描绘出来而已。
以上数据表格和图表都说明公式y=0.01028x-27.424是一个值得信赖的预测曲线,假设搞活动时流量有50万访问数的话,那么预测销售将是51373,如下图所示:

如何利用Excel中进行高级数据分析(上)-36大数据18

VIA:szwebanalytics

更多详细信息,请您微信关注“计算网”公众号: