热门留学专业推荐:数据分析——用数据讲叙的艺术 (三)
今天我们继续在数据分析中学会讲故事这个主题。上次讲到了针对文本型数据可以使用的表达方式,今天我们再看看其他类型的数据。
当我们的数据由数字或其他各种格式组成时,我们需要知道哪些是重要的,以便从数据集中提供更好的见解。 
混合数据的视觉效果可能会有所不同在这里,我将向你展示如何对数据使用分面网格(facet grids)方法。这里,我使用泰坦尼克号乘客数据。
(本文图片由原作者提供,如涉及侵权,请联系平台删除,谢谢!)
正如此图向我们展示的那样,女性和头等舱乘客的生存机会往往比属于机组人员或较低登机等级的男性生存机会更高。这不正是泰坦尼克号上真正发生的事情吗?
另一种可视化此类数据的方法是尝试多变量图。此类图表使用的数据集是汽车性能和规格数据集。
(本文图片由原作者提供,如涉及侵权,请联系平台删除,谢谢!)
在这里,我们可以看到,车身较重的汽车比车身较轻的汽车慢。结论符合常识,对吧?
当我们遇到这种数据时,我们通常会寻找描述数字的趋势。最适合数字数据的视觉效果是线条或阶梯图。
(本文图片由原作者提供,如涉及侵权,请联系平台删除,谢谢!)
在这里,我们可以非常清楚地看到成人和儿童景点的价格上涨。有没有发现,用对方法,看到每年间隔的增长是件相当容易的事情吗? 
我们还遇到过与股票有关的数据集。股市数据主要是数值的时间序列数据,但作为交易者或投资者,我们可能想了解每个日期的下跌。在这方面,最具视觉吸引力的图表是烛台图。
(本文图片由原作者提供,如涉及侵权,请联系平台删除,谢谢!)
在这里,我们以特斯拉的股票为例。烛台图表可用于对单个日期进行操作,并可单独查看股票的低点和高点。这可以帮助我们根据当前或过去的市场趋势做出更好的投资决策。 
如图所示,2016年2月是特斯拉股价下跌的一年。我们现在可以使用这些信息来了解其他市场状况和经济状况,从而对他们的股票做出决策。 
当我们拥有与特定位置和区域有关的数据时,我们会使用地图来增加分析的清晰度和意义。
(本文图片由原作者提供,如涉及侵权,请联系平台删除,谢谢!)
在这个例子中,我们可以看到各国在2002年世界杯前后的表现。德国队打进了最多的进球,自此成为世界足坛最具统治力的球队之一。
在预测建模的步骤中讲故事 
通常,我们会被问及我们的故事和视觉效果呈现方法如何在创建数学模型时起作用。在预测建模的所有阶段,讲故事可能是你分析的重要补充。 
让我们了解从数据中创建模型所涉及的基本步骤,并学会在其中讲述故事。
模型构建的第一步是了解自己的数据。我将为你提供具体例子,并向你展示如何在不计算复杂统计数据的情况下进行数据探索。让我们考虑一个关于葡萄酒质量的数据集。数据集的结构如下:
(本文图片由原作者提供,如涉及侵权,请联系平台删除,谢谢!)
在这儿,我们可以看到正在使用的数据集的相关汇总统计信息。
(本文图片由原作者提供,如涉及侵权,请联系平台删除,谢谢!)