手把手教数据可视化工具Tableau(四)

2018-11-01 16:52:25作者: Sean己有:2898人学习过

字段类型


连接到新数据源时,Tableau 会将该数据源中的每个字段分配给“数据”窗格的“维度”区域或“度量”区域,具体情况视字段包含的数据类型而定。如果字段包含分类数据(例如名称、日期或地理数据),Tableau 会将其分配给“维度”区域;同理如果字段包含数字,Tableau 则会将其分配给“度量”部分。


那么,可不可以说维度就是包含分类数据(例如名称、日期或地理数据)的字段,度量就是包含数字的字段?以这些断言作为出发点是足够准确的,但当您在 Tableau 中工作时,请记住您可以控制视图中字段的定义。根据用户的要求,大多数字段都可用作维度或用作度量,并且可以为连续或离散。


Tableau 将字段分配给“维度”区域或“度量”区域进行初始分配时建立了默认值。当您单击并将字段从“数据”窗格拖到视图时,Tableau 将继续提供该字段的默认定义。如果从“维度”区域中拖动字段,视图中生成的字段将为离散字段(带有蓝色背景);如果从“度量”区域中拖动字段,生成的字段将为连续字段(带有绿色背景)。


注意:如果您希望能够指示 Tableau 如何将拖到视图的某个字段进行分类,以便覆盖默认值,请在将其拖到视图之前右键单击(在 Mac 上按住 Control 单击)该字段,Tableau 将提示您在指定放下该字段时如何在视图中使用它。


默认情况下,维度是离散的,度量是连续的,但事实上所有四种组合都有可能:

 

 

注意: 对于多维数据集(多维)数据源(仅在 Windows 上受支持),它用于更改数据角色的选项受到限制。您可以将某些度量从连续更改为离散,但通常无法更改多维数据集数据源中字段的数据角色。


1. 维度和度量


当您连接到数据源时,Tableau 会将数据源中的每个字段分配为扮演两个可能的数据角色之一:维度或度量。 当您开始在 Tableau 中处理数据时,这些分配有什么效果?


1.1 维度


当您第一次连接到数据源时,Tableau 会将包含离散分类信息的任何字段(例如,值为字符串或布尔值的字段)分配给“数据”窗格中的“维度”区域。


当您单击并将字段从“维度”区域拖到“行”“列”时,Tableau 将创建列或行标题。



“维度”区域拖出的任何字段在添加到视图时一开始为离散,带有蓝色背景。因此,您可能会顺理成章地假定字段的背景颜色指明了它是维度还是度量(但结果证明这样做是不正确的)。但是日期维度和数值维度可能为离散维度或连续维度,所有度量也都可能为离散度量或连续度量。字段的背景颜色指明它是离散(蓝色)还是连续(绿色)。


将维度拖到“行”“列”时,只需通过单击字段并选择“度量”便可将字段更改为度量。现在,视图将包含一个连续轴(而不是列或行标题),并且字段的背景将变为绿色:

 


如果要将维度设为连续(在未首先将其转换为度量的情况下),则您的选项有限。您只能对日期维度(日期维度可能为离散或连续,但始终是维度)和数值维度这样做,并且您无法转换包含字符串或布尔值的维度。


Tableau 不会对维度进行聚合。如果要对字段的值进行聚合,则该字段必须为度量。将维度转换为度量时,Tableau 将始终提示您为其分配聚合(计数、平均值等)。聚合表示将多个值(单独的数字)聚集为一个数字,通过对单独值进行计数、对这些值求平均值或显示数据源中任何行的最小单独值来实现。有关 Tableau 可执行的不同类型聚合的论述,请参见聚合(http://onlinehelp.tableau.com/current/pro/desktop/zh-cn/calculations_aggregation.html)


在 Tableau 查询中,视图中的维度的 SQL 表示形式为“Group By”子句。


1.2 度量


当您第一次连接到数据源时,Tableau 会将包含定量数值信息的任何字段(即其中的值为数字的字段)分配给“数据”窗格中的“度量”区域。


当您将字段从“度量”区域拖到“行”“列”时,Tableau 将创建连续轴。

 


从“度量”区域拖出的任何字段在添加到视图时一开始将为连续,因此其背景将显示为绿色,但如果您单击字段并选择“离散”,则值将变为列标题。



然而Tableau 会继续对字段的值进行聚合。因为即使该字段现在为离散,但它仍然是度量,而 Tableau 会始终对度量进行聚合。如果有意愿您可以再进一步执行过程,将度量转换为维度。只有这样,Tableau 才会停止对其值进行聚合。


1.3 视图中维度和度量的可视标识


如果您在 Tableau Desktop 中查看视图,并且不确定某个字段是度量还是维度,一个快速的视觉提示已聚合度量: 

而维度则不是:


但是存在以下例外:


  • 如果解聚整个视图,则不会根据定义来聚合视图中的字段。如果您使用的是多维数据源,则会在数据源中聚合字段,但视图中的字段不显示该聚合。

 

1.4 将度量转换为维度


您可以将视图中的字段从度量转换为维度。


或者,如果您希望变更影响工作簿中所有的将来使用该字段的情形,您可将“数据”窗格中的字段从度量转换为维度。


1)将视图中的度量转换为离散维度


您可以从“数据”窗格中的“度量”区域拖动字段,但随后将其用作视图中的维度。例如,假设您想要了解每个可能的折扣率的聚合总销售额,那么您期望的视图如下所示:



“Discount”(折扣)字段包含数值数据,因此当您连接到数据源时,Tableau 会将其分配给“数据”窗格中的“度量”区域。在 Tableau Desktop 附带的“Sample - Superstore”数据源中,“Discount”(折扣)的值范围为 0% 至 80%。


下面是用于创建上面所示的视图的步骤:


STEP 1: 将“Sales”(销售额)拖到“行”,将“Discount”(折扣)拖到“列”。Tableau 将显示一个散点图 — 这是当您将一个度量放在“行”上并将另一个度量放在“列”上时的默认图表类型。



Tableau 以 AVG 形式聚合“Discount”(折扣),并以 SUM 形式聚合“Sales”(销售额)。这些字段都是连续的,因此 Tableau 将沿视图的底部和左侧显示轴(而不是列或行标题)。


STEP 2: 若要将“Discount”(折扣)视为维度,请单击字段(在“列”功能区上)的下拉箭头,并从上下文菜单中选择“维度”。Tableau 不再聚合“Discount”(折扣)的值,因此您现在将看到一条线;但“Discount”(折扣)的值仍然是连续的,因此 Tableau 仍将为两个字段显示连续轴:



STEP 3: 再次单击“Discount”(折扣)并从上下文菜单中选择“离散”以完成该过程。“Discount”(折扣)的转换现已完成,您现在将看到本主题开头初始图像中的条形图。您现在将在底部看到列标题(0%、10%、20% 等),而不是轴。


让我们回顾一下我们是如何实现此目标的:

 


现在只需将“Sales”(销售额)拖到“标签”,然后设置标签格式以提高可读性。


由于数据源中的“Discount”(折扣)只有 12 个唯一的值,因此生成的图表有一定作用。假如每行有一个唯一的值(这种情况对于数值字段很少见),那么生成的视图中单独条形的数量将与数据源中的行数相等,生成的可视化内容将有可能不起用。


2)将“数据”窗格中的度量转换为维度


当您第一次连接到数据源时,Tableau 会将包含定量数值信息的大多数字段(即其中的值为数字的字段)分配给“数据”窗格中的“度量”区域。对于名称表明数据类型的字段,例如“年”或“月”(Tableau 会将其识别为“日期”维度),或者包含诸如“ID”和“键”的字词的字段(Tableau 会将其分类为维度,即使这些字段是数值字段),则情况有所不同。


但是,您可能会决定 Tableau 已分类为度量的其中一些字段实际上应该是维度。邮政编码是很经典的示例 — 它们通常完全由数字组成,但信息是分类信息而不是连续信息 — 您绝不会希望通过对邮政编码进行加总或求平均值来聚合邮政编码。


同样,在 Tableau 中,默认情况下可能会将包含单独年龄的字段分类为度量,因为它包含数值数据。在某些情况下,您可能想要对年龄进行加总或求平均值,但也可能想要以数据桶或类别的形式查看每个单独的年龄,这种情况下您会希望 Tableau 为此字段创建标题(而不是轴)。如果希望以这种形式在视图中使用年龄,您可以将字段转换为维度。


若要在“数据”窗格中将度量转换为维度,请执行以下任一操作。


  • 单击该字段并将其从“数据”窗格的度量区域拖放到维度区域中。


  • “数据”窗格中右键单击(在 Mac 上按住 Control 单击)度量,并选择“转换为维度”


如果将从度量转换为维度的字段放在功能区上,则该字段会生成标题(而不是轴)。



1.5 维度和详细级别


将维度添加到“行”“列”时,视图中标记的数量会增加。若要了解为何添加维度会增加视图中标记的数量,请执行以下操作:


STEP 1:“Segment”(细分市场)拖到“列”


Tableau 窗口底部的状态栏显示视图中现在有三个标记:



这些标记只包含占位符文本 Abc,因为您此时只构建了视图的结构。


STEP 2: 将“Region”(区域)拖到“列”


现在有 12 个标记。“Segment”(细分市场)中的三个值乘以“Region”(区域)中的四个值,结果为 12。


STEP 3:“[Ship Date]”([发货日期])拖到“行”


现在共有 57 个标记(三个细分市场乘以四个区域,再乘以五年,结果为 60,但视图中有三个在数据源中没有数据的维度组合)。


我们可继续向“行”“列”中添加维度,并能观察到标记的总数持续增加。将维度拖到“标记”卡上的一个位置(例如“颜色”或“大小”)将也会增加标记的数量,但不会增加视图中标题的数量。向视图中添加维度来增加标记数量的过程称为设置详细级别。


将维度添加到 Tableau 中的以下任何位置会对详细级别产生影响:



STEP 4:视图现在包含 57 个单独的 Abc 实例 — 视图都是结构,没有内容。通过将“Sales”(销售额)拖到到“文本”来调整这一点。现在可以认为视图是完整的:



说明:

1. 某些情况下,向视图中添加度量可能会增加视图中标记的数量。举例来说,如果将“Sales”(销售额)放在上面视图中的“行”上,标记的数量为 57;但如果随后也将“Profit”(利润)放在“行”上,标记的数量将增加到 114。但这与更改视图的详细级别不同。

2. 视图中标记的数量并不保证会与您将组成详细级别的每个维度中的维度值数量相乘所得到的数量对应,而标记数量可能较低的原因有多种。若要将此视图中标记的数量从 57 增加到上面视图中的 60,请右键单击(在 Mac 上按住 Control 单击)视图中的日期标题之一以及日期或数据桶标题,并选择显示缺失值”

 


2. 连续和离散


连续和离散是数学术语,连续意指“构成一个不间断的整体,没有中断”;离散意指“各自分离且不同”。


在 Tableau 中,字段可分为连续或离散。当您将字段从“度量”区域拖到“列”“行”时,值默认情况下将是连续的,并且 Tableau 将创建轴;将字段从“数据”窗格的“维度”区域拖到“列”“行”时,值默认情况下将是离散的,并且 Tableau 将创建列或行标题。让我们考虑一下为何为这样。


2.1 连续字段生成轴


如果字段包含可以加总、求平均值或以其他方式聚合的数字,则 Tableau 会在您第一次连接到数据源时将该字段分配给“数据”窗格的“度量”区域。Tableau 假定这些值是连续的。


当您将连续字段放在“行”“列”上时,Tableau 会显示一个轴。轴是一个显示最小值和最大值之间的值的度量线,标尺和模拟温度计是显示轴的物品的例子。


Tableau 必须能够显示一系列实际值和可能值,因为除了数据源中的初始值之外,您在视图中处理连续字段时始终可能会出现新值。


尽管连续轴上有值标签(下图中的 0、0.5、... 3.0),但实际标记不必像与列标题对齐一样与这些标签对齐。例如,在下图中,蓝色条形实际上延伸到了水平轴上的值 6.940,而不是确切地延伸到 7.0。



连续字段的可能值的数量无法预计。举例来说,如果有一个名为“Rating”(评级)的字段,并且初始值为 1、3、3.5、3.6 和 4,即五个离散值。但如果您将“Ratings”(评级)放在“行”上,Tableau 会自动以 SUM 的形式聚合该值(您随后会立即将其更改为 AVG,因为与将等级加总相比,对等级求平均值更有逻辑),而这样会随后创建第六个值 (3.02),在您向视图中添加字段之前,该值并不存在。并且,如果您随后应用了排除两个初始值的筛选器,平均值也将更改,该值会将是另一个值。然后您更改了聚合,... 您就明白了。可能值的数量即使不是无限,也肯定是巨大的。


字段包含数字的事实并不必然表明这些值是连续的。邮政编码就是很经典的例子:尽管邮政编码通常完全由数字组成,但它们实际应该是绝不会加总或求平均值的字符串值。如果 Tableau 将此类字段分配给“度量”区域,您应将其拖到“维度”区域。


2.2 离散字段创建标题


如果某个字段包含的值是名称、日期或地理位置(不是数字的任何内容),Tableau 会在您第一次连接到数据源时将该字段分配给“数据”窗格的“维度”区域,Tableau 将值视为离散。


当您将离散字段放在“列”“行”上时,Tableau 会创建标题,离散字段的单独值将成为行或列标题。(由于绝不会对此类值进行聚合,所以在您处理视图时不会创建新字段值,因此就不需要轴。)


2.3 辨别差异


如果字段为连续,则背景颜色为绿色;如果字段为离散,则背景颜色为蓝色。背景颜色并非指明维度与度量的对比,而是指明连续与离散的对比。


辨别视图中的字段是度量还是维度的依据在于该字段是否已聚合。


在下面左侧的视图中,从“数据”窗格的“度量”区域中拖来的“Quantity”(数量)已从度量转换为维度,但仍然是连续的,在视图的底部显示了一个轴。我们之所以知道该字段是连续的,原因就在于该轴,并且它的背景为绿色;而我们之所以知道该字段是维度,原因在于它未聚合。


在右侧的视图中,已通过在“列”功能区上单击“Quantity”(数量)并选择“离散”对视图进行了进一步修改。 现在视图的底部显示标题,而不是轴。


2.4 应包括在视图中的离散字段


当您将离散字段放在“筛选器”功能区上时,Tableau 将提示您选择应在视图中包括离散字段的哪些“成员”。



将“日期”字段放在“筛选器”上时,结果可能为离散筛选器或连续筛选器。


当您将连续度量放在“筛选器”上时,Tableau 将首先提示您为筛选器选择聚合,然后提示您指定如何对连续的值范围进行筛选。


当您将连续维度放在“筛选器”(而不是“日期”)上时,Tableau 将提示您指定如何对连续的值范围进行筛选。


2.5 颜色的含义


当您将离散字段放在“颜色”上时,Tableau 将显示一个分类调色板,并为字段的每个值分配一种颜色。


当您将连续字段放在“颜色”上时,Tableau 将显示一个具有连续颜色范围的定量图例。

 

2.6 在离散和连续之间转换字段


您可以将度量从离散转换为连续,或从连续转换为离散。并且,您可以将日期维度和其他数值维度转换为离散或连续。


  • 转换度量


您可以将度量从离散转换为连续,或从连续转换为离散。单击字段并选择“离散”“连续”,字段为连续时将显示为绿色,字段为离散时将显示为蓝色。


对于“数据”窗格中的度量,右键单击字段并选择“转换为离散”“转换为连续”,那么字段的颜色将相应发生变化。


  • 转换日期字段


您可以在离散和连续之间转换日期字段。单击视图中的任何日期字段,并选择上下文菜单上的选项之一,便可将该字段从离散转换为连续,或从连续转换为离散:

 

 

说明:

1. 单击蓝色区域中的任何选项可将字段配置为离散日期。
选择这些选项之一将创建所谓的“日期部分”。

2. 单击绿色区域中的任何选项可将字段配置为连续日期。
选择这些选项之一将创建所谓的“截断日期”。

   

若要转换“数据”窗格中的日期字段(并因此确定在将该字段拖到视图中时的默认结果),请右键单击该字段并选择“转换为离散”“转换为连续”



标签(TAG)tableau  

分享到 :

0条评论 添加新评论

后发表评论