我需要使用 Tableau 创建一个相关矩阵表,所以我使用 Python 创建了一个版本来检查我是否做对了所有事情。
两种计算的数字都不同。例如,酒店 3 和 34 交叉的相关系数使用 python 显示为 0.62,但使用 Tableau 显示为 0.639。
我做错任何一个计算吗?请参阅此链接以获取使用 python 创建的原始数据、表格工作簿和 pdf 绘图。
我用来创建相关矩阵的代码如下:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
data = pd.read_excel('Hotel Data.xlsx', engine='openpyxl')
pivot = data.pivot_table(index=['Period','Slice'], columns='Hotel', values='Net Score Change', aggfunc=np.sum, fill_value=0)
pivot.reset_index(inplace=True)
sns.set(font_scale=0.5)
plt.figure(figsize=(20,16))
sns.heatmap(pivot.corr(), cmap='coolwarm', annot=True)