Staplade stapeldiagram med Pythons Matplotlib
Som väntat är diagrammet svårt att läsa. Låt oss prova det staplade stapeldiagrammet och lägga till några justeringar.
För det första kan vi sortera värdena innan vi plottar, vilket ger oss en bättre känsla av ordning och gör det lättare att jämföra staplarna. Vi gör det med kolumnen ”Global försäljning” eftersom den har totalsumman.
## sort values
df_grouped = df_grouped.sort_values('Global_Sales')
df_grouped
Skönt, det här är mycket mer läsbart än det förra.
Det är viktigt att komma ihåg syftet med det här diagrammet innan man försöker utvinna några insikter. Tanken här är att jämföra plattformarnas totala försäljning och förstå varje plattforms sammansättning.
Det är okej att jämföra totaler över fält och jämföra regioner inom en stapel. Att jämföra regioner från olika staplar kan däremot vara mycket missvisande.
I det här fallet kan vi jämföra NA-regionen över staplarna eftersom den har samma startpunkt för varje stapel, men det är inte så lätt att jämföra de andra. Ta till exempel X360, den har ett lägre värde för JP än PS2, men det är svårt att jämföra om det andra värdet är högre eller lägre än Wii.
Antag att vi ändrar stackens ordning, med ”Other Sales” som första stapel, och sorterar posterna efter ”Other Sales”. Det borde vara lättare att se vilket som är viktigast.
## sort values
df_grouped = df_grouped.sort_values('Other_Sales')fields =
colors =
labels =
Det finns två viktiga element i den här visualiseringen, kategoriernas ordning i staplade staplade staplade staplade staplade staplade och radernas ordning.
Om vi vill betona en region kan vi sortera posterna med det valda fältet och använda det som den vänstra stapeln.
Om vi inte vill det kan vi sortera posterna efter totalsumman och ordna staplarna med de kategorier som har högre värden först.