%%html
<link rel="stylesheet" href="static/hyrule.css" type="text/css">
%pylab inline
Populating the interactive namespace from numpy and matplotlib
# pylab inline (either in the notebook or as an argument starting the notebook)
# will by default load numpy as np and matplotlib.pylab as plt
# Let's import everything else we used last time as well:
import pandas as pd
import seaborn as sns
from __future__ import division
pd.set_option('display.max_rows', 500)
pd.set_option('display.max_columns', 500)
pd.set_option('display.width', 1000)
pd.options.display.mpl_style = 'default'
columns = """-- The attributes are (dontated by Riccardo Leardi,
riclea@anchem.unige.it )
1) Alcohol
2) Malic acid
3) Ash
4) Alcalinity of ash
5) Magnesium
6) Total phenols
7) Flavanoids
8) Nonflavanoid phenols
9) Proanthocyanins
10)Color intensity
11)Hue
12)OD280/OD315 of diluted wines
13)Proline"""
# we can generate the columns list using some string and list functions.
columns = columns.split('\n')
columns = [i.strip() for i in columns][2:]
columns = [i.split(')')[1].strip().lower() for i in columns]
cols = ['class']
cols.extend(columns)
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'
wine = pd.read_csv(url, header=None)
wine.columns = cols
wine.head()
class | alcohol | malic acid | ash | alcalinity of ash | magnesium | total phenols | flavanoids | nonflavanoid phenols | proanthocyanins | color intensity | hue | od280/od315 of diluted wines | proline | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 14.23 | 1.71 | 2.43 | 15.6 | 127 | 2.80 | 3.06 | 0.28 | 2.29 | 5.64 | 1.04 | 3.92 | 1065 |
1 | 1 | 13.20 | 1.78 | 2.14 | 11.2 | 100 | 2.65 | 2.76 | 0.26 | 1.28 | 4.38 | 1.05 | 3.40 | 1050 |
2 | 1 | 13.16 | 2.36 | 2.67 | 18.6 | 101 | 2.80 | 3.24 | 0.30 | 2.81 | 5.68 | 1.03 | 3.17 | 1185 |
3 | 1 | 14.37 | 1.95 | 2.50 | 16.8 | 113 | 3.85 | 3.49 | 0.24 | 2.18 | 7.80 | 0.86 | 3.45 | 1480 |
4 | 1 | 13.24 | 2.59 | 2.87 | 21.0 | 118 | 2.80 | 2.69 | 0.39 | 1.82 | 4.32 | 1.04 | 2.93 | 735 |
wine['rounded'] = wine.alcohol.apply(round)
wine_group = wine.groupby('rounded')
wine_group.describe()
alcalinity of ash | alcohol | ash | class | color intensity | flavanoids | hue | magnesium | malic acid | nonflavanoid phenols | od280/od315 of diluted wines | proanthocyanins | proline | total phenols | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
rounded | |||||||||||||||
11 | count | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 | 4.000000 |
mean | 20.500000 | 11.337500 | 2.235000 | 2.000000 | 2.782500 | 2.387500 | 1.090000 | 94.000000 | 2.097500 | 0.375000 | 2.845000 | 2.215000 | 507.000000 | 2.755000 | |
std | 0.912871 | 0.206135 | 0.304357 | 0.000000 | 0.605441 | 0.360035 | 0.441286 | 9.831921 | 1.288057 | 0.121518 | 0.441626 | 0.940585 | 103.727206 | 0.348473 | |
min | 19.500000 | 11.030000 | 1.820000 | 2.000000 | 1.900000 | 2.010000 | 0.750000 | 85.000000 | 0.740000 | 0.240000 | 2.310000 | 1.440000 | 407.000000 | 2.460000 | |
25% | 19.875000 | 11.315000 | 2.105000 | 2.000000 | 2.650000 | 2.130000 | 0.787500 | 87.250000 | 1.317500 | 0.300000 | 2.685000 | 1.732500 | 427.250000 | 2.475000 | |
50% | 20.500000 | 11.430000 | 2.310000 | 2.000000 | 2.990000 | 2.375000 | 0.950000 | 92.000000 | 1.955000 | 0.370000 | 2.840000 | 1.920000 | 498.000000 | 2.690000 | |
75% | 21.125000 | 11.452500 | 2.440000 | 2.000000 | 3.122500 | 2.632500 | 1.252500 | 98.750000 | 2.735000 | 0.445000 | 3.000000 | 2.402500 | 577.750000 | 2.970000 | |
max | 21.500000 | 11.460000 | 2.500000 | 2.000000 | 3.250000 | 2.790000 | 1.710000 | 107.000000 | 3.740000 | 0.520000 | 3.390000 | 3.580000 | 625.000000 | 3.180000 | |
12 | count | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 | 53.000000 |
mean | 20.313208 | 12.109811 | 2.291321 | 2.094340 | 3.283208 | 1.940566 | 1.020113 | 95.792453 | 2.046981 | 0.373962 | 2.706604 | 1.593019 | 534.245283 | 2.184340 | |
std | 3.341524 | 0.265384 | 0.324405 | 0.295098 | 1.440304 | 0.843863 | 0.215290 | 17.502042 | 1.014742 | 0.126800 | 0.567647 | 0.590455 | 169.797153 | 0.552541 | |
min | 10.600000 | 11.560000 | 1.360000 | 2.000000 | 1.280000 | 0.470000 | 0.560000 | 70.000000 | 0.890000 | 0.130000 | 1.270000 | 0.410000 | 278.000000 | 1.100000 | |
25% | 18.500000 | 11.870000 | 2.120000 | 2.000000 | 2.500000 | 1.570000 | 0.890000 | 86.000000 | 1.330000 | 0.290000 | 2.300000 | 1.310000 | 406.000000 | 1.850000 | |
50% | 20.000000 | 12.170000 | 2.290000 | 2.000000 | 2.850000 | 2.000000 | 1.000000 | 90.000000 | 1.670000 | 0.370000 | 2.780000 | 1.530000 | 510.000000 | 2.110000 | |
75% | 22.000000 | 12.340000 | 2.500000 | 2.000000 | 3.600000 | 2.260000 | 1.190000 | 101.000000 | 2.550000 | 0.430000 | 3.130000 | 1.870000 | 660.000000 | 2.500000 | |
max | 28.500000 | 12.470000 | 3.230000 | 3.000000 | 8.210000 | 5.080000 | 1.450000 | 162.000000 | 4.720000 | 0.660000 | 3.690000 | 3.280000 | 937.000000 | 3.520000 | |
13 | count | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 | 64.000000 |
mean | 19.915625 | 13.016094 | 2.357656 | 2.203125 | 5.623750 | 1.641094 | 0.861406 | 98.796875 | 2.622813 | 0.383906 | 2.313594 | 1.392813 | 704.640625 | 2.064844 | |
std | 3.256409 | 0.288931 | 0.276995 | 0.839117 | 2.420317 | 0.922514 | 0.214394 | 12.286500 | 1.195424 | 0.134100 | 0.742669 | 0.500877 | 234.752309 | 0.550301 | |
min | 11.200000 | 12.510000 | 1.700000 | 1.000000 | 2.000000 | 0.480000 | 0.480000 | 78.000000 | 0.900000 | 0.170000 | 1.290000 | 0.420000 | 325.000000 | 1.150000 | |
25% | 17.950000 | 12.785000 | 2.185000 | 1.000000 | 3.945000 | 0.697500 | 0.695000 | 88.000000 | 1.670000 | 0.270000 | 1.612500 | 0.967500 | 526.250000 | 1.612500 | |
50% | 20.000000 | 13.050000 | 2.335000 | 2.000000 | 5.000000 | 1.375000 | 0.860000 | 98.000000 | 2.410000 | 0.340000 | 2.135000 | 1.385000 | 661.000000 | 1.965000 | |
75% | 22.000000 | 13.247500 | 2.557500 | 3.000000 | 7.125000 | 2.570000 | 1.040000 | 106.000000 | 3.555000 | 0.490000 | 3.000000 | 1.637500 | 831.250000 | 2.562500 | |
max | 30.000000 | 13.490000 | 3.220000 | 3.000000 | 11.750000 | 3.270000 | 1.310000 | 139.000000 | 5.800000 | 0.630000 | 3.630000 | 2.910000 | 1285.000000 | 3.300000 | |
14 | count | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 | 55.000000 |
mean | 18.390909 | 13.896909 | 2.462000 | 1.509091 | 6.266909 | 2.492909 | 0.991636 | 105.272727 | 2.322909 | 0.323636 | 2.843636 | 1.744727 | 1005.672727 | 2.612545 | |
std | 3.070847 | 0.267975 | 0.183751 | 0.857920 | 1.848910 | 1.049728 | 0.207434 | 11.859446 | 1.067768 | 0.105275 | 0.716505 | 0.516168 | 329.802525 | 0.648018 | |
min | 12.000000 | 13.500000 | 1.920000 | 1.000000 | 3.380000 | 0.340000 | 0.570000 | 80.000000 | 1.250000 | 0.170000 | 1.300000 | 0.550000 | 410.000000 | 0.980000 | |
25% | 16.100000 | 13.700000 | 2.315000 | 1.000000 | 5.075000 | 2.060000 | 0.890000 | 96.000000 | 1.680000 | 0.240000 | 2.515000 | 1.405000 | 745.000000 | 2.275000 | |
50% | 17.600000 | 13.840000 | 2.450000 | 1.000000 | 5.880000 | 2.880000 | 1.040000 | 105.000000 | 1.830000 | 0.300000 | 2.930000 | 1.810000 | 1060.000000 | 2.800000 | |
75% | 20.000000 | 14.125000 | 2.615000 | 2.000000 | 7.135000 | 3.180000 | 1.130000 | 114.000000 | 2.670000 | 0.395000 | 3.375000 | 2.080000 | 1280.000000 | 3.000000 | |
max | 25.000000 | 14.390000 | 2.800000 | 3.000000 | 13.000000 | 3.930000 | 1.360000 | 132.000000 | 5.650000 | 0.560000 | 4.000000 | 2.960000 | 1680.000000 | 3.880000 | |
15 | count | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 | 2.000000 |
mean | 12.700000 | 14.790000 | 2.280000 | 1.000000 | 5.300000 | 3.335000 | 1.165000 | 94.000000 | 1.685000 | 0.360000 | 2.790000 | 2.395000 | 1097.500000 | 2.950000 | |
std | 1.838478 | 0.056569 | 0.155563 | 0.000000 | 0.141421 | 0.502046 | 0.120208 | 4.242641 | 0.063640 | 0.098995 | 0.084853 | 0.586899 | 74.246212 | 0.212132 | |
min | 11.400000 | 14.750000 | 2.170000 | 1.000000 | 5.200000 | 2.980000 | 1.080000 | 91.000000 | 1.640000 | 0.290000 | 2.730000 | 1.980000 | 1045.000000 | 2.800000 | |
25% | 12.050000 | 14.770000 | 2.225000 | 1.000000 | 5.250000 | 3.157500 | 1.122500 | 92.500000 | 1.662500 | 0.325000 | 2.760000 | 2.187500 | 1071.250000 | 2.875000 | |
50% | 12.700000 | 14.790000 | 2.280000 | 1.000000 | 5.300000 | 3.335000 | 1.165000 | 94.000000 | 1.685000 | 0.360000 | 2.790000 | 2.395000 | 1097.500000 | 2.950000 | |
75% | 13.350000 | 14.810000 | 2.335000 | 1.000000 | 5.350000 | 3.512500 | 1.207500 | 95.500000 | 1.707500 | 0.395000 | 2.820000 | 2.602500 | 1123.750000 | 3.025000 | |
max | 14.000000 | 14.830000 | 2.390000 | 1.000000 | 5.400000 | 3.690000 | 1.250000 | 97.000000 | 1.730000 | 0.430000 | 2.850000 | 2.810000 | 1150.000000 | 3.100000 |
pivoted_wine = wine.pivot_table(values='ash',
columns='class',
index='rounded',
aggfunc='count')
print pivoted_wine
class 1 2 3 rounded 11 NaN 4 NaN 12 NaN 48 5 13 17 17 30 14 40 2 13 15 2 NaN NaN
print pd.melt(pivoted_wine.reset_index(),id_vars=['rounded'],value_vars=[1,2,3],value_name='count').dropna()
rounded class count 2 13 1 17 3 14 1 40 4 15 1 2 5 11 2 4 6 12 2 48 7 13 2 17 8 14 2 2 11 12 3 5 12 13 3 30 13 14 3 13
import sqlite3
con = sqlite3.connect("lahman.sqlite")
df = pd.read_sql("SELECT * from batting", con)
df = df.convert_objects(convert_numeric=True)
# Reminder: Many functions from data frames will work on groupby objects!
# What is below doing?
df.groupby('year').head(1)
player | year | stint | team | lg | g | ab | r | h | X2b | X3b | hr | rbi | sb | cs | bb | so | ibb | hbp | sh | sf | gidp | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | abercda01 | 1871 | 1 | TRO | NA | 1 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | NaN | NaN | NaN | NaN |
115 | allenha01 | 1872 | 1 | MID | NA | 16 | 66 | 8 | 18 | 1 | 0 | 0 | 7 | 0 | 0 | 0 | 1 | NaN | NaN | NaN | NaN | NaN |
271 | addybo01 | 1873 | 1 | PH2 | NA | 10 | 51 | 12 | 16 | 1 | 0 | 0 | 10 | 0 | 1 | 2 | 0 | NaN | NaN | NaN | NaN | NaN |
396 | addybo01 | 1874 | 1 | HR1 | NA | 50 | 213 | 25 | 51 | 9 | 2 | 0 | 23 | 4 | 2 | 1 | 0 | NaN | NaN | NaN | NaN | NaN |
519 | abadijo01 | 1875 | 1 | PH3 | NA | 11 | 45 | 3 | 10 | 0 | 0 | 0 | 4 | 1 | 0 | 0 | 3 | NaN | NaN | NaN | NaN | NaN |
737 | addybo01 | 1876 | 1 | CHN | NL | 32 | 142 | 36 | 40 | 4 | 1 | 0 | 16 | NaN | NaN | 5 | 0 | NaN | NaN | NaN | NaN | NaN |
861 | addybo01 | 1877 | 1 | CN1 | NL | 57 | 245 | 27 | 68 | 2 | 3 | 0 | 31 | NaN | NaN | 6 | 5 | NaN | NaN | NaN | NaN | NaN |
958 | allisdo01 | 1878 | 1 | PRO | NL | 19 | 76 | 9 | 22 | 2 | 0 | 0 | 7 | NaN | NaN | 1 | 8 | NaN | NaN | NaN | NaN | NaN |
1038 | adamsge01 | 1879 | 1 | SR1 | NL | 4 | 13 | 0 | 3 | 0 | 0 | 0 | 0 | NaN | NaN | 1 | 1 | NaN | NaN | NaN | NaN | NaN |
1165 | ahearch01 | 1880 | 1 | TRN | NL | 1 | 4 | 1 | 1 | 0 | 0 | 0 | 0 | NaN | NaN | 0 | 0 | NaN | NaN | NaN | NaN | NaN |
1300 | ansonca01 | 1881 | 1 | CHN | NL | 84 | 343 | 67 | 137 | 21 | 7 | 1 | 82 | NaN | NaN | 26 | 4 | NaN | NaN | NaN | NaN | NaN |
1432 | ansonca01 | 1882 | 1 | CHN | NL | 82 | 348 | 69 | 126 | 29 | 8 | 1 | 83 | NaN | NaN | 20 | 7 | NaN | NaN | NaN | NaN | NaN |
1683 | allenmy01 | 1883 | 1 | NY1 | NL | 1 | 4 | 0 | 0 | 0 | 0 | 0 | 1 | NaN | NaN | 0 | 2 | NaN | NaN | NaN | NaN | NaN |
1966 | akejo01 | 1884 | 1 | BL2 | AA | 13 | 52 | 1 | 10 | 0 | 1 | 0 | 2 | 0 | NaN | 0 | NaN | NaN | 1 | NaN | NaN | NaN |
2748 | alvorbi01 | 1885 | 1 | SL5 | NL | 2 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | NaN | 1 | 2 | NaN | NaN | NaN | NaN | NaN |
3101 | allenmy01 | 1886 | 1 | BSN | NL | 1 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 1 | NaN | NaN | NaN | NaN | NaN |
3452 | allenmy01 | 1887 | 1 | CL3 | AA | 117 | 463 | 66 | 128 | 22 | 10 | 4 | 77 | 26 | NaN | 36 | NaN | NaN | 5 | NaN | NaN | NaN |
3785 | albergu01 | 1888 | 1 | CL3 | AA | 102 | 364 | 51 | 75 | 10 | 6 | 1 | 48 | 26 | NaN | 41 | NaN | NaN | 7 | NaN | NaN | NaN |
4136 | alvorbi01 | 1889 | 1 | KC2 | AA | 50 | 186 | 23 | 43 | 8 | 9 | 0 | 18 | 3 | NaN | 10 | 35 | NaN | 0 | NaN | NaN | NaN |
4478 | abbotda01 | 1890 | 1 | TL2 | AA | 3 | 7 | 0 | 1 | 0 | 1 | 0 | 1 | 1 | NaN | 0 | NaN | NaN | 0 | NaN | NaN | NaN |
5053 | albergu01 | 1891 | 1 | ML3 | AA | 12 | 41 | 6 | 4 | 0 | 0 | 0 | 2 | 1 | NaN | 7 | 5 | NaN | 2 | NaN | NaN | NaN |
5461 | abbeybe01 | 1892 | 1 | WAS | NL | 27 | 75 | 5 | 9 | 1 | 0 | 0 | 3 | 2 | NaN | 9 | 27 | NaN | 0 | NaN | NaN | NaN |
5771 | abbeybe01 | 1893 | 1 | CHN | NL | 7 | 26 | 2 | 6 | 1 | 0 | 0 | 2 | 0 | NaN | 2 | 3 | NaN | 0 | NaN | NaN | NaN |
6057 | abbeybe01 | 1894 | 1 | CHN | NL | 11 | 39 | 3 | 5 | 0 | 0 | 0 | 4 | 1 | NaN | 2 | 7 | NaN | 0 | NaN | NaN | NaN |
6351 | abbeybe01 | 1895 | 1 | CHN | NL | 1 | 3 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 0 | NaN | 0 | 0 | NaN | NaN |
6656 | abbeybe01 | 1896 | 1 | BRO | NL | 25 | 63 | 7 | 12 | 1 | 2 | 0 | 7 | 0 | NaN | 6 | 13 | NaN | 0 | 4 | NaN | NaN |
6951 | abbated01 | 1897 | 1 | PHI | NL | 3 | 10 | 0 | 3 | 0 | 0 | 0 | 0 | 0 | NaN | 1 | NaN | NaN | 0 | 0 | NaN | NaN |
7231 | abbated01 | 1898 | 1 | PHI | NL | 25 | 92 | 9 | 21 | 4 | 0 | 0 | 14 | 4 | NaN | 7 | NaN | NaN | 1 | 2 | NaN | NaN |
7554 | anderjo01 | 1899 | 1 | BRO | NL | 117 | 439 | 65 | 118 | 18 | 7 | 4 | 92 | 25 | NaN | 27 | NaN | NaN | 4 | 2 | NaN | NaN |
7902 | allenbo01 | 1900 | 1 | CIN | NL | 5 | 15 | 0 | 2 | 1 | 0 | 0 | 1 | 0 | NaN | 0 | NaN | NaN | 1 | 0 | NaN | NaN |
8097 | anderjo01 | 1901 | 1 | MLA | AL | 138 | 576 | 90 | 190 | 46 | 7 | 8 | 99 | 35 | NaN | 24 | NaN | NaN | 3 | 4 | NaN | NaN |
8509 | adamsjo01 | 1902 | 1 | SLN | NL | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | NaN | NaN | 0 | 0 | NaN | NaN |
8964 | abbated01 | 1903 | 1 | BSN | NL | 136 | 489 | 61 | 111 | 18 | 5 | 1 | 46 | 23 | NaN | 52 | NaN | NaN | 4 | 17 | NaN | NaN |
9364 | abbated01 | 1904 | 1 | BSN | NL | 154 | 579 | 76 | 148 | 18 | 10 | 3 | 54 | 24 | NaN | 40 | NaN | NaN | 5 | 13 | NaN | NaN |
9770 | abbated01 | 1905 | 1 | BSN | NL | 153 | 610 | 70 | 170 | 25 | 12 | 3 | 41 | 30 | NaN | 35 | NaN | NaN | 8 | 5 | NaN | NaN |
10177 | abstebi01 | 1906 | 1 | PIT | NL | 8 | 20 | 2 | 4 | 0 | 0 | 0 | 3 | 2 | NaN | 0 | NaN | NaN | 0 | 1 | NaN | NaN |
10614 | abbated01 | 1907 | 1 | PIT | NL | 147 | 496 | 63 | 130 | 14 | 7 | 2 | 82 | 35 | NaN | 65 | NaN | NaN | 8 | 22 | NaN | NaN |
11060 | abbated01 | 1908 | 1 | PIT | NL | 146 | 500 | 43 | 125 | 16 | 7 | 1 | 61 | 22 | NaN | 58 | NaN | NaN | 7 | 25 | NaN | NaN |
11530 | abbated01 | 1909 | 1 | PIT | NL | 36 | 87 | 13 | 20 | 0 | 0 | 1 | 16 | 2 | NaN | 19 | NaN | NaN | 0 | 1 | NaN | NaN |
12073 | abbated01 | 1910 | 1 | PIT | NL | 3 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 0 | NaN | 0 | 0 | NaN | NaN |
12611 | ablesha01 | 1911 | 1 | NYA | AL | 3 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | NaN | NaN | 0 | 0 | NaN | NaN |
13178 | adamsba01 | 1912 | 1 | PIT | NL | 28 | 53 | 5 | 12 | 3 | 1 | 0 | 3 | 0 | NaN | 8 | 9 | NaN | 0 | 1 | NaN | NaN |
13808 | acostme01 | 1913 | 1 | WS1 | AL | 12 | 20 | 3 | 6 | 0 | 1 | 0 | 1 | 2 | NaN | 4 | 2 | NaN | 0 | 0 | NaN | NaN |
14424 | acostme01 | 1914 | 1 | WS1 | AL | 39 | 74 | 10 | 19 | 2 | 2 | 0 | 4 | 3 | 4 | 11 | 18 | NaN | 0 | 0 | NaN | NaN |
15219 | acostme01 | 1915 | 1 | WS1 | AL | 72 | 163 | 20 | 34 | 4 | 1 | 0 | 18 | 8 | 4 | 28 | 15 | NaN | 4 | 9 | NaN | NaN |
16015 | acostme01 | 1916 | 1 | WS1 | AL | 5 | 8 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | NaN | 2 | 0 | NaN | 0 | 0 | NaN | NaN |
16580 | adamsbe01 | 1917 | 1 | PHI | NL | 43 | 107 | 4 | 22 | 4 | 1 | 1 | 7 | 0 | NaN | 0 | 20 | NaN | 0 | 4 | NaN | NaN |
17096 | acostme01 | 1918 | 1 | WS1 | AL | 3 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 1 | NaN | 0 | 0 | NaN | NaN |
17602 | adamsba01 | 1919 | 1 | PIT | NL | 34 | 92 | 2 | 17 | 2 | 1 | 0 | 4 | 0 | NaN | 6 | 13 | NaN | 0 | 3 | NaN | NaN |
18136 | acostjo01 | 1920 | 1 | WS1 | AL | 17 | 25 | 2 | 6 | 1 | 0 | 0 | 1 | 0 | 0 | 4 | 7 | NaN | 0 | 2 | NaN | NaN |
18651 | acostjo01 | 1921 | 1 | WS1 | AL | 33 | 30 | 2 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 6 | 14 | NaN | 0 | 1 | NaN | NaN |
19171 | acostjo01 | 1922 | 1 | CHA | AL | 5 | 5 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | NaN | 0 | 0 | NaN | NaN |
19684 | abramge01 | 1923 | 1 | CIN | NL | 3 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 0 | NaN | NaN |
20214 | adamsba01 | 1924 | 1 | PIT | NL | 9 | 11 | 1 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | NaN | 0 | 1 | NaN | NaN |
20761 | adamsba01 | 1925 | 1 | PIT | NL | 33 | 31 | 3 | 7 | 1 | 0 | 0 | 1 | 0 | 0 | 3 | 6 | NaN | 0 | 1 | NaN | NaN |
21318 | adamsba01 | 1926 | 1 | PIT | NL | 19 | 9 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 0 | NaN | 0 | 0 | NaN | NaN |
21844 | adamssp01 | 1927 | 1 | CHN | NL | 146 | 647 | 100 | 189 | 17 | 7 | 0 | 49 | 26 | NaN | 42 | 26 | NaN | 0 | 16 | NaN | NaN |
22385 | adamssp01 | 1928 | 1 | PIT | NL | 135 | 539 | 91 | 149 | 14 | 6 | 0 | 38 | 8 | NaN | 64 | 18 | NaN | 4 | 21 | NaN | NaN |
22915 | adamssp01 | 1929 | 1 | PIT | NL | 74 | 196 | 37 | 51 | 8 | 1 | 0 | 11 | 3 | NaN | 15 | 5 | NaN | 1 | 5 | NaN | NaN |
23445 | adamssp01 | 1930 | 1 | SLN | NL | 137 | 570 | 98 | 179 | 36 | 9 | 0 | 55 | 7 | NaN | 45 | 27 | NaN | 1 | 15 | NaN | NaN |
23976 | adairji01 | 1931 | 1 | CHN | NL | 18 | 76 | 9 | 21 | 3 | 1 | 0 | 3 | 1 | NaN | 1 | 8 | NaN | 0 | 2 | NaN | NaN |
24485 | adamsbo02 | 1932 | 1 | PHI | NL | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
25012 | adamssp01 | 1933 | 1 | SLN | NL | 8 | 30 | 1 | 5 | 1 | 0 | 0 | 0 | 0 | NaN | 1 | 3 | NaN | 1 | 0 | NaN | 2 |
25503 | adamssp01 | 1934 | 1 | CIN | NL | 87 | 278 | 38 | 70 | 16 | 1 | 0 | 14 | 2 | NaN | 20 | 10 | NaN | 2 | 1 | NaN | 2 |
26024 | allenet01 | 1935 | 1 | PHI | NL | 156 | 645 | 90 | 198 | 46 | 1 | 8 | 63 | 5 | NaN | 43 | 54 | NaN | 1 | 11 | NaN | 5 |
26537 | allenet01 | 1936 | 1 | PHI | NL | 30 | 125 | 21 | 37 | 3 | 1 | 1 | 9 | 4 | NaN | 4 | 8 | NaN | 0 | 3 | NaN | 4 |
27048 | alexahu01 | 1937 | 1 | CLE | AL | 7 | 11 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 5 | NaN | 0 | 0 | NaN | NaN |
27574 | allenet01 | 1938 | 1 | SLA | AL | 19 | 33 | 4 | 10 | 3 | 1 | 0 | 4 | 0 | 0 | 2 | 4 | NaN | 0 | 1 | NaN | NaN |
28104 | adamsbu01 | 1939 | 1 | SLN | NL | 2 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 0 | NaN | 0 | 0 | NaN | 0 |
28683 | aderhmo01 | 1940 | 1 | WS1 | AL | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 0 | NaN | 0 |
29224 | adamsac01 | 1941 | 1 | NY1 | NL | 38 | 12 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 3 | NaN | 0 | 0 | NaN | 0 |
29806 | abernte01 | 1942 | 1 | PHA | AL | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | NaN | 0 | 0 | NaN | 0 |
30345 | abernte01 | 1943 | 1 | PHA | AL | 5 | 4 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | NaN | 0 | 0 | NaN | 0 |
30902 | abernte01 | 1944 | 1 | PHA | AL | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | NaN | 0 | 0 | NaN | 0 |
31471 | adamsac01 | 1945 | 1 | NY1 | NL | 65 | 16 | 2 | 3 | 0 | 0 | 0 | 1 | 0 | NaN | 2 | 3 | NaN | 0 | 2 | NaN | 0 |
32050 | abernwo01 | 1946 | 1 | NY1 | NL | 15 | 8 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 4 | NaN | 0 | 0 | NaN | 0 |
32732 | abernwo01 | 1947 | 1 | NY1 | NL | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
33314 | aberscl01 | 1948 | 1 | CHN | NL | 12 | 32 | 1 | 6 | 1 | 0 | 1 | 6 | 0 | NaN | 5 | 10 | NaN | 0 | 0 | NaN | 0 |
33887 | aberscl01 | 1949 | 1 | CHN | NL | 4 | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 2 | NaN | 0 | 0 | NaN | 1 |
34460 | aberal01 | 1950 | 1 | CLE | AL | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | NaN | 0 | 0 | NaN | 0 |
35037 | abramca01 | 1951 | 1 | BRO | NL | 67 | 150 | 27 | 42 | 8 | 0 | 3 | 19 | 3 | 2 | 36 | 26 | NaN | 0 | 0 | NaN | 5 |
35653 | abernbi01 | 1952 | 1 | CLE | AL | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | NaN | 0 | 0 | NaN | 0 |
36285 | aberal01 | 1953 | 1 | CLE | AL | 6 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | NaN | 0 | 0 | NaN | 0 |
36871 | aaronha01 | 1954 | 1 | ML1 | NL | 122 | 468 | 58 | 131 | 27 | 6 | 13 | 69 | 2 | 2 | 28 | 39 | NaN | 3 | 6 | 4 | 13 |
37447 | aaronha01 | 1955 | 1 | ML1 | NL | 153 | 602 | 105 | 189 | 37 | 9 | 27 | 106 | 3 | 1 | 49 | 61 | 5 | 3 | 7 | 4 | 20 |
38102 | aaronha01 | 1956 | 1 | ML1 | NL | 153 | 609 | 106 | 200 | 34 | 14 | 26 | 92 | 2 | 4 | 37 | 54 | 6 | 2 | 5 | 7 | 21 |
38723 | aaronha01 | 1957 | 1 | ML1 | NL | 151 | 615 | 118 | 198 | 27 | 6 | 44 | 132 | 1 | 1 | 57 | 58 | 15 | 0 | 0 | 3 | 13 |
39338 | aaronha01 | 1958 | 1 | ML1 | NL | 153 | 601 | 109 | 196 | 34 | 4 | 30 | 95 | 4 | 1 | 59 | 49 | 16 | 1 | 0 | 3 | 21 |
39976 | aaronha01 | 1959 | 1 | ML1 | NL | 154 | 629 | 116 | 223 | 46 | 7 | 39 | 123 | 8 | 0 | 51 | 54 | 17 | 4 | 0 | 9 | 19 |
40608 | aaronha01 | 1960 | 1 | ML1 | NL | 153 | 590 | 102 | 172 | 20 | 11 | 40 | 126 | 16 | 7 | 60 | 63 | 13 | 2 | 0 | 12 | 8 |
41245 | aaronha01 | 1961 | 1 | ML1 | NL | 155 | 603 | 115 | 197 | 39 | 10 | 34 | 120 | 21 | 9 | 56 | 64 | 20 | 2 | 1 | 9 | 16 |
41943 | aaronha01 | 1962 | 1 | ML1 | NL | 156 | 592 | 127 | 191 | 28 | 6 | 45 | 128 | 15 | 7 | 66 | 73 | 14 | 3 | 0 | 6 | 14 |
42703 | aaronha01 | 1963 | 1 | ML1 | NL | 161 | 631 | 121 | 201 | 29 | 4 | 44 | 130 | 31 | 5 | 78 | 94 | 18 | 0 | 0 | 5 | 11 |
43455 | aaronha01 | 1964 | 1 | ML1 | NL | 145 | 570 | 103 | 187 | 30 | 2 | 24 | 95 | 22 | 4 | 62 | 46 | 9 | 0 | 0 | 2 | 22 |
44209 | aaronha01 | 1965 | 1 | ML1 | NL | 150 | 570 | 109 | 181 | 40 | 1 | 32 | 89 | 24 | 4 | 60 | 81 | 10 | 1 | 0 | 8 | 15 |
44960 | aaronha01 | 1966 | 1 | ATL | NL | 158 | 603 | 117 | 168 | 23 | 1 | 44 | 127 | 21 | 3 | 76 | 96 | 15 | 1 | 0 | 8 | 14 |
45734 | aaronha01 | 1967 | 1 | ATL | NL | 155 | 600 | 113 | 184 | 37 | 3 | 39 | 109 | 17 | 6 | 63 | 97 | 19 | 0 | 0 | 6 | 11 |
46520 | aaronha01 | 1968 | 1 | ATL | NL | 160 | 606 | 84 | 174 | 33 | 4 | 29 | 86 | 28 | 5 | 64 | 62 | 23 | 1 | 0 | 5 | 21 |
47235 | aaronha01 | 1969 | 1 | ATL | NL | 147 | 547 | 100 | 164 | 30 | 3 | 44 | 97 | 9 | 10 | 87 | 47 | 19 | 2 | 0 | 3 | 14 |
48167 | aaronha01 | 1970 | 1 | ATL | NL | 150 | 516 | 103 | 154 | 26 | 1 | 38 | 118 | 9 | 0 | 74 | 63 | 15 | 2 | 0 | 6 | 13 |
49086 | aaronha01 | 1971 | 1 | ATL | NL | 139 | 495 | 95 | 162 | 22 | 3 | 47 | 118 | 1 | 1 | 71 | 58 | 21 | 2 | 0 | 5 | 9 |
49969 | aaronha01 | 1972 | 1 | ATL | NL | 129 | 449 | 75 | 119 | 10 | 0 | 34 | 77 | 4 | 0 | 92 | 55 | 15 | 1 | 0 | 2 | 17 |
50857 | aaronha01 | 1973 | 1 | ATL | NL | 120 | 392 | 84 | 118 | 12 | 1 | 40 | 96 | 1 | 1 | 68 | 51 | 13 | 1 | 0 | 4 | 7 |
51749 | aaronha01 | 1974 | 1 | ATL | NL | 112 | 340 | 47 | 91 | 16 | 0 | 20 | 69 | 1 | 0 | 39 | 29 | 6 | 0 | 1 | 2 | 6 |
52663 | aaronha01 | 1975 | 1 | ML4 | AL | 137 | 465 | 45 | 109 | 16 | 2 | 12 | 60 | 0 | 1 | 70 | 51 | 3 | 1 | 1 | 6 | 15 |
53570 | aaronha01 | 1976 | 1 | ML4 | AL | 85 | 271 | 22 | 62 | 8 | 0 | 10 | 35 | 0 | 1 | 35 | 38 | 1 | 0 | 0 | 2 | 8 |
54456 | aasedo01 | 1977 | 1 | BOS | AL | 13 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
55440 | aasedo01 | 1978 | 1 | CAL | AL | 29 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
56400 | aasedo01 | 1979 | 1 | CAL | AL | 37 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
57361 | aasedo01 | 1980 | 1 | CAL | AL | 40 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
58311 | aasedo01 | 1981 | 1 | CAL | AL | 39 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
59255 | aasedo01 | 1982 | 1 | CAL | AL | 24 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
60247 | abbotgl01 | 1983 | 1 | SEA | AL | 14 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
61253 | aasedo01 | 1984 | 1 | CAL | AL | 23 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
62237 | aasedo01 | 1985 | 1 | BAL | AL | 54 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
63235 | aasedo01 | 1986 | 1 | BAL | AL | 66 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
64252 | aasedo01 | 1987 | 1 | BAL | AL | 7 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
65300 | aasedo01 | 1988 | 1 | BAL | AL | 35 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
66335 | aasedo01 | 1989 | 1 | NYN | NL | 49 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 0 | 0 | 0 | 0 | 0 |
67408 | aasedo01 | 1990 | 1 | LAN | NL | 32 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
68523 | abbotji01 | 1991 | 1 | CAL | AL | 34 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
69609 | abbotji01 | 1992 | 1 | CAL | AL | 29 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
70675 | abbotji01 | 1993 | 1 | NYA | AL | 32 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
71855 | abbotji01 | 1994 | 1 | NYA | AL | 24 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
72885 | abbotji01 | 1995 | 1 | CHA | AL | 17 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
74138 | abbotji01 | 1996 | 1 | CAL | AL | 27 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
75391 | abbotje01 | 1997 | 1 | CHA | AL | 19 | 38 | 8 | 10 | 1 | 0 | 1 | 2 | 0 | 0 | 0 | 6 | 0 | 0 | 0 | 0 | 3 |
76627 | abbotje01 | 1998 | 1 | CHA | AL | 89 | 244 | 33 | 68 | 14 | 1 | 12 | 41 | 3 | 3 | 9 | 28 | 1 | 0 | 2 | 5 | 2 |
77949 | abbotje01 | 1999 | 1 | CHA | AL | 17 | 57 | 5 | 9 | 0 | 0 | 2 | 6 | 1 | 1 | 5 | 12 | 0 | 0 | 1 | 1 | 4 |
79248 | abbotje01 | 2000 | 1 | CHA | AL | 80 | 215 | 31 | 59 | 15 | 1 | 3 | 29 | 2 | 1 | 21 | 38 | 1 | 2 | 2 | 1 | 2 |
80632 | abadan01 | 2001 | 1 | OAK | AL | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
81971 | abbotpa01 | 2002 | 1 | SEA | AL | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
83290 | abadan01 | 2003 | 1 | BOS | AL | 9 | 17 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 1 | 2 | 5 | 0 | 0 | 0 | 0 | 1 |
84637 | aardsda01 | 2004 | 1 | SFN | NL | 11 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
85983 | abernbr01 | 2005 | 1 | MIN | AL | 24 | 67 | 5 | 16 | 1 | 0 | 1 | 6 | 2 | 0 | 7 | 9 | 0 | 1 | 3 | 1 | 2 |
87313 | aardsda01 | 2006 | 1 | CHN | NL | 45 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 |
88691 | aardsda01 | 2007 | 1 | CHA | AL | 25 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
90076 | aardsda01 | 2008 | 1 | BOS | AL | 47 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
91461 | aardsda01 | 2009 | 1 | SEA | AL | 73 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
92849 | aardsda01 | 2010 | 1 | SEA | AL | 53 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
94205 | abadfe01 | 2011 | 1 | HOU | NL | 29 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
95594 | aardsda01 | 2012 | 1 | NYA | AL | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
97002 | aardsda01 | 2013 | 1 | NYN | NL | 43 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
98411 | abadfe01 | 2014 | 1 | OAK | AL | 69 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
plt.figure()
df[['g','ab']].hist()
sns.set_style('white') # sets seaborn "white" to the default matplotlib style
plt.figure(figsize=(8, 6), dpi=80)
plt.subplot(1, 1, 1)
plt.hist(df.g, bins=20)
plt.figure(figsize=(8, 6), dpi=80)
df[['g', 'ab']].boxplot()
# matplotlib style
plt.figure(figsize=(8, 6), dpi=80)
plt.subplot(1, 1, 1)
plt.boxplot(df.g)
/Users/zeyu/anaconda/lib/python2.7/site-packages/pandas/tools/plotting.py:2625: FutureWarning: The default value for 'return_type' will change to 'axes' in a future release. To use the future behavior now, set return_type='axes'. To keep the previous behavior and silence this warning, set return_type='dict'. warnings.warn(msg, FutureWarning)
{'boxes': [<matplotlib.lines.Line2D at 0x10cec3cd0>], 'caps': [<matplotlib.lines.Line2D at 0x10ccc3190>, <matplotlib.lines.Line2D at 0x10ccb1190>], 'fliers': [<matplotlib.lines.Line2D at 0x10cc79b10>], 'means': [], 'medians': [<matplotlib.lines.Line2D at 0x10cc88110>], 'whiskers': [<matplotlib.lines.Line2D at 0x10cec3e50>, <matplotlib.lines.Line2D at 0x10ccd6090>]}
<matplotlib.figure.Figure at 0x10c86d610>
last_year = df[df.year == 2014]
sns.set_style('whitegrid')
# using plot and the '.' notation.
plt.figure(figsize=(8, 6), dpi=80)
plt.subplot(1, 1, 1)
plt.plot(last_year.ab, last_year.h, '.')
# using scatter, and setting additional parameters.
plt.figure(figsize=(8, 6), dpi=80)
plt.subplot(1, 1, 1)
plt.scatter(last_year.ab, last_year.h, s=last_year.hr**2, alpha=0.3, c='g')
<matplotlib.collections.PathCollection at 0x10d3d3ed0>
from sklearn import datasets
iris = datasets.load_iris()
iris_description = iris.DESCR
irisdf = pd.DataFrame(iris.data, columns=iris.feature_names)
irisdf['target'] = iris.target
print iris_description
Iris Plants Database Notes ----- Data Set Characteristics: :Number of Instances: 150 (50 in each of three classes) :Number of Attributes: 4 numeric, predictive attributes and the class :Attribute Information: - sepal length in cm - sepal width in cm - petal length in cm - petal width in cm - class: - Iris-Setosa - Iris-Versicolour - Iris-Virginica :Summary Statistics: ============== ==== ==== ======= ===== ==================== Min Max Mean SD Class Correlation ============== ==== ==== ======= ===== ==================== sepal length: 4.3 7.9 5.84 0.83 0.7826 sepal width: 2.0 4.4 3.05 0.43 -0.4194 petal length: 1.0 6.9 3.76 1.76 0.9490 (high!) petal width: 0.1 2.5 1.20 0.76 0.9565 (high!) ============== ==== ==== ======= ===== ==================== :Missing Attribute Values: None :Class Distribution: 33.3% for each of 3 classes. :Creator: R.A. Fisher :Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov) :Date: July, 1988 This is a copy of UCI ML iris datasets. http://archive.ics.uci.edu/ml/datasets/Iris The famous Iris database, first used by Sir R.A Fisher This is perhaps the best known database to be found in the pattern recognition literature. Fisher's paper is a classic in the field and is referenced frequently to this day. (See Duda & Hart, for example.) The data set contains 3 classes of 50 instances each, where each class refers to a type of iris plant. One class is linearly separable from the other 2; the latter are NOT linearly separable from each other. References ---------- - Fisher,R.A. "The use of multiple measurements in taxonomic problems" Annual Eugenics, 7, Part II, 179-188 (1936); also in "Contributions to Mathematical Statistics" (John Wiley, NY, 1950). - Duda,R.O., & Hart,P.E. (1973) Pattern Classification and Scene Analysis. (Q327.D83) John Wiley & Sons. ISBN 0-471-22361-1. See page 218. - Dasarathy, B.V. (1980) "Nosing Around the Neighborhood: A New System Structure and Classification Rule for Recognition in Partially Exposed Environments". IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-2, No. 1, 67-71. - Gates, G.W. (1972) "The Reduced Nearest Neighbor Rule". IEEE Transactions on Information Theory, May 1972, 431-433. - See also: 1988 MLC Proceedings, 54-64. Cheeseman et al"s AUTOCLASS II conceptual clustering system finds 3 classes in the data. - Many, many more ...
irisdf_gp = irisdf.groupby('target')
print irisdf_gp.mean()
pd.scatter_matrix(irisdf, figsize=(12, 12))
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) target 0 5.006 3.418 1.464 0.244 1 5.936 2.770 4.260 1.326 2 6.588 2.974 5.552 2.026
array([[<matplotlib.axes._subplots.AxesSubplot object at 0x1194585d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x1196b9390>, <matplotlib.axes._subplots.AxesSubplot object at 0x1197364d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x1197949d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a01fd10>], [<matplotlib.axes._subplots.AxesSubplot object at 0x1197ce2d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a2145d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a296810>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a2f8c50>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a37cb50>], [<matplotlib.axes._subplots.AxesSubplot object at 0x119763990>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a0aa390>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a56a6d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a5cd890>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a64fbd0>], [<matplotlib.axes._subplots.AxesSubplot object at 0x11a6a8350>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a838690>, <matplotlib.axes._subplots.AxesSubplot object at 0x11a8bb4d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11aa1bfd0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11aaaf250>], [<matplotlib.axes._subplots.AxesSubplot object at 0x11ab04d10>, <matplotlib.axes._subplots.AxesSubplot object at 0x11ab95090>, <matplotlib.axes._subplots.AxesSubplot object at 0x11ab3ead0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11ac789d0>, <matplotlib.axes._subplots.AxesSubplot object at 0x11acfdb50>]], dtype=object)