%pylab inline import pandas as pd import datetime now = datetime.datetime.now() format_percent = '{:.02f}%'.format rc('font', family='Ubuntu') rc('figure', figsize=(18, 10)) d = pd.read_csv('sauktiniudb_2015-05-13.csv', parse_dates=['Gimimo data']) byage = d.groupby(d['Gimimo data'].map(lambda x: ('%d (%d)' % (x.year, now.year-x.year)))) byage = byage[['Karo prievolininko kodas']].count() byage = byage.rename(columns={'Karo prievolininko kodas': 'Šauktinių sk.'}) byage['Šauktinių sk. %'] = (byage['Šauktinių sk.'] / d.shape[0] * 100).map(format_percent) byage byage = d.groupby(d['Gimimo data'].map(lambda x: now.year-x.year)) byage = byage[['Karo prievolininko kodas']].count() byage = byage.rename(index={'Gimimo data': 'Amžius'}, columns={'Karo prievolininko kodas': 'Šauktinių sk.'}) byage.plot(kind='barh') byage.plot() subdivision = d.groupby('Teritorinis padalinys')[['Karo prievolininko kodas']].count() subdivision = subdivision.rename(columns={'Karo prievolininko kodas': 'Šauktinių sk.'}) subdivision['Šauktinių sk. %'] = (subdivision['Šauktinių sk.'] / d.shape[0] * 100).map(format_percent) subdivision = subdivision.sort('Šauktinių sk.', ascending=False) subdivision subdivision['Šauktinių sk.'].plot(kind='barh')