Duomenys paimti iš http://sauktiniai.kam.lt/ svetainėje pateikto CSV failo.
%pylab inline
Populating the interactive namespace from numpy and matplotlib
import pandas as pd
import datetime
now = datetime.datetime.now()
format_percent = '{:.02f}%'.format
rc('font', family='Ubuntu')
rc('figure', figsize=(18, 10))
d = pd.read_csv('sauktiniudb_2015-05-13.csv', parse_dates=['Gimimo data'])
byage = d.groupby(d['Gimimo data'].map(lambda x: ('%d (%d)' % (x.year, now.year-x.year))))
byage = byage[['Karo prievolininko kodas']].count()
byage = byage.rename(columns={'Karo prievolininko kodas': 'Šauktinių sk.'})
byage['Šauktinių sk. %'] = (byage['Šauktinių sk.'] / d.shape[0] * 100).map(format_percent)
byage
Šauktinių sk. | Šauktinių sk. % | |
---|---|---|
Gimimo data | ||
1982 (33) | 2 | 0.01% |
1983 (32) | 1 | 0.00% |
1984 (31) | 5 | 0.01% |
1985 (30) | 8 | 0.02% |
1986 (29) | 5 | 0.01% |
1987 (28) | 6 | 0.02% |
1988 (27) | 16 | 0.04% |
1989 (26) | 7252 | 19.12% |
1990 (25) | 7262 | 19.14% |
1991 (24) | 6811 | 17.96% |
1992 (23) | 5812 | 15.32% |
1993 (22) | 4627 | 12.20% |
1994 (21) | 3302 | 8.71% |
1995 (20) | 2530 | 6.67% |
1996 (19) | 271 | 0.71% |
1997 (18) | 22 | 0.06% |
byage = d.groupby(d['Gimimo data'].map(lambda x: now.year-x.year))
byage = byage[['Karo prievolininko kodas']].count()
byage = byage.rename(index={'Gimimo data': 'Amžius'}, columns={'Karo prievolininko kodas': 'Šauktinių sk.'})
byage.plot(kind='barh')
<matplotlib.axes._subplots.AxesSubplot at 0x7fdf01e86c90>
byage.plot()
<matplotlib.axes._subplots.AxesSubplot at 0x7fdf01870210>
subdivision = d.groupby('Teritorinis padalinys')[['Karo prievolininko kodas']].count()
subdivision = subdivision.rename(columns={'Karo prievolininko kodas': 'Šauktinių sk.'})
subdivision['Šauktinių sk. %'] = (subdivision['Šauktinių sk.'] / d.shape[0] * 100).map(format_percent)
subdivision = subdivision.sort('Šauktinių sk.', ascending=False)
subdivision
Šauktinių sk. | Šauktinių sk. % | |
---|---|---|
Teritorinis padalinys | ||
Vilniaus RKPKS | 13450 | 35.46% |
Kauno RKPKS | 5450 | 14.37% |
Klaipėdos RKPKS | 3639 | 9.59% |
Šiaulių RKPKS | 3019 | 7.96% |
Panevėžio RKPKS | 2374 | 6.26% |
Tauragės KPKP | 1662 | 4.38% |
Marijampolės KPKP | 1590 | 4.19% |
Telšių KPKP | 1558 | 4.11% |
Utenos KPKP | 1378 | 3.63% |
Alytaus RKPKS | 1366 | 3.60% |
Molėtų KPKP | 1259 | 3.32% |
Jurbarko KPKP | 1187 | 3.13% |
subdivision['Šauktinių sk.'].plot(kind='barh')
<matplotlib.axes._subplots.AxesSubplot at 0x7fdf0552d290>