Sodra padarė labai gerą darbą ir paviešino atlyginimų duomenis!
Nusprendžiau paanalizuoti šiuos duomenis.
Puslapis iš kur galima atsisiūsti duomenys: http://sodra.lt/lt/paslaugos/informacijos-rinkmenos
%matplotlib inline
Atsisiunčiame iš išpakuojame duoemnų failą.
!wget http://sodra.is.lt/Failai/Vidurkiai.zip
--2017-03-02 14:37:29-- http://sodra.is.lt/Failai/Vidurkiai.zip Ieškoma sodra.is.lt (sodra.is.lt)... 195.182.81.66 Jungiamasi prie sodra.is.lt (sodra.is.lt)|195.182.81.66|:80... prisijungta. HTTP užklausa išsiųsta, laukiama atsakymo... 200 OK Dydis: 691430 (675K) [application/zip] Saving to: ‘Vidurkiai.zip’ Vidurkiai.zip 100%[===================>] 675,22K 2,56MB/s in 0,3s 2017-03-02 14:37:29 (2,56 MB/s) - ‘Vidurkiai.zip’ saved [691430/691430]
!unzip -o Vidurkiai.zip
Archive: Vidurkiai.zip inflating: VIDURKIAI.CSV
!wget http://sodra.is.lt/Failai/Apdraustuju_skaicius.zip
--2017-03-02 16:18:57-- http://sodra.is.lt/Failai/Apdraustuju_skaicius.zip Ieškoma sodra.is.lt (sodra.is.lt)... 195.182.81.66 Jungiamasi prie sodra.is.lt (sodra.is.lt)|195.182.81.66|:80... prisijungta. HTTP užklausa išsiųsta, laukiama atsakymo... 200 OK Dydis: 698832 (682K) [application/zip] Saving to: ‘Apdraustuju_skaicius.zip’ Apdraustuju_skaiciu 100%[===================>] 682,45K 1,96MB/s in 0,3s 2017-03-02 16:18:58 (1,96 MB/s) - ‘Apdraustuju_skaicius.zip’ saved [698832/698832]
!unzip -o Apdraustuju_skaicius.zip
Archive: Apdraustuju_skaicius.zip inflating: APDRAUSTUJU_SKAICIUS.CSV
import pandas as pd
Duomenų failas nėra standartinis, todėl reikėjo įdėti šiek tiek pastangų, kol pavyko jį tinkamai nuskaityti.
Dažniausiai CSV failus, kurie laikosi standarto galima atidaryti tiesiog su pd.read_csv('failas.csv')
, bet šiuo atveju, reikėjo perduoti gan nemažai parametų... Sodra galėtų šioje vietoje pasitaisyti ir pateikti tvarkingesnius duomenų failus.
vidurkiai = pd.read_csv(
'VIDURKIAI.CSV',
sep=r';\s*',
engine='python',
encoding='iso-8859-4',
decimal=',',
skiprows=12,
comment=';',
header=None,
names=['regnr', 'kodas', 'alga', 'autorine', 'viso'],
)
vidurkiai.head()
regnr | kodas | alga | autorine | viso | |
---|---|---|---|---|---|
0 | 110004884.0 | 120136 | 685.06 | NaN | 54858.12 |
1 | 110005648.0 | 63287 | 1103.51 | NaN | 39415.02 |
2 | 110006892.0 | 46122 | 420.29 | NaN | 693.09 |
3 | 110008377.0 | 56132 | 1148.15 | NaN | 1865.80 |
4 | 110011925.0 | 57061 | 949.07 | NaN | 116443.89 |
skaicius = pd.read_csv(
'APDRAUSTUJU_SKAICIUS.CSV',
sep=r';\s*',
engine='python',
encoding='iso-8859-4',
decimal=',',
skiprows=3,
comment=';',
header=None,
names=['regnr', 'kodas', 'skaicius'],
)
skaicius.head()
regnr | kodas | skaicius | |
---|---|---|---|
0 | 110001436.0 | 41078 | 1 |
1 | 110003978.0 | 47039 | 1 |
2 | 110004884.0 | 120136 | 174 |
3 | 110005648.0 | 63287 | 88 |
4 | 110006173.0 | 53039 | 3 |
data = pd.merge(vidurkiai, skaicius, how='inner', on=['regnr', 'kodas'])
data.shape
(43926, 6)
data.head()
regnr | kodas | alga | autorine | viso | skaicius | |
---|---|---|---|---|---|---|
0 | 110004884.0 | 120136 | 685.06 | NaN | 54858.12 | 174 |
1 | 110005648.0 | 63287 | 1103.51 | NaN | 39415.02 | 88 |
2 | 110006892.0 | 46122 | 420.29 | NaN | 693.09 | 3 |
3 | 110008377.0 | 56132 | 1148.15 | NaN | 1865.80 | 4 |
4 | 110011925.0 | 57061 | 949.07 | NaN | 116443.89 | 311 |
Visų atlyginimų ir autorinių sumos vidurkis:
(data.alga.fillna(0) + data.autorine.fillna(0)).mean()
518.59737945635834
Atlyginimų ir autorinių vidurkiai:
data.alga.mean(), data.autorine.mean()
(516.64921950441828, 624.17473684210529)
Visų įmonių skaičius, įmonių skaičius kurios moka atlyginimus ir kurios moka autorines. Pasirodo įmonių, kurios moka autorinius atlyginimus yra labai nedaug, tik 153.
data.shape[0], data[~data.alga.isnull()].shape[0], data[~data.autorine.isnull()].shape[0]
(43926, 43908, 152)
import matplotlib as mpl
mpl.rc('font', family='Ubuntu', size=16)
mpl.rc('figure', figsize=(16, 10))
Žiūrime atlyginimų statistinį pasiskirstymą naudodami dėžutės grafiką:
data.alga.plot.box(vert=False, showmeans=True, grid=True)
<matplotlib.axes._subplots.AxesSubplot at 0x7f353d29fa58>
Toks pasiskirstymas rodo, kad didžioji dauguma gauna labai nedidelį atlyginimą, bet yra po kelias įmones, kurios gauna labai didelį atlyginimą. Grafike matome, kad yra viena įmonė, kuri ypatingai nutolusi nuo vidurkio. Pasitikriname, kokios įmonės patenka į top 50 pagal atlyginimo vidurkį:
import requests, lxml.html
def get_org_name(kodas):
resp = requests.post('https://draudejai.sodra.lt/draudeju_viesi_duomenys/', {
'formType': 'NEW',
'year': '2017',
'month': '1',
'declarantCode2': kodas,
'actionName': 'MEAN',
})
assert resp.status_code == 200
parser = lxml.html.HTMLParser(encoding='utf-8')
html = lxml.html.document_fromstring(resp.content, parser=parser)
return html.xpath('string(//td[text() = "Draudėjo pavadinimas"]/following-sibling::td[1]/text())')
top10 = data.fillna(0).sort_values('alga', ascending=False).head(50)
top10['pavadinimas'] = top10.kodas.apply(lambda x: get_org_name(str(int(x))))
top10.reset_index(drop=True)
regnr | kodas | alga | autorine | viso | skaicius | pavadinimas | |
---|---|---|---|---|---|---|---|
0 | 300630105.0 | 778418 | 36973.68 | 0.0 | 244719.94 | 16 | UAB "BIOTECHA" |
1 | 126211233.0 | 715250 | 11084.89 | 0.0 | 40610.03 | 10 | UAB "NDX ENERGIJA" |
2 | 111789092.0 | 922941 | 9897.50 | 0.0 | 15970.28 | 4 | UAB "BIOMIN ANIMAL NUTRITION" |
3 | 301737900.0 | 1003665 | 8883.05 | 0.0 | 32352.63 | 9 | UAB "IDS BORJOMI EUROPE" |
4 | 0.0 | 2048307 | 8879.21 | 0.0 | 17787.66 | 5 | CV KESKUS OU |
5 | 111622773.0 | 83305 | 8368.50 | 0.0 | 20282.98 | 5 | VASTINT LITHUANIA, UAB |
6 | 300500236.0 | 578706 | 7856.37 | 0.0 | 12645.81 | 4 | UAB "ENERGOGRUPĖ" |
7 | 111881740.0 | 701615 | 7842.86 | 0.0 | 15756.31 | 5 | ORACLE EAST CENTRAL EUROPE LIMITED FILIALAS |
8 | 0.0 | 2371339 | 7173.96 | 0.0 | 14373.79 | 5 | BERTONA HOLDINGS LIMITED |
9 | 300633724.0 | 988747 | 6916.29 | 0.0 | 89716.51 | 35 | UAB "UBIQUITI NETWORKS EUROPE" |
10 | 149615085.0 | 560909 | 6508.74 | 0.0 | 10497.16 | 4 | UŽDAROJI AKCINĖ BENDROVĖ "MARISA" |
11 | 303876350.0 | 2324126 | 6197.77 | 0.0 | 9961.05 | 5 | GOOGLE LITHUANIA UAB |
12 | 111778459.0 | 706592 | 6195.97 | 0.0 | 103400.11 | 41 | UAB "JOHNSON & JOHNSON" |
13 | 303478396.0 | 2310260 | 5820.18 | 0.0 | 55214.90 | 24 | SIA "4FINANCE IT" LIETUVOS FILIALAS |
14 | 302409447.0 | 2021008 | 5744.56 | 0.0 | 38131.15 | 18 | "3M LIETUVA", UAB |
15 | 303119781.0 | 2232343 | 5558.69 | 0.0 | 175288.19 | 79 | UAB "ADVANTEC LIETUVA" |
16 | 302526767.0 | 2061583 | 5478.10 | 0.0 | 13232.93 | 8 | TALKA LT, UAB |
17 | 302466067.0 | 2039689 | 5441.85 | 0.0 | 54808.77 | 24 | HUAWEI TECHNOLOGIES (VILNIUS), UAB |
18 | 302679058.0 | 2129757 | 5437.13 | 0.0 | 46639.08 | 23 | ABBVIE UAB |
19 | 300017440.0 | 728706 | 5393.91 | 0.0 | 15095.43 | 7 | AMGEN SWITZERLAND AG VILNIAUS FILIALAS |
20 | 303850868.0 | 2323210 | 5383.05 | 0.0 | 8849.60 | 4 | COREBETA CONSULTING, UAB |
21 | 302489781.0 | 2049431 | 5371.69 | 0.0 | 34699.24 | 16 | UADBB IVP PARTNERS |
22 | 111751978.0 | 94714 | 5322.72 | 0.0 | 41195.28 | 19 | UAB "MICROSOFT LIETUVA" |
23 | 111694349.0 | 435496 | 5298.64 | 0.0 | 114038.58 | 52 | IKEA PURCHASING SERVICES (LITHUANIA), UAB |
24 | 111461341.0 | 79363 | 5297.25 | 0.0 | 12931.89 | 6 | UAB "SCHAGE REAL ESTATE" |
25 | 300129852.0 | 746450 | 5256.13 | 0.0 | 10781.78 | 5 | UAB "ATOTECH-CHEMETA" |
26 | 0.0 | 2006111 | 5192.93 | 0.0 | 8388.82 | 4 | DELL EMERGING MARKETS (EMEA) LIMITED |
27 | 125224854.0 | 44660 | 4898.67 | 0.0 | 32407.89 | 15 | UAB "MEDICINOS PROJEKTAI" |
28 | 300541343.0 | 766079 | 4877.57 | 0.0 | 19852.11 | 13 | ETL-BALTIC GROUP, UAB |
29 | 0.0 | 2225271 | 4821.86 | 0.0 | 48429.42 | 25 | RYANAIR LTD |
30 | 303075527.0 | 2219550 | 4704.09 | 0.0 | 15209.41 | 8 | AKCINĖ BENDROVĖ "INVALDA PRIVATUS KAPITALAS" |
31 | 302836470.0 | 2175339 | 4700.15 | 0.0 | 21025.88 | 11 | UAB "BIONORICA LITHUANIA" |
32 | 191595733.0 | 65280 | 4663.15 | 0.0 | 9368.27 | 4 | LIETUVOS SPORTO FEDERACIJŲ SĄJUNGA |
33 | 302419427.0 | 2024352 | 4662.84 | 0.0 | 13276.74 | 6 | MERCK SERONO, UAB |
34 | 300047572.0 | 734602 | 4514.70 | 0.0 | 14583.17 | 8 | UAB "BULL BALTIJA" |
35 | 302758438.0 | 2151831 | 4487.48 | 0.0 | 7212.28 | 4 | ARTECHNIKA UAB |
36 | 304311329.0 | 2789298 | 4461.36 | 0.0 | 32779.41 | 18 | UAB HEWLETT PACKARD VILNIUS |
37 | 121706497.0 | 66079 | 4433.20 | 0.0 | 218308.51 | 122 | UŽDAROJI AKCINĖ BENDROVĖ "EKSPLA" |
38 | 111810024.0 | 716914 | 4426.42 | 0.0 | 14339.64 | 8 | UŽDAROJI AKCINĖ BENDROVĖ "MANUBALTAS" |
39 | 111914165.0 | 863474 | 4400.59 | 0.0 | 10977.90 | 5 | PENTAIR THERMAL MANAGEMENT NETHERLANDS B.V. AT... |
40 | 303211144.0 | 2252707 | 4347.21 | 0.0 | 8887.18 | 1 | FREY WILLE LIETUVA UAB |
41 | 303055396.0 | 2213838 | 4342.64 | 0.0 | 7029.48 | 4 | UAB "ADAMA NORTHERN EUROPE" |
42 | 302651151.0 | 2117868 | 4315.47 | 0.0 | 39721.16 | 6 | KREDITO UNIJA AMBER |
43 | 0.0 | 2206590 | 4307.71 | 0.0 | 10735.79 | 6 | LENOVO TECHNOLOGY B.V.,SIVULIIKE SUOMESSA |
44 | 126119913.0 | 709344 | 4288.26 | 0.0 | 43865.27 | 25 | AB "INTER RAO LIETUVA" |
45 | 304065315.0 | 2341467 | 4253.31 | 0.0 | 35415.35 | 19 | MEDIAFON CARRIER SERVICES, UAB |
46 | 300580392.0 | 839158 | 4208.70 | 0.0 | 19189.96 | 12 | UAB "ROSHEN NORD" |
47 | 303043853.0 | 2211750 | 4197.60 | 0.0 | 19251.40 | 11 | DRIVR DEVELOPMENT UAB |
48 | 303246070.0 | 2261717 | 4181.56 | 0.0 | 56141.23 | 32 | UBER LITHUANIA SOFTWARE AND DEVELOPMENT UAB |
49 | 302527901.0 | 2061878 | 4171.84 | 0.0 | 71587.67 | 44 | UAB "NARBUTAS" |
Lygiai taip pat pasitikrinamo to top 10 mažiausius atlyginimus mokančių įmonių:
bot10 = data[~data.alga.isnull()].sort_values('alga', ascending=True).head(10)
bot10['pavadinimas'] = bot10.kodas.apply(lambda x: get_org_name(str(int(x))))
bot10.reset_index(drop=True)
regnr | kodas | alga | autorine | viso | skaicius | pavadinimas | |
---|---|---|---|---|---|---|---|
0 | 125326987.0 | 55883 | 0.90 | NaN | 1.80 | 6 | UAB JURGINIO PROJEKTŲ MENEDŽMENTAS |
1 | 304148519.0 | 2389208 | 2.08 | NaN | 3.39 | 2 | UAB "RINGA" |
2 | 110742830.0 | 453480 | 2.32 | NaN | 3.77 | 4 | LIETUVOS IR LENKIJOS UŽDAROJI AKCINĖ BENDROVĖ ... |
3 | 302555772.0 | 2071919 | 2.32 | NaN | 3.81 | 4 | UAB "GIRIOS TAKAS" |
4 | 302542351.0 | 2066490 | 2.32 | NaN | 10.28 | 1 | UAB "DIAMEDA" |
5 | 221360110.0 | 44070 | 2.32 | NaN | 3.87 | 4 | UŽDAROJI AKCINĖ BENDROVĖ FIRMA "ELMARKET" |
6 | 304400475.0 | 2820666 | 2.32 | NaN | 20.66 | 21 | UAB "ANTINAS" |
7 | 302651062.0 | 2117866 | 2.32 | NaN | 6.61 | 7 | UAB "SMITTER" |
8 | 302782282.0 | 2160744 | 2.32 | NaN | 4.70 | 5 | UAB "VINTEPA" |
9 | 303027411.0 | 2208242 | 2.32 | NaN | 3.77 | 4 | UAB "FERRYCO" |
Pasitikrinam atlyginimų statistinį pasiskirstyma naudodami historamos grafiką, tik šį kartą atrenkame tik tas įmones, kurių vidutinis atlyginimas yra mažesnis už 5000€, kadangi iš dėžutės diagramos matėme, kad didžioji dauguma moka mažiau, kaip 5000€.
data[data.alga < 5000].alga.plot.hist(bins=100, grid=True)
<matplotlib.axes._subplots.AxesSubplot at 0x7f353f27eef0>
Žiūrim, darbuotojų skaičiaus statistinį pasiskirstymą:
data.skaicius.plot.box(vert=False, showmeans=True, grid=True)
<matplotlib.axes._subplots.AxesSubplot at 0x7f353f13aef0>
Kokios įmonės turi daugiausiai darbuotojų:
top10 = data.sort_values('skaicius', ascending=False).head(10)
top10['pavadinimas'] = top10.kodas.apply(lambda x: get_org_name(str(int(x))))
top10.reset_index(drop=True)
regnr | kodas | alga | autorine | viso | skaicius | pavadinimas | |
---|---|---|---|---|---|---|---|
0 | 123033512.0 | 80333 | 547.70 | NaN | 3299667.48 | 15603 | MAXIMA LT, UAB |
1 | 110053842.0 | 63323 | 1057.62 | NaN | 4137056.92 | 9673 | AKCINĖ BENDROVĖ "LIETUVOS GELEŽINKELIAI" |
2 | 135163499.0 | 457339 | 733.95 | NaN | 2054480.34 | 7356 | LIETUVOS SVEIKATOS MOKSLŲ UNIVERSITETO LIGONIN... |
3 | 110193723.0 | 62238 | 556.62 | NaN | 1572580.22 | 7353 | UŽDAROJI AKCINĖ BENDROVĖ "PALINK" |
4 | 121215587.0 | 42077 | 470.30 | NaN | 1075502.49 | 5651 | AKCINĖ BENDROVĖ LIETUVOS PAŠTAS |
5 | 211950810.0 | 49029 | 705.00 | 289.26 | 1320926.72 | 4822 | VILNIAUS UNIVERSITETAS |
6 | 124364561.0 | 59521 | 955.35 | NaN | 1573858.90 | 4308 | VIEŠOJI ĮSTAIGA VILNIAUS UNIVERSITETO LIGONINĖ... |
7 | 188732677.0 | 50484 | 724.47 | NaN | 465611.27 | 4108 | LIETUVOS KARIUOMENĖ |
8 | 234376520.0 | 434584 | 734.34 | NaN | 1083362.62 | 3784 | UŽDAROJI AKCINĖ BENDROVĖ "KESKO SENUKAI LITHUA... |
9 | 123715317.0 | 64083 | 595.47 | NaN | 782509.83 | 3385 | UŽDAROJI AKCINĖ BENDROVĖ "RIMI LIETUVA" |
Įmonės, kurios turi daugiau nei 1000 darbuotojų, surūšiuotos pagal atlyginimo dydį:
top10 = data[data.skaicius > 1000].sort_values('alga', ascending=False).head(10)
top10['pavadinimas'] = top10.kodas.apply(lambda x: get_org_name(str(int(x))))
top10.reset_index(drop=True)
regnr | kodas | alga | autorine | viso | skaicius | pavadinimas | |
---|---|---|---|---|---|---|---|
0 | 302455964.0 | 2036302 | 1972.56 | NaN | 946817.08 | 1187 | BARCLAYS GROUP OPERATIONS LIMITED LIETUVOS FIL... |
1 | 112029651.0 | 51021 | 1640.09 | NaN | 733689.31 | 1221 | "SWEDBANK", AB |
2 | 121215434.0 | 42307 | 1612.60 | NaN | 1167383.22 | 2238 | TELIA LIETUVA, AB |
3 | 301694694.0 | 1002281 | 1610.36 | NaN | 1320014.41 | 2088 | DANSKE BANK A/S LIETUVOS FILIALAS |
4 | 112021238.0 | 51024 | 1554.43 | NaN | 894792.73 | 1621 | AB SEB BANKAS |
5 | 166451720.0 | 285089 | 1463.84 | NaN | 791187.48 | 1361 | AKCINĖ BENDROVĖ "ORLEN LIETUVA" |
6 | 110051834.0 | 51060 | 1427.41 | NaN | 618673.02 | 1140 | AKCINĖ BENDROVĖ "LIETUVOS DRAUDIMAS" |
7 | 304151376.0 | 2390533 | 1414.39 | 878.28 | 1524555.21 | 2602 | AB "ENERGIJOS SKIRSTYMO OPERATORIUS" |
8 | 112029270.0 | 51018 | 1410.10 | NaN | 615424.53 | 1205 | AB DNB BANKAS |
9 | 188613242.0 | 51135 | 1379.71 | NaN | 549709.88 | 1141 | LIETUVOS RESPUBLIKOS UŽSIENIO REIKALŲ MINISTERIJA |
Įmonės virš 1000 darbuotojų, bet mokančios mažiausius atlyginimus:
top10 = data[(data.skaicius > 1000) & (~data.alga.isnull())].sort_values('alga', ascending=True).head(10)
top10['pavadinimas'] = top10.kodas.apply(lambda x: get_org_name(str(int(x))))
top10.reset_index(drop=True)
regnr | kodas | alga | autorine | viso | skaicius | pavadinimas | |
---|---|---|---|---|---|---|---|
0 | 302496427.0 | 2051702 | 255.97 | NaN | 104750.96 | 1023 | UŽDAROJI AKCINĖ BENDROVĖ "SOCIALINĖ INTEGRACIJA" |
1 | 242156050.0 | 925291 | 334.07 | NaN | 332308.27 | 2392 | UAB "HEADEX" |
2 | 300055900.0 | 736599 | 384.33 | NaN | 341854.86 | 2028 | UAB "BIURO" |
3 | 303297727.0 | 2272789 | 388.22 | NaN | 160451.51 | 1024 | UAB "MANO APLINKA" |
4 | 122755433.0 | 81092 | 427.93 | 208.07 | 284418.65 | 1565 | UŽDAROJI AKCINĖ BENDROVĖ "EKSKOMISARŲ BIURAS" |
5 | 301675046.0 | 1020217 | 447.34 | NaN | 199547.05 | 1081 | AMBER FOOD, UAB |
6 | 121215587.0 | 42077 | 470.30 | NaN | 1075502.49 | 5651 | AKCINĖ BENDROVĖ LIETUVOS PAŠTAS |
7 | 303342720.0 | 2285582 | 496.79 | NaN | 179897.88 | 1005 | UAB "GIRMETA" |
8 | 141237452.0 | 340520 | 513.00 | NaN | 254210.04 | 1243 | UAB SAUGOS TARNYBA "ARGUS" |
9 | 302714071.0 | 2140255 | 544.01 | NaN | 196349.65 | 1018 | UAB "TERMOLITA" |
Įmonės virš 2000 darbuotojų, bet mokančius mažiausius atlyginimus:
top10 = data[(data.skaicius > 2000) & (~data.alga.isnull())].sort_values('alga', ascending=True).head(10)
top10['pavadinimas'] = top10.kodas.apply(lambda x: get_org_name(str(int(x))))
top10.reset_index(drop=True)
regnr | kodas | alga | autorine | viso | skaicius | pavadinimas | |
---|---|---|---|---|---|---|---|
0 | 242156050.0 | 925291 | 334.07 | NaN | 332308.27 | 2392 | UAB "HEADEX" |
1 | 300055900.0 | 736599 | 384.33 | NaN | 341854.86 | 2028 | UAB "BIURO" |
2 | 121215587.0 | 42077 | 470.30 | NaN | 1075502.49 | 5651 | AKCINĖ BENDROVĖ LIETUVOS PAŠTAS |
3 | 123033512.0 | 80333 | 547.70 | NaN | 3299667.48 | 15603 | MAXIMA LT, UAB |
4 | 110193723.0 | 62238 | 556.62 | NaN | 1572580.22 | 7353 | UŽDAROJI AKCINĖ BENDROVĖ "PALINK" |
5 | 110778328.0 | 62459 | 572.26 | NaN | 742104.46 | 3369 | UŽDAROJI AKCINĖ BENDROVĖ "NORFOS MAŽMENA" |
6 | 123715317.0 | 64083 | 595.47 | NaN | 782509.83 | 3385 | UŽDAROJI AKCINĖ BENDROVĖ "RIMI LIETUVA" |
7 | 302583800.0 | 2088935 | 666.00 | NaN | 525152.38 | 2006 | VIEŠOJI ĮSTAIGA KAUNO KLINIKINĖ LIGONINĖ |
8 | 111502432.0 | 136857 | 668.95 | NaN | 519995.58 | 2032 | UŽDAROJI AKCINĖ BENDROVĖ "INTERSURGICAL" |
9 | 211950810.0 | 49029 | 705.00 | 289.26 | 1320926.72 | 4822 | VILNIAUS UNIVERSITETAS |
Įmonių statistinis pasiskirstymas pagal darbuotojų skaičiu, histogramos grafike (tik tos įmonės, kurios turi mažiau kaip 500 darbuotojų):
data[data.skaicius < 500].skaicius.plot.hist(bins=200, grid=True, logx=True)
<matplotlib.axes._subplots.AxesSubplot at 0x7f353d71c5c0>
Kas gauna didžiausius autorinius atlyginimus?
top10 = data[~data.autorine.isnull()].sort_values('autorine', ascending=False).head(10)
top10['pavadinimas'] = top10.kodas.apply(lambda x: get_org_name(str(int(x))))
top10.reset_index(drop=True)
regnr | kodas | alga | autorine | viso | skaicius | pavadinimas | |
---|---|---|---|---|---|---|---|
0 | 302811111.0 | 2169309 | 1937.17 | 13752.60 | 40737.27 | 20 | VŠĮ "ŽALGIRIO KREPŠINIO CENTRAS" |
1 | 156673480.0 | 421711 | 3322.04 | 10770.84 | 57419.00 | 40 | UAB KONCERNAS "ACHEMOS GRUPĖ" |
2 | 225880090.0 | 704053 | 2858.40 | 4745.83 | 46709.60 | 20 | VIEŠOJI ĮSTAIGA "KREPŠINIO RYTAS" |
3 | 301048677.0 | 241732 | 552.50 | 3000.00 | 10335.97 | 4 | VŠĮ KREPŠINIO KLUBAS "LIETKABELIS" |
4 | 190753924.0 | 41060 | 810.01 | 2330.29 | 62930.90 | 173 | LIETUVOS NACIONALINIS DRAMOS TEATRAS |
5 | 123615345.0 | 59439 | 1358.20 | 1782.00 | 56236.01 | 104 | SAVIVALDYBĖS ĮMONĖ "VILNIAUS PLANAS" |
6 | 126046828.0 | 707258 | 418.46 | 1576.42 | 4226.33 | 7 | VIEŠOJI ĮSTAIGA "PRO S" STUDIJA |
7 | 221387310.0 | 50365 | 780.42 | 1426.67 | 27715.55 | 52 | UŽDAROJI AKCINĖ BENDROVĖ "VILNIAUS ARCHITEKTŪR... |
8 | 135268055.0 | 458058 | 2370.00 | 1390.67 | 8026.81 | 5 | UŽDAROJI AKCINĖ BENDROVĖ "BE TABU" IR KO |
9 | 300083173.0 | 741211 | 1641.84 | 1209.20 | 7595.65 | 5 | UAB "FRIDAY PRODUCTIONS" |