%pylab inline
import pandas as pd
from IPython import display
Populating the interactive namespace from numpy and matplotlib
/home/walrus/.virtualenvs/py/local/lib/python2.7/site-packages/pandas/io/excel.py:626: UserWarning: Installed openpyxl is not supported at this time. Use >=1.6.1 and <2.0.0. .format(openpyxl_compat.start_ver, openpyxl_compat.stop_ver))
dados_usp = pd.read_csv('tabela-nomes_data.csv', sep=';', decimal=',')
dc = dados_usp.groupby(dados_usp.Categoria)
anual = dc['Salario Mensal'].sum()*12
anual.plot(kind='barh')
<matplotlib.axes.AxesSubplot at 0x40c1790>
dados_usp['Salario Mensal'].hist(bins=20, range=(0,35000))
<matplotlib.axes.AxesSubplot at 0x420e050>
display.HTML('<H3> {:3d} recebem mais de R$35.000,00 </H3>'.format(len(dados_usp[dados_usp['Salario Mensal'] > 35000])))
mais_24 = dados_usp[(dados_usp['Categoria'] != 'Docente Aposentado') & \
(dados_usp['Categoria'] != 'Funcionário Aposentado') & \
(dados_usp['Salario Mensal'] > 24000)]
display.HTML('<H3>{} recebem mais de R$24.000 e não são aposentados</H3>'.format(len(mais_24)))
mais_24['Função'].value_counts()
Professor Titular 400 Professor Associado 25 Procurador 15 Analista de Sistemas 3 Técnico em Assuntos Administrativos 2 Professor Doutor 2 Analista Assuntos Administrativos 1 Analista Acadêmico 1 Analista de Recursos Humanos 1 Analista de Comunicacao Visual 1 Físico 1 Técnico Acadêmico 1 dtype: int64
dados_usp[dados_usp['Salario Mensal'] > 35000][['Nome', 'Unidade da USP', 'Função', 'Categoria', 'Salario Mensal']]
Nome | Unidade da USP | Função | Categoria | Salario Mensal | |
---|---|---|---|---|---|
0 | Arrigo Leonardo Angelini | Instituto de Psicologia | Professor Catedratico | Docente Aposentado | 60248.38 |
1 | Sergio de Iudicibus | Faculdade de Economia, Administração e Contabi... | Professor Titular | Docente Aposentado | 47422.56 |
2 | Boris Fausto | Reitoria da Universidade de São Paulo | Procurador | Funcionário Aposentado | 45973.65 |
3 | Berta Lange de Morretes | Instituto de Biociências | Professor Titular | Docente Aposentado | 45942.21 |
4 | Fabio Prado | Reitoria da Universidade de São Paulo | Procurador | Funcionário Aposentado | 45136.16 |
5 | Affonso Renato Meira | Faculdade de Medicina | Professor Titular | Docente Aposentado | 42129.90 |
6 | Jose Moacyr Vianna Coutinho | Reitoria da Universidade de São Paulo | Professor Titular | Docente Aposentado | 42129.90 |
7 | Maria Sylvia Carvalho Franco | Faculdade de Filosofia, Letras e Ciências Humanas | Professor Titular | Docente Aposentado | 42129.90 |
8 | Erwin Theodor Rosenthal | Faculdade de Filosofia, Letras e Ciências Humanas | Professor Catedratico | Docente Aposentado | 41606.39 |
9 | Antonio Morales | Faculdade de Economia, Administração e Contabi... | Professor Catedratico | Docente Aposentado | 40223.76 |
10 | Manuel Nunes Dias | Faculdade de Filosofia, Letras e Ciências Humanas | Professor Titular | Docente Aposentado | 40223.76 |
11 | Maria Thereza Schorer Petrone | Faculdade de Filosofia, Letras e Ciências Humanas | Professor Titular | Docente Aposentado | 40223.76 |
12 | Sonia Apparecida de Siqueira | Faculdade de Filosofia, Letras e Ciências Humanas | Professor Titular | Docente Aposentado | 40223.76 |
13 | Giorgio Moscati | Instituto de Física | Professor Titular | Docente Aposentado | 39260.04 |
14 | Jose Barbosa | Faculdade de Odontologia | Professor Titular | Docente Aposentado | 38317.60 |
15 | Mario Demar Perez | Instituto de Ciências Biomédicas | Professor Titular | Docente Aposentado | 37211.63 |
16 | Massaud Moises | Faculdade de Filosofia, Letras e Ciências Humanas | Professor Titular | Docente Aposentado | 37211.63 |
17 | Lea Goldenstein | Faculdade de Filosofia, Letras e Ciências Humanas | Professor Titular | Docente Aposentado | 35549.21 |
18 | Guilherme da Costa Pinto Filho | Reitoria da Universidade de São Paulo | Procurador | Funcionário Aposentado | 35211.18 |
aposentados = dados_usp[(dados_usp['Categoria'] == 'Docente Aposentado') | \
(dados_usp['Categoria'] == 'Funcionário Aposentado')]
display.HTML("<h3>R${:,.2f}</h3>".format(aposentados['Salario Mensal'].sum()*12))
dados_usp[dados_usp['Salario Mensal'] > 35000].groupby(dados_usp['Unidade da USP'])['Salario Mensal'].sum().plot(kind='barh')
<matplotlib.axes.AxesSubplot at 0x9de8590>
dados_usp[dados_usp['Salario Mensal'] > 35000].groupby('Unidade da USP')['Salario Mensal'].count()
Unidade da USP Faculdade de Economia, Administração e Contabilidade 2 Faculdade de Filosofia, Letras e Ciências Humanas 7 Faculdade de Medicina 1 Faculdade de Odontologia 1 Instituto de Biociências 1 Instituto de Ciências Biomédicas 1 Instituto de Física 1 Instituto de Psicologia 1 Reitoria da Universidade de São Paulo 4 Name: Salario Mensal, dtype: int64
valor_separador = 24000
total_maior = dados_usp[dados_usp['Salario Mensal'] >= valor_separador]['Salario Mensal'].sum()
num_total_maior = float(len(dados_usp[dados_usp['Salario Mensal'] > valor_separador]))
total_menor = dados_usp[dados_usp['Salario Mensal'] < valor_separador]['Salario Mensal'].sum()
num_total_menor = float(len(dados_usp[dados_usp['Salario Mensal'] < valor_separador]))
total_mes = dados_usp['Salario Mensal'].sum()
num_total_mes = float(len(dados_usp))
display.HTML('<h2>{:.2%} ({:.0f} de {:.0f}) recebem menos de R${:.2f}, sendo que eles representam {:.2%} do custo da USP em salários.</h2><p> \
<h2>{:.2%} ({:.0f} de {:.0f}) recebem mais de R${:.2f}, sendo que eles representam {:.2%} do custo da USP em salários.</h2></h2>'\
.format(num_total_menor/num_total_mes,
num_total_menor, num_total_mes, valor_separador,\
total_menor/total_mes, \
num_total_maior/num_total_mes, num_total_maior, num_total_mes, valor_separador,
total_maior/total_mes))