#!/usr/bin/env python # coding: utf-8 # In[1]: import pandas as pd # # 1. Baixe os dados e carregue-os com o Pandas # In[2]: data = pd.read_excel('BaseDadosQuadroDetalhadoDaAcao.xls') # # 2. Agrupe os dados da planilha por Subprefeitura # In[3]: data_sub = data.groupby('DESC_SUBPREFEITURA') # # 3. Filtre os projetos de 2016 com maiores custos por Subprefeitura # In[70]: max_proj = data.iloc[data_sub['VALOR_DA'].idxmax()][['DESC_SUBPREFEITURA', 'COD_SUBPREFEITURA', 'DESC_PA', 'VALOR_DA']] max_proj # # 4. Carregue dados geográficos das subprefeituras # # Por exemplo usando o arquivo 'subprefeituras.csv' do nosso repositório https://github.com/okfn-brasil/gastos_abertos_dados/tree/master/GIS. # In[33]: mapa = pd.read_csv('subprefeituras.csv') # # 5. Adicione à planilha acima os dados que extraímos dos projetos de 2016 # In[39]: mapa['subpreferitura_cod'] = [66, 50, 57, 44, 56, 71, 62, 43, 68, 53, 64, 67, 55, 48, 58, 65, 60, 61, 41, 51, 42, 45, 54, 70, 63, 49, -1, 46, 52, 69, 69] # In[64]: descr = [] valores = [] for sc in mapa.subpreferitura_cod.values: if sc != -1: sub_max = max_proj[max_proj['COD_SUBPREFEITURA'] == sc] valores.append(float(sub_max['VALOR_DA'])) descr.append(str(sub_max['DESC_PA'])) else: valores.append(0) descr.append("") # In[65]: mapa['valor'] = valores mapa['descr_proj'] = descr # # 6. Salve a nova planilha # In[69]: mapa.to_csv('mapa_top.csv') # # 7. Publique no CartoDB! # # http://bit.ly/1lvKhHC # # # In[ ]: