NumPy Data Access Using ArcPy¶

In [ ]:

import arcpy as ARCPY
import arcpy.da as DA
inputFC = r'../data/CA_Polygons.shp'
tab = DA.TableToNumPyArray(inputFC, ['PCR2000', 'POP2000'])
print(tab)

SSDataObject¶

Environment Settings (Except Extent)
Bad Records
Error/Warning Messages
Localization
Feature Accounting

Cursors and DataAccess are not assured to read attributes in order.
Keeps track of the shapes and their attributes so that one can create output features w/o post-joins.
Unique ID works with Spatial Weights Formats in ArcGIS, PySAL, R, Matlab, GeoDa etc..

In [ ]:

import SSDataObject as SSDO
ssdo = SSDO.SSDataObject(inputFC)
ssdo.obtainData(ssdo.oidName, ['PCR2000', 'POP2000'])
print(ssdo.fields['PCR2000'].data)

Using PANDAS to get that R Feel¶

In [ ]:

import pandas as PANDAS
ids = [ssdo.order2Master[i] for i in range(ssdo.numObs)]
convertDictDF = {}
for fieldName, fieldObject in ssdo.fields.items():
    convertDictDF[fieldName] = fieldObject.data
df = PANDAS.DataFrame(convertDictDF, index = ids)
print(df)

Advanced Analysis [SciPy Example - KMeans]¶

In [ ]:

import numpy as NUM
import scipy.cluster.vq as CLUST
import arcgisscripting as ARC
X = NUM.empty((ssdo.numObs,2), dtype = float)
X[:,0] = df['PCR2000']
X[:,1] = df['POP2000']
whiteData = CLUST.whiten(X)
centers, distortion = CLUST.kmeans(whiteData, 5)
groups = ARC._ss.closest_centroid(whiteData, centers)
print(groups)

In [ ]:

ARCPY.env.overwriteOutput = True
outputFC = r'C:\Data\UC\DevSummit15\OpenSource\output\kmeans_ca.shp'
outField = SSDO.CandidateField('SS_GROUP', 'LONG', groups)
outFields = {'SS_GROUP': outField}
ssdo.output2NewFC(outputFC, outFields, appendFields = ["NEW_NAME", "PERCNOHS"])

In [ ]: