Clase 2a: Introducción a NumPy¶

_Hasta ahora hemos visto los tipos de datos más básicos que nos ofrece Python: integer, real, complex, boolean, list, tuple... Pero ¿no echas algo de menos? Efectivamente, los arrays. _

Durante esta nos adentraremos en el paquete NumPy: veremos como los arrays mejoran la eficiencia de nuestro código, aprenderemos a crearlos y a operar con ellos.

¿Qué es un array?¶

Un array es un bloque de memoria que contiene elementos del mismo tipo. Básicamente:

nos recuerdan a los vectores, matrices, tensores...
podemos almacenar el array con un nombre y acceder a sus elementos mediante sus índices.
ayudan a gestionar de manera eficiente la memoria y a acelerar los cálculos.

Índice	0	1	2	3	...	n-1	n
Valor	2.1	3.6	7.8	1.5	...	5.4	6.3

¿Qué solemos guardar en arrays?

Vectores y matrices.
Datos de experimentos:
- En distintos instantes discretos.
- En distintos puntos del espacio.
Resultado de evaluar funciones con los datos anteriores.
Discretizaciones para usar algoritmos de: integración, derivación, interpolación...
...

¿Qué es NumPy?¶

NumPy es un paquete fundamental para la programación científica que proporciona un objeto tipo array para almacenar datos de forma eficiente y una serie de funciones para operar y manipular esos datos. Para usar NumPy lo primero que debemos hacer es importarlo:

In [1]:

import numpy as np
#para ver la versión que tenemos instalada:
np.__version__

Out[1]:

'1.9.0'

Nuestro primer array¶

¿No decíamos que Python era fácil? Pues creemos nuestros primeros arrays:

In [2]:

import numpy as np

In [3]:

# Array de una dimensión
mi_primer_array = np.array([1, 2, 3, 4]) 
mi_primer_array

Out[3]:

array([1, 2, 3, 4])

In [4]:

# Podemos usar print
print(mi_primer_array)

[1 2 3 4]

In [5]:

# Comprobar el tipo de mi_primer_array
type(mi_primer_array)

Out[5]:

numpy.ndarray

In [6]:

# Comprobar el tipo de datos que contiene
mi_primer_array.dtype

Out[6]:

dtype('int64')

Los arrays de una dimensión se crean pasándole una lista como argumento a la función np.array. Para crear un array de dos dimensiones le pasaremos una lista de listas:

In [7]:

# Array de dos dimensiones
mi_segundo_array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

Podemos continuar en la siguiente línea usando `\`, pero no es necesario escribirlo dentro de paréntesis o corchetes

Esto sería una buena manera de definirlo, de acuerdo con el PEP 8 (indentation):

In [8]:

mi_segundo_array = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
    ]) 

Funciones y constantes de NumPy¶

Hemos dicho que NumPy también incorporá funciones. Un ejemplo sencillo:

In [9]:

# Suma
np.sum(mi_primer_array)

Out[9]:

In [10]:

# Máximo
np.max(mi_primer_array)

Out[10]:

In [11]:

# Seno
np.sin(mi_segundo_array)

Out[11]:

array([[ 0.84147098,  0.90929743,  0.14112001],
       [-0.7568025 , -0.95892427, -0.2794155 ],
       [ 0.6569866 ,  0.98935825,  0.41211849]])

Y algunas constantes que podemos neccesitar:

In [12]:

np.pi, np.e

Out[12]:

(3.141592653589793, 2.718281828459045)

Características de los arrays de NumPy¶

El objeto tipo array que proporciona NumPy (Python ya dispone de un tipo array que sirve para almacenar elementos de igual tipo pero no proporciona toda la artillería matemática necesaria como para hacer operaciones de manera rápida y eficiente) se caracteriza por:

1) Homogeneidad de tipo:¶

Comencemos viendo que ocurre con las listas:

In [13]:

lista = [ 1, 1+2j, True, 'aerodinamica', [1, 2, 3] ]
lista

Out[13]:

[1, (1+2j), True, 'aerodinamica', [1, 2, 3]]

En el caso de los arrays:

In [14]:

array = np.array([ 1, 1+2j, True, 'aerodinamica'])
array

Out[14]:

array(['1', '(1+2j)', 'True', 'aerodinamica'], 
      dtype='<U64')

¿Todo bien? Pues no. Mientras que en la lista cada elemento conserva su tipo, en el array, todos han de tener el mismo y NumPy ha considerado que todos van a ser string.

2) Tamaño fijo en el momento de la creación:¶

¡Tranquilo! los allocate son automáticos...

Igual que en el caso anterior, comencemos con la lista:

In [15]:

print(id(lista))
lista.append('fluidos')
print(lista)
print(id(lista))

139998521305288
[1, (1+2j), True, 'aerodinamica', [1, 2, 3], 'fluidos']
139998521305288

In [16]:

print(id(array))
array = np.append(array, 'fluidos')
print(array)
print(id(array))

139998351447504
['1' '(1+2j)' 'True' 'aerodinamica' 'fluidos']
139998351448304

Si consultamos la ayuda de la función np.append escribiendo en una celda help(np.append) podemos leer:

Returns
-------
append : ndarray
    A copy of `arr` with `values` appended to `axis`.  Note that `append` does not occur in-place: a new array is allocated and filled.  If `axis` is None, `out` is a flattened array.

3) Eficiencia¶

Hasta el momento los arrays han demostrado ser bastante menos flexibles que las listas, luego olvidemos estos últimos 10 minutos y manejemos siempre listas... ¿no? ¡Pues no! Los arrays realizan una gestión de la memoria mucho más eficiente que mejora el rendimiento.

Prestemos atención ahora a la velocidad de ejecución gracias a la función mágica %%timeit, que colocada al inicio de una celda nos indicará el tiempo que tarda en ejecutarse.

In [17]:

lista = list(range(0,100000))
type(lista)

Out[17]:

list

In [18]:

%%timeit
sum(lista)

1000 loops, best of 3: 1.61 ms per loop

In [19]:

array = np.arange(0, 100000)

In [20]:

%%timeit
np.sum(array)

10000 loops, best of 3: 98.2 µs per loop

Como ves, las mejoras en este caso son de 2 órdenes de magnitud. NumPy nos ofrece funciones que se ejecutan prácticamente en tiempos de lenguaje compilado (Fortran, C, C++) y optimizado, pero escribiendo mucho menos código y con un nivel de abstracción mayor. Conociendo una serie de buenas prácticas, podremos competir en velocidad con nuestros códigos en Python. Para casos en los que no sea posible, existen herramientas que nos permiten ejecutar desde Python nuestros códigos en otros lengujes como f2py. Este tema puede resultarte algo avanzado a estas alturas, pero bastante útil; puedes consultar este artículo de pybonacci si lo necesitas.

Funciones para crear arrays¶

¿Demasiada teoría? vayamos a la práctica. Ya hemos visto que la función np.array() nos permite crear arrays con los valores que nosotros introduzcamos manualmente a través de listas. Más adelante, aprenderemos a leer ficheros y almacenarlos en arrays. Mientras tanto, ¿qué puede hacernos falta?

array de ceros¶

In [21]:

# En una dimensión
np.zeros(100)

Out[21]:

array([ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,
        0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,
        0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,
        0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,
        0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,
        0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,
        0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,
        0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.])

In [22]:

# En dos dimensiones
np.zeros([10,10])

Out[22]:

array([[ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.]])

Nota: En el caso 1D es válido tanto `np.zeros([5])` como `np.zeros(5)` (sin los corchetes), pero no lo será para el caso nD

array "vacío"¶

In [23]:

np.empty(10)

Out[23]:

array([  6.91684881e-310,   2.03912117e-316,   0.00000000e+000,
         0.00000000e+000,   0.00000000e+000,   0.00000000e+000,
         0.00000000e+000,   0.00000000e+000,   0.00000000e+000,
         0.00000000e+000])

Importante: El array vacío se crea en un tiempo algo inferior al array de ceros. Sin embargo, el valor de sus elementos será arbitrario y dependerá del estado de la memoria. Si lo utilizas asegúrate de que luego llenas bien todos sus elementos porque podrías introducir resultados erróneos.

array de unos¶

In [24]:

np.ones([3,2])

Out[24]:

array([[ 1.,  1.],
       [ 1.,  1.],
       [ 1.,  1.]])

Nota: Otras funciones muy útiles son `np.zeros_like` y `np.ones_like`. Usa la ayuda para ver lo que hacen si lo necesitas.

array identidad¶

In [25]:

np.identity(4)

Out[25]:

array([[ 1.,  0.,  0.,  0.],
       [ 0.,  1.,  0.,  0.],
       [ 0.,  0.,  1.,  0.],
       [ 0.,  0.,  0.,  1.]])

Nota: También puedes probar `np.eye()` y `np.diag()`.

Rangos¶

np.arange¶

NumPy, dame un array que vaya de 0 a 5:

In [26]:

a = np.arange(0, 5)
a

Out[26]:

array([0, 1, 2, 3, 4])

Mira con atención el resultado anterior, ¿hay algo que deberías grabar en tu cabeza para simpre? El último elemento no es 5 sino 4

NumPy, dame un array que vaya de 0 a 10, de 3 en 3:

In [27]:

np.arange(0,11,3)

Out[27]:

array([0, 3, 6, 9])

np.linspace¶

Si has tenido que usar MATLAB alguna vez, seguro que esto te suena:

In [28]:

np.linspace(0, 10, 21)

Out[28]:

array([  0. ,   0.5,   1. ,   1.5,   2. ,   2.5,   3. ,   3.5,   4. ,
         4.5,   5. ,   5.5,   6. ,   6.5,   7. ,   7.5,   8. ,   8.5,
         9. ,   9.5,  10. ])

En este caso sí que se incluye el último elemento.

Nota: También puedes probar `np.logspace()`

reshape¶

Con np.arange() es posible crear "vectores" cuyos elementos tomen valores consecutivos o equiespaciados, como hemos visto anteriormente. ¿Podemos hacer lo mismo con "matrices"? Pues sí, pero no usando una sola función. Imagina que quieres crear algo como esto:

\begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6\\ 7 & 8 & 9\\ \end{pmatrix}

Comenzaremos por crear un array 1d con los valores $(1,2,3,4,5,6,7,8,9)$ usando np.arange().
Luego le daremos forma de array 2d. con np.reshape(array, (dim0, dim1)).

In [34]:

a = np.arange(1,10)
M = np.reshape(a, [3,3])
M

Out[34]:

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [35]:

# También funciona como método
N = a.reshape([3,3])
N

Out[35]:

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

Nota: No vamos a entrar demasiado en qué son los métodos, pero debes saber que están asociados a la programación orientada a objetos y que en Python todo es un objeto. Lo que debes pensar es que son unas funciones especiales en las que el argumento más importante (sobre el que se realiza la acción) se escribe delante seguido de un punto. Por ejemplo: `.método(argumentos)`

Importación¶

Python es un lenguaje que está altamente modularizado: está dividido en bibliotecas que realizan tareas específicas. Para hacer uso de ellas debemos importarlas. Podemos importar cosas de la biblioteca estándar, de paquetes que hayamos descargado (o se enceuntren en nuestra distribución) o de módulos que nosotros mismos construyamos.

Existen varias formas de importar:

import numpy

Cada vez que queramos acceder a una función de numpy, deberemos escribir:

numpy.sin(5)
numpy.linspace(0,100,50)

Como esto puede resultar tedioso, suele utilizarse un namespace, el recomendado en la documentación oficial y que usaremos en el curso es:

import numpy as np

Ahora podremos llamar a funciones escribiendo:

np.sin(5)
np.linspace(0,100,50)

Si esto te sigue pareciendo demasido escribir puedes hacer (altamente no recomendado):

from numpy import *

El asterisco, quiere decir TODO. Esto genera varios problemas:

Imporatará gran cantidad de funciones y clases que puede que no necesites.
El nombre de estas funciones, puede coincidir con el de alguna de otro módulo que hayas importado, de manera que "la machacará", por lo que se producirán ambigüedades.

Ejemplo: ¿por qué no hacer from numpy import * ?¶

In [36]:

from numpy import *

a = [1,2,3,4,5]
sin(a)

Out[36]:

array([ 0.84147098,  0.90929743,  0.14112001, -0.7568025 , -0.95892427])

In [37]:

from math import *

sin(a)

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-37-bd5f2f081266> in <module>()
      1 from math import *
      2 
----> 3 sin(a)

TypeError: a float is required

La función seno que incorporá math no es la misma que la de NumPy. Ambas proporcionarán el seno de un número, evidentemente, el mismo resultado para el mismo número, pero una acepta listas y la otra no. Al hacer la segunda importación, la función seno de NumPy se ha sustituido por la de math y la misma sentencia, da un error. Esto puede hacer que te vuelvas un poco loco si tu código es grande o acabes volviendo loco a alguien si usa tu código.

¿Suficiente? Ahora ya sabes por qué tendrás que escribir np.loquesea siempre.

Importante: Reiniciemos el kernel e importemos bien NumPy para continuar.

In [1]:

import numpy as np

Operaciones¶

Operaciones elemento a elemento¶

Ahora que pocas cosas se nos escapan de los arrays, probemos a hacer algunas operaciones. El funcionamiento es el habitual en FORTRAN y MATLAB y poco hay que añadir:

In [2]:

#crear un arra y y sumarle un número
arr = np.arange(11)
arr + 55

Out[2]:

array([55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65])

In [3]:

#multiplicarlo por un número
arr * 2

Out[3]:

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18, 20])

In [4]:

#elevarlo al cuadrado
arr ** 2

Out[4]:

array([  0,   1,   4,   9,  16,  25,  36,  49,  64,  81, 100])

In [5]:

#calcular una función
np.tanh(arr)

Out[5]:

array([ 0.        ,  0.76159416,  0.96402758,  0.99505475,  0.9993293 ,
        0.9999092 ,  0.99998771,  0.99999834,  0.99999977,  0.99999997,  1.        ])

Entrenamiento: Puedes tratar de comparar la diferencia de tiempo entre realizar la operación en bloque, como ahora, y realizarla elemento a elemento, recorriendo el array con un bucle.

Si las operaciones involucran dos arrays también se realizan elemento a elemento

In [6]:

#creamos dos arrays
arr1 = np.arange(0,11)
arr2 = np.arange(20,31)

In [7]:

#los sumamos
arr1 + arr2

Out[7]:

array([20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40])

In [8]:

#multiplicamos
arr1 * arr2

Out[8]:

array([  0,  21,  44,  69,  96, 125, 156, 189, 224, 261, 300])

Comparaciones¶

In [9]:

# >,<
arr1 > arr2

Out[9]:

array([False, False, False, False, False, False, False, False, False,
       False, False], dtype=bool)

In [10]:

# ==
arr1 == arr2 # ¡ojo! los arrays son de integers, no de floats

Out[10]:

array([False, False, False, False, False, False, False, False, False,
       False, False], dtype=bool)

Nota: Por cierto, ¿qúe ocurrirá si los arrays con los que se quiere operar no tiene la misma forma? ¿apuestas? Quizá más adelante te interese buscar algo de información sobre __broadcasting__.

Ejercicios¶

Crear un array z1 3x4 lleno de ceros de tipo entero.
Crear un array z2 3x4 lleno de ceros salvo la primera fila que serán todo unos.
Crear un array z3 3x4 lleno de ceros salvo la última fila que será el rango entre 5 y 8.
Crea un vector de 10 elementos, siendo los impares unos y los pares doses.
Crea un «tablero de ajedrez», con unos en las casillas negras y ceros en las blancas.

In [11]:

a = np.zeros((3, 4))
a

Out[11]:

array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

In [12]:

a[0, :] = 1
a

Out[12]:

array([[ 1.,  1.,  1.,  1.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

In [13]:

b = np.zeros((3, 4))
b[-1] = np.arange(5, 9)
b

Out[13]:

array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 5.,  6.,  7.,  8.]])

In [14]:

v = np.ones(10)
v[::2] = 2
v

Out[14]:

array([ 2.,  1.,  2.,  1.,  2.,  1.,  2.,  1.,  2.,  1.])

In [15]:

tablero = np.zeros((8, 8))
tablero[1::2, ::2] = 1
tablero[::2, 1::2] = 1
tablero

Out[15]:

array([[ 0.,  1.,  0.,  1.,  0.,  1.,  0.,  1.],
       [ 1.,  0.,  1.,  0.,  1.,  0.,  1.,  0.],
       [ 0.,  1.,  0.,  1.,  0.,  1.,  0.,  1.],
       [ 1.,  0.,  1.,  0.,  1.,  0.,  1.,  0.],
       [ 0.,  1.,  0.,  1.,  0.,  1.,  0.,  1.],
       [ 1.,  0.,  1.,  0.,  1.,  0.,  1.,  0.],
       [ 0.,  1.,  0.,  1.,  0.,  1.,  0.,  1.],
       [ 1.,  0.,  1.,  0.,  1.,  0.,  1.,  0.]])

Extra:

In [16]:

%matplotlib inline
import matplotlib.pyplot as plt

plt.matshow(tablero, cmap=plt.cm.gray_r)

Out[16]:

<matplotlib.image.AxesImage at 0x7fd334544358>

___Hemos aprendido:___

Las características de los arrays de NumPy:
- Homogeneidad de tipo.
- Tamaño fijo en el momento de la creación.
A usar las principales funciones para crear arrays.
A operar con arrays.

En definitiva:

Ingenieros y científicos $\heartsuit$ arrays.
Ingenieros y científicos necesitan NumPy.

El próximo día aprenderemos cómo acceder a elementos de un array slicing, cómo realizar algunas operaciones de álgebra lineal (determinantes, trazas, autovalores...) y practicaremos todo lo aprendido.

__¡Quiero más!__Algunos enlaces:

Algunos enlaces en Pybonacci:

Algunos enlaces en otros sitios:

100 numpy exercises. Es posible que de momento sólo sepas hacer los primeros, pero tranquilo, pronto sabrás más...
NumPy and IPython SciPy 2013 Tutorial.
NumPy and SciPy documentation.

Clase en vídeo, parte del Curso de Python para científicos e ingenieros grabado en la Escuela Politécnica Superior de la Universidad de Alicante.

In [1]:

from IPython.display import YouTubeVideo

YouTubeVideo("UltVlYCacD0", width=560, height=315, list="PLGBbVX_WvN7bMwYe7wWV5TZt1a58jTggB")

Out[1]:

Si te ha gustado esta clase:

Clase 2a: Introducción a NumPy¶

¿Qué es un array?¶

¿Qué es NumPy?¶

Nuestro primer array¶

Funciones y constantes de NumPy¶

Características de los arrays de NumPy¶

1) Homogeneidad de tipo:¶

2) Tamaño fijo en el momento de la creación:¶

3) Eficiencia¶

Funciones para crear arrays¶

array de ceros¶

array "vacío"¶

array de unos¶

array identidad¶

Rangos¶

np.arange¶

np.linspace¶

reshape¶

Importación¶

Ejemplo: ¿por qué no hacer from numpy import * ?¶

Operaciones¶

Operaciones elemento a elemento¶

Comparaciones¶

Ejercicios¶

¡Síguenos en Twitter!

Follow @AeroPython ¶

Curso AeroPython por Juan Luis Cano Rodriguez y Alejandro Sáez Mollejo se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional.¶

Clase 2a: Introducción a NumPy¶

¿Qué es un array?¶

¿Qué es NumPy?¶

Nuestro primer array¶

Funciones y constantes de NumPy¶

Características de los arrays de NumPy¶

1) Homogeneidad de tipo:¶

2) Tamaño fijo en el momento de la creación:¶

3) Eficiencia¶

Funciones para crear arrays¶

array de ceros¶

array "vacío"¶

array de unos¶

array identidad¶

Rangos¶

np.arange¶

np.linspace¶

reshape¶

Importación¶

Ejemplo: ¿por qué no hacer from numpy import * ?¶

Operaciones¶

Operaciones elemento a elemento¶

Comparaciones¶

Ejercicios¶

¡Síguenos en Twitter!

Follow @AeroPython !function(d,s,id){var js,fjs=d.getElementsByTagName(s)[0],p=/^http:/.test(d.location)?'http':'https';if(!d.getElementById(id)){js=d.createElement(s);js.id=id;js.src=p+'://platform.twitter.com/widgets.js';fjs.parentNode.insertBefore(js,fjs);}}(document, 'script', 'twitter-wjs');¶

Curso AeroPython por Juan Luis Cano Rodriguez y Alejandro Sáez Mollejo se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional.¶

Follow @AeroPython ¶