Un notebook jupyter est un environnement de developpement en ligne à base de cellules executables qui contient
des cellule en markdown (comme celle-ci) (texte mis en forme)
des cellules en python (ou R)
On lance un notebook jupyter avec la commande suivante
> jupyter notebook
# list comprehension
liste_a = [1,2,3,4,5,6,5,4,3,2,1, 12, 10]
liste_b = [3,5,7,9,7,3,1,3,5, 2,2]
# liste_c contient les elements communs a liste_a et liste_b
liste_c = [x for x in liste_a if x in liste_b]
# les elements uniques de liste_c
sorted(list(set(liste_c)))
df.head()
import pandas as pd
DATA_PATH = '../data/'
# load le dataset dans une dataframe pandas
# Preciser que les colonnes du fichiers sont séparées par un ; et non une ,
df = pd.read_csv(DATA_PATH + 'les-arbres.ctsv', sep = ';', error_bad_lines = False)
# Les 5 premiers lignes du dataset
df.describe()
# exemple de string interpolation
print("le dataset a {} echantillons et {} variables".format(
df.shape[0], df.shape[1]
))
# le nombre d'arbres par espece pour les 10 espece les plus fréquentes:
df.LIBELLEFRANCAIS.value_counts()
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot(df['CIRCONFERENCEENCM'][0:1000], df['HAUTEUR (m)'][0:1000], '.')