In [1]:

#Définition des différents paramètres:

# Liste des termes à compter
terms = ['beau','monde','salut']

#Liste donnant l'ordre des mots à utiliser comme critère de tri pour les ordonner en cas d'égalité.
#Peut-être plus courte que la liste terms ci-dessus, mais ne doit pas contenir d'autres mots.
order = ['salut','monde']

In [ ]:

import os
import pandas as pd
print("Placer les documents ici:")
os.getcwd()

In [3]:

f = open('test.txt','r')
text = f.read()
files = text.split()
#print(words)
docs = []
for f in files:
    doc = open(f,'r').read()
    docs.append((f,doc))

In [4]:

from collections import Counter
#List des mots à surveiller

#création du tableau
temp = {'Documents':files}
for term in terms:
    temp[term]=[0]*len(files)
table = pd.DataFrame(temp)
table = table.set_index('Documents')

In [5]:

for doc in docs:
    for word in doc[1].split():
        if word in terms:
            table[word][doc[0]] +=1

In [6]:

#Afficher le résultat avec le tri demandé
table.sort_index(ascending=False,by=order)

Out[6]:

	beau	monde	salut
Documents
Hello.txt	1	1	0
World.txt	0	0	0