#Définition des différents paramètres:
# Liste des termes à compter
terms = ['beau','monde','salut']
#Liste donnant l'ordre des mots à utiliser comme critère de tri pour les ordonner en cas d'égalité.
#Peut-être plus courte que la liste terms ci-dessus, mais ne doit pas contenir d'autres mots.
order = ['salut','monde']
import os
import pandas as pd
print("Placer les documents ici:")
os.getcwd()
f = open('test.txt','r')
text = f.read()
files = text.split()
#print(words)
docs = []
for f in files:
doc = open(f,'r').read()
docs.append((f,doc))
from collections import Counter
#List des mots à surveiller
#création du tableau
temp = {'Documents':files}
for term in terms:
temp[term]=[0]*len(files)
table = pd.DataFrame(temp)
table = table.set_index('Documents')
for doc in docs:
for word in doc[1].split():
if word in terms:
table[word][doc[0]] +=1
#Afficher le résultat avec le tri demandé
table.sort_index(ascending=False,by=order)
beau | monde | salut | |
---|---|---|---|
Documents | |||
Hello.txt | 1 | 1 | 0 |
World.txt | 0 | 0 | 0 |