You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Isabella Inuso 38374dbed6 | 1 month ago | |
---|---|---|
.gitignore | 2 years ago | |
Graph.cpp | 1 month ago | |
Progetto.cpp | 1 month ago | |
README.md | 1 month ago | |
aux.cpp | 1 month ago | |
populateGraph.cpp | 2 years ago | |
reader.cpp | 1 month ago | |
stop_words.txt | 2 years ago |
README.md
Progetto di ASD di Isabella Inuso
Per testare questo progetto useremo i dati estratti da Wikipedia. Per scaricarli:
mkdir wikipedia_20k
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wikipedia_20k.zip
unzip wikipedia_20k.zip -d wikipedia_20k
In alternativa, per utilizzare un test set di dimensioni minori
mkdir wiki-small
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wiki-small.zip
unzip wiki-small.zip -d wiki-small
Usage
Il programma prende in input
k
: numero di parole associate, il default è 5c
: numero di linee in output, il default è 1s
: seed per la randomizzazione dell'output, il default è -1, che randomizza in base all'ora di sistemapath
: path della lista di file da analizzare
Ad esempio, per lanciare il programma su tutti i files contenuti nella cartella wikipedia_20k
g++ Progetto.cpp -o Progetto
./Progetto -k 5 -c 10 wikipedia_20k/*