You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
2 years ago | |
|---|---|---|
| .gitignore | 4 years ago | |
| Graph.cpp | 2 years ago | |
| Progetto.cpp | 2 years ago | |
| README.md | 2 years ago | |
| aux.cpp | 2 years ago | |
| populateGraph.cpp | 4 years ago | |
| reader.cpp | 2 years ago | |
| stop_words.txt | 4 years ago | |
README.md
Progetto di ASD di Isabella Inuso
Per testare questo progetto useremo i dati estratti da Wikipedia. Per scaricarli:
mkdir wikipedia_20k
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wikipedia_20k.zip
unzip wikipedia_20k.zip -d wikipedia_20k
In alternativa, per utilizzare un test set di dimensioni minori
mkdir wiki-small
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wiki-small.zip
unzip wiki-small.zip -d wiki-small
Usage
Il programma prende in input
k: numero di parole associate, il default è 5c: numero di linee in output, il default è 1s: seed per la randomizzazione dell'output, il default è -1, che randomizza in base all'ora di sistemapath: path della lista di file da analizzare
Ad esempio, per lanciare il programma su tutti i files contenuti nella cartella wikipedia_20k
g++ Progetto.cpp -o Progetto
./Progetto -k 5 -c 10 wikipedia_20k/*