You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Isabella Inuso 38374dbed6 added docs 1 month ago
.gitignore Primo commit 2 years ago
Graph.cpp added docs 1 month ago
Progetto.cpp added docs 1 month ago
README.md Updated 'README.md' 1 month ago
aux.cpp added docs 1 month ago
populateGraph.cpp Primo commit 2 years ago
reader.cpp added docs 1 month ago
stop_words.txt Primo commit 2 years ago

README.md

Progetto di ASD di Isabella Inuso

Per testare questo progetto useremo i dati estratti da Wikipedia. Per scaricarli:

mkdir wikipedia_20k
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wikipedia_20k.zip
unzip wikipedia_20k.zip -d wikipedia_20k

In alternativa, per utilizzare un test set di dimensioni minori

mkdir wiki-small
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wiki-small.zip
unzip wiki-small.zip -d wiki-small

Usage

Il programma prende in input

  • k : numero di parole associate, il default è 5
  • c : numero di linee in output, il default è 1
  • s : seed per la randomizzazione dell'output, il default è -1, che randomizza in base all'ora di sistema
  • path : path della lista di file da analizzare

Ad esempio, per lanciare il programma su tutti i files contenuti nella cartella wikipedia_20k

g++ Progetto.cpp -o Progetto
./Progetto -k 5 -c 10 wikipedia_20k/*