You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Isabella Inuso ce62d471a8 Update 'README.md' 3 months ago
.gitignore Primo commit 1 year ago
Graph.cpp Primo commit 1 year ago
Progetto.cpp Primo commit 1 year ago
README.md Update 'README.md' 3 months ago
aux.cpp Primo commit 1 year ago
populateGraph.cpp Primo commit 1 year ago
reader.cpp Primo commit 1 year ago
stop_words.txt Primo commit 1 year ago

README.md

Progetto di ASD di Isabella Inuso

Per testare questo progetto useremo i dati estratti da Wikipedia. Per scaricarli:

mkdir wikipedia_20k
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wikipedia_20k.zip
unzip wikipedia_20k.zip -d wikipedia_20k

In alternativa, per utilizzare un test set di dimensioni minori

mkdir wiki-small
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wiki-small.zip
unzip wiki-small.zip -d wiki-small

Usage

Il programma prende in input

  • k : numero di parole associate
  • c : numero di linee in output
  • path : path della lista di file da analizzare

Ad esempio, per lanciare il programma su tutti i files contenuti nella cartella wikipedia_20k

g++ Progetto.cpp -o Progetto
./Progetto -k 5 -c 10 wikipedia_20k/*