You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
31 lines
843 B
Markdown
31 lines
843 B
Markdown
# Progetto di ASD di Isabella Inuso
|
|
|
|
Per testare questo progetto useremo i dati estratti da Wikipedia. Per scaricarli:
|
|
|
|
```bash
|
|
mkdir wikipedia_20k
|
|
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wikipedia_20k.zip
|
|
unzip wikipedia_20k.zip -d wikipedia_20k
|
|
```
|
|
|
|
In alternativa, per utilizzare un test set di dimensioni minori
|
|
|
|
```bash
|
|
mkdir wiki-small
|
|
wget http://didawiki.cli.di.unipi.it/lib/exe/fetch.php/matematica/asd/asd_21/wiki-small.zip
|
|
unzip wiki-small.zip -d wiki-small
|
|
```
|
|
|
|
## Usage
|
|
Il programma prende in input
|
|
* `k` : numero di parole associate
|
|
* `c` : numero di linee in output
|
|
* `path` : path della lista di file da analizzare
|
|
|
|
Ad esempio, per lanciare il programma su tutti i files contenuti nella cartella wikipedia_20k
|
|
|
|
```bash
|
|
g++ Progetto.cpp -o Progetto
|
|
./Progetto -k 5 -c 10 wikipedia_20k/*
|
|
```
|