Inizio i lavori sul dataset Pandora fornitomi dal prof. Longo, basandomi sulle sue direttive.
Maggiori dettagli sul dataset saranno disponibili al più presto.
Il clustering verrà affrontato con Bregman Co-clustering, per affrontare il problema dei missing values.
Il metodo di aggiornamento dei mediodi/centroidi sarà il Local Search, che evita minimi locali e ci permette, partendo da un numero iniziale sovrastimato di cluter, di “scovare” il numero effettivo di cluster (o nei casi difficili una buona approssimazione di esso), lavorando per raffinamenti successivi.
In questo esperimento l’inizializzazione del co-clustering sarà lasciata casuale.
In successive prove proveremo ad utilizzare l’inizializzazione spettrale proposta in
per migliorare la qualità del risultato finale.
Infine, essendo presenti valori negativi nella matrice, l’istanza di Co-clustering basata su di divergenza KL e Mutua Informazione non potrà essere utilizzata