June 22 2007
Co-clustering - Real World Dataset Test #2
Macchina usata:
PowerPC G4, 1.5GHz, 768MB RAM, Mac OS X
Software usato:
-
H. Cho, Y. Guan, and S. Sra, Co-cluster (v 1.1), 2004.
@misc{coclus-software,
author = {Hyuk Cho and Yuqiang Guan and Suvrit Sra},
Date-Added = {2007-04-29 15:15:55 +0200},
Date-Modified = {2007-06-25 17:10:33 +0200},
Howpublished = {Bregman co-clustering software},
Keywords = {co-clustering, relative entropy, euclidean distance, software},
Title = {Co-cluster (v 1.1)},
Url = {http://www.cs.utexas.edu/users/dml/Software/cocluster.html},
Year = {2004},
Bdsk-Url-1 = {http://www.cs.utexas.edu/users/dml/Software/cocluster.html}
}
Dataset Usato:
Mushrooms Database
Number of instances: 8124
Number of Attributes: 22
2480 missing values for attribute #12
Original Class Distribution: edible: 4208 (51.8%), poisonous: 3916 (48.2%)
Mushroom records drawn from The Audubon Society Field Guide to North
American Mushrooms (1981). G. H. Lincoff (Pres.), New York: Alfred A. Knopf
Donor: Jeff Schlimmer (Jeffrey.Schlimmer@a.gp.cs.cmu.edu)
Date: 27 April 1987
Algoritmo di co-clustering usato: Minimum Sum Squared Residue
Prova #1
Richiesti 2 cluster di riga e 1 di colonna. Totale: 2 co-cluster
Tempo impiegato: User = 2 second(s) 127370 ms, System = 0 second(s) 40949 ms, Time/Run = 2.12737 second(s)
Risultato: 3670 elementi nella classe “poisonous”, 4454 elementi nella classe “edible”.
Percentuale d’errore (elementi non classificati correttamente): ~3%
Prova #2
Richiesti 2 cluster di riga e 2 di colonna. Totale: 4 co-cluster
Tempo impiegato: User = 2 second(s) 158490 ms, System = 0 second(s) 40654 ms, Time/Run = 2.15849 second(s)
Risultato: 3915 elementi nella classe “poisonous”, 4209 elementi nella classe “edible”.
Percentuale d’errore: ~1.23 x 10^-4 (1 solo elemento è stato classificato erroneamente)
