Releases: GiacomoManzoli/YASS
Releases · GiacomoManzoli/YASS
v2.2.0
v2.1.1
Corretto errore nel calcolo di d1
v2.1.0
Aggiunto lo split del lexicon
v2.0.7
Cambiata ulteriormente delete di ClusterManager
v2.0.6
Diminuito consumo memoria da parte di ClusterManager
v2.0.5
Risolto import problematico
v2.0.3
Corretto possibile oveflow degli interi
untagged-f18a5900e3fdf61b0bfd
Rimosso try-catch diagnostico
v2.0.1
Aggiunta stampa numero iterazioni
Algoritmo ottimizzato
Ad ogni iterazione dell'algoritmo di clustering, viene effettuato il merge di tutte le coppie di cluster che sono a distanza minima. Se uno stesso cluster compare in più coppie a distanza minima, questo viene considerato solo una volta.
Così facendo servono molte meno iterazioni per arrivare ad ottenere un cluster unico e di conseguenza vengono fatte meno ricerche, che sono le operazioni computazionalmente più pesanti.
Sul dataset da 10k di elementi il tempo di esecuzione è passato da 11 minuti a 5.