next up previous
Siguiente: Pruebas Subir: Experimento Anterior: Método

Medidas de desempeño

Con el propósito de conocer cuál método, y en qué condiciones, realizaba un mejor agrupamiento, utilizamos la medida $ F$ [Rijsbergen1979], muy empleada en RI. Para un agrupamiento $ \{G_1,\ldots,G_m\}$ y clases $ \{C_1,\ldots,C_n\}$ se define, en primer lugar, $ F_{ij}$, $ 1\le i\le m$, $ 1\le j\le n$, como:

$\displaystyle F_{ij}=\frac{2\cdot P_{ij}\cdot E_{ij}}{P_{ij}+E_{ij}},$ (2)

donde $ P_{ij}$ (pureza), y $ E_{ij}$ (pureza inversa) se definen como

$\displaystyle P_{ij}=\frac{\text{No. de textos del grupo }i\text{ en la clase }j}
{\text{No. de textos en la clase }j},
$

y

$\displaystyle E_{ij}=\frac{\text{No. de textos del grupo }i\text{ en la clase }j}
{\text{No. de textos en el grupo }i}.
$

Con los valores $ F_{ij}$ se calcula el desempeño global del agrupamiento:

$\displaystyle F=\sum_{1\le i\le m}\frac{\vert G_i\vert}{\vert D\vert}\max_{1\le j\le n}F_{ij},$ (3)



David Pinto 2006-05-25