Metodolog�a

El gran problema con el que nos encontramos al principio de este estudio es que no hab�a ning�n m�todo conocido que nos llevara a resultados certeros. Es verdad que algunos estudios anteriores han intentado indagar un poco, cada uno a su manera, en los desarrollos del software libre, pero ninguno abarcaba el tema de forma global, tal y como nosotros quer�amos.

Al no haber precedentes muy claros, decidimos tomar tantas fuentes como fuera posible para, a posteriori, entrar a valorar los diferentes resultados. La comparaci�n y correlaci�n entre los mismos nos dir�a qu� grado de credibilidad deb�a tener cada fuente. A la vista de los resultados, todas las fuentes, aunque tengan desviaciones m�s o menos pronunciadas, dan unos resultados que convergen, lo que nos lleva a pensar que los resultados son muy pr�ximos a la realidad.

El estudio se bas� en cuatro fuentes diferentes que a su vez siguen cuatro m�todos de extracci�n de datos diferentes:

  1. el cat�logo de aplicaciones de software libre SourceWell, al estilo Freshmeat, que hay en BerliOS,

  2. la base de datos de los desarrolladores de una conocida distribucion de GNU/Linux (Debian)

  3. una herramienta llamada CODD, que analiza el c�digo fuente autom�ticamente y extrae los autores del mismo,

  4. y un formulario en l�nea conocido con el nombre de Widi (que viene de "Who Is Doing It?", "�Qui�n lo est� haciendo?").

Todas estas fuentes ser�n presentadas y analizadas pormenorizadamente en el siguiente apartado. Antes, vamos a ver otros m�todos y fuentes que han sido utilizados en estudios anteriores.

En 1999 el UNC Open Source Research Team estudi� el repositorio de aplicaciones de software libre en el MetaLab. Este estudio se basa en el uso del Linux Software Map (LSM, mapa del software Linux), una especie de est�ndar para dar informaci�n sobre los paquetes que se depositan en un repositorio. Uno de los apartados que es de obligado cumplimiento en el LSM es indicar el nombre y direcci�n de correo-e del desarrollador principal. Los autores del estudio se dedicaron a analizar los archivos LSM de cada paquete, extrayendo el dominio de correo electr�nico de los autores y tratando estad�sticamente los resultados. En este estudio no hemos incluido ning�n m�todo que utilice el LSM, ya que es un m�todo poco arraigado. Su uso en el repositorio MetaLab se debe m�s bien a razones hist�ricas: hace una d�cada, cuando el ancho de banda era escaso, el LSM proporcionaba importante informaci�n acerca de la funcionalidad de los paquetes antes de descarg�rselos. El auge de las distribuciones de GNU/Linux y del CD-ROM han hecho que el LSM haya pasado a un segundo plano.

Una forma m�s completa de abordar el tema es mediante la aplicaci�n de la Trinity Participation Metric. Se trata de una m�trica que mide la participaci�n en proyectos de software libre que se basa en estudiar no s�lo el c�digo fuente, sino tambi�n mensajes a la lista de correo principal del proyecto y los parches enviados. A la hora de sumar las tres fuentes, cada una es multiplicada por un peso seg�n su importancia relativa. Esta m�trica implicar�a un gran esfuerzo si se quieren estudiar muchos proyectos, por lo que es m�s bien aplicable a proyectos espec�ficos. En el caso del documento original, estudian la participaci�n en The GIMP.

Desde hace pocos meses, la Fundaci�n del Software Libre ha comenzado un proyecto que representa de manera visual la procedencia de los desarrolladores de software libre. Los desarrolladores tienen que registrarse antes de rellenar un formulario con sus coordenadas. Los resultados se muestran con peque�os retardos en un mapa del mundo en varios tama�os.

Por �ltimo, y ya m�s bien desde el punto de vista sociol�gico, nos tenemos que hacer eco del Linux Study, un an�lisis sociot�cnico realizado sobre los desarrolladores del n�cleo Linux. Este estudio se basaba en un cuestionario que fue rellenado por cerca de 150 desarrolladores.