Detalles de implementaciï¿½n

Como ya se ha dicho antes, utilizamos un kernel de Linux versiï¿½n 2.2.12 y un servidor de NFS de espacio de usuario 2.2beta37. No utilizamos el servidor de espacio de kernel porque todavï¿½a estaba en estado experimental y tenï¿½a todavï¿½a algunos errores.

Cambios en el cliente

En el kernel del cliente tuvimos que modificar la llamada al sistema sendfile para que llamase a la operaciï¿½n de copy que aï¿½adimos a la estructura de operaciones sobre ficheros. En el caso de un fichero de NFS, este puntero a funciï¿½n apunta a una funciï¿½n llamada nfs_file_copy. Esta funciï¿½n, prepara los parï¿½metros, recoge el puntero de fichero y llama a nfs_file_copy que se ocupa de construir y llamar a la RPC copy, manejando los posibles errores.

Utilizamos la operaciï¿½n de sendfile porque tenï¿½a exactamente el interfaz que necesitï¿½bamos. Sin embargo, sendfile fue creada, como ya hemos explicado antes, con servidores web y sockets en mente. Puede suceder, pues, que haya algï¿½n detalle de sendfile que no hayamos visto que se encuentre especï¿½ficamente preparado para funcionar bien en el contexto en el que fue diseï¿½ada aunque por ahora, no nos hemos encontrado con ningï¿½n problema.

Una parte del kernel que fue especialmente ardua de modificar fueron los encapsulados en XDR de los argumentos. El kernel, con el fin de aumentar la eficiencia de estas traducciones, no utiliza un compilador y hay que hacer estas traducciones a mano. Esta es una tarea difï¿½cil, tanto para depurar el cï¿½digo, como por lo fï¿½cil que es cometer un error.

Otro cambio interesante que realizamos en el kernel cliente es el aï¿½adir soporte para una entrada en el sistema de ficheros de /proc. Esta entrada nos permite cambiar y leer variables en tiempo de ejecuciï¿½n del kernel, pudiendo hacer cosas como habilitar o deshabilitar la llamada a copy. Esta entrada en /proc nos resultï¿½ absolutamente fundamental a la hora tanto de depurar como de hacer medidas.

Cambios en el servidor

En el servidor sï¿½lo tuvimos que modificar nfsd, el demonio de espacio de usuario que hace de servidor de NFS.

Lo ï¿½nico que tuvimos que hacer es aï¿½adir la operaciï¿½n copy al programa RPC del servidor. Como el servidor utilizaba para generar las rutinas de traducciï¿½n de XDR y los stubs en C el compilador rpcgen, esto fue tarea fï¿½cil. El procedimiento que seguimos, fue modificar la descripciï¿½n del programa en XDR, compilarlo con rpcgen y escribir la implementaciï¿½n de la rutina copy. Esta rutina, lo ï¿½nico que tenï¿½a que hacer era llamar a read y write localmente, haciendo uso del sistema de ficheros.

El problema de los bloqueos

La aproximaciï¿½n que hemos descrito hasta ahora, tenï¿½a ciertos fallos, que tuvimos que arreglar para que el sistema realmente funcionase. El fallo principal y mï¿½s difï¿½cil de encontrar fueron los interbloqueos que generaba la existencia de un ï¿½nico hilo en el servidor de NFS. Como ya se ha comentado, debido a la existencia de este ï¿½nico hilo, si el write era una peticiï¿½n hecha mediante una RPC al mismo servidor de NFS que estaba atendiendo la de copy, se generaba un bloqueo del hilo de ejecuciï¿½n consigo mismo. Este fallo fue bastante difï¿½cil de encontrar porque era un error de diseï¿½o y apareciï¿½ en la fase de depuraciï¿½n.

La soluciï¿½n de este problema, que tampoco es tan complicada una vez se ha conseguido localizar, pasa por el dibujo de todos los diagramas de espera que generan las posibles topologï¿½as durante la ejecuciï¿½n de una llamada a copy, como se puede ver en la figura 3.

**Figura 3:** Diagramas de espera para uno dos y tres ordenadores.
$\begin{figure} \begin{center} \epsfig {file=WFG.eps,width=8cm} \end{center} \end{figure}$

Tras ver la figura queda claro que sï¿½lo hay dos casos que nos lleven a bloqueo. Ocurre un bloqueo siempre que el origen y el destino estï¿½n en la misma mï¿½quina. Aunque uno de estos casos (aquel en el que la misma mï¿½quina que exporta los ficheros por NFS es la que los monta y es tambiï¿½n la que origina el copy) pueda parecer extraï¿½o, fue el primero que probamos al hacer el desarrollo en una sola mï¿½quina. El segundo (el caso con dos ordenadores y los ficheros origen y destino en el que no es originario del copy) fue el que hizo que no pudiï¿½semos llamar a sendfile en el servidor.

Para resolver ambos problemas hicimos principalmente dos cosas. La primera de ellas fue llamar a la operaciï¿½n de copy solamente en el caso en que ambos ficheros son remotos. En caso contrario, se harï¿½a el tradicional read/write, como si se hubiese llamado a sendfile sin modificar.

Lo segundo que hicimos fue llamar a write localmente en lugar de utilizar directamente una RPC. De esta forma, si un ordenador no reexporta un fichero que se ha exportado previamente a sï¿½ mismo (un caso completamente anï¿½malo), no puede suceder un bloqueo.

Medidas

Para tomar las medidas utilizamos una red a 10Mb/s interconectando ordenadores con procesadores AMD K6/2 a 300MHz.

Para tener en cuenta la importancia de la cachï¿½, se hicieron las medidas en unos casos con el fichero en la cachï¿½ (cachï¿½ ``caliente'') y sin el fichero en la cachï¿½ (cachï¿½ ``frï¿½a''). Tambiï¿½n se hicieron medidas para diferentes tamaï¿½os de fichero. Los resultados de las medidas se pueden ver en las figuras 4 a 7

Para el caso de dos ordenadores, es obvio que ganamos mï¿½s de un orden de magnitud en eficiencia al usar la operaciï¿½n de copia frente a read/write independientemente del estado de la cachï¿½. En el caso de tres ordenadores, tambiï¿½n obtenemos beneficios si la cachï¿½ estï¿½ ``frï¿½a''. Sin embargo, en el caso de cachï¿½ caliente, contrariamente a la intuiciï¿½n es mï¿½s lento usar copy que read/write. Esto es debido a la combinaciï¿½n de cachï¿½ y readahead. A pesar de esto y del alto grado de uso de la cachï¿½ (tiene un porcentaje de uso del $90\%$ aproximadamente² habilitamos el caso de tres ordenadores, porque en media se ganaba en velocidad (aunque fuese poco) y ademï¿½s se reduce el uso de recursos, memoria, red etc.

**Figura:** Copia entre dos mï¿½quinas usando R/W y Copy--con cache caliente y fria. (Ficheros pequeï¿½os)
$\begin{figure} \begin{center} \epsfig {file=plot1.eps,width=10cm} \end{center}\end{figure}$

**Figura:** Copia entre dos mï¿½quinas usando R/W y Copy--con cache caliente y fria. (Ficheros grandes)
$\begin{figure} \begin{center} \epsfig {file=plot2.eps,width=10cm} \end{center}\end{figure}$

**Figura:** Copia entre tres mï¿½quinas con R/W y Copy--cache caliente y frï¿½a. (Ficheros pequeï¿½os)
$\begin{figure} \begin{center} \epsfig {file=plot3.eps,width=10cm} \end{center}\end{figure}$

**Figura:** Copia entre tres mï¿½quinas con R/W y Copy--cache caliente y frï¿½a. (Ficheros grandes)
$\begin{figure} \begin{center} \epsfig {file=plot4.eps,width=10cm} \end{center}\end{figure}$

Detalles de implementaciï¿½n

Cambios en el cliente

Cambios en el servidor

El problema de los bloqueos

Medidas

Notas al pie