Herramientas de Monitorización de Servidores Linux
Monitorización de ancho de banda
Esto es muy importante, ya que al monitorear cuanto ancho de banda consume un servidor en tiempo real podemos determinar cuales son sus horas pico y así optimizarlo. Para monitorear esto recomiendo el programa iptraf. Con este programa podrán monitorear todo lo que esta sucediendo en nuestra interface de red. Les adjunto algunas imágenes:
Otro programa para monitorizar el trafico de red es iftop
Sirve para ver el tráfico de red que pasa por una interfaz de una manera mucho más visual y divertida que un simple netstat.
Simplemente escribe, usando la interfaz de red que prefieras en vez de ppp0, el siguiente comando:
iftop -i ppp0
Y te muestra una gráfica en modo real, en modo texto, en un estilo relativamente similar al top, con un montón de datos como la velocidad de subida y bajada, la acumulación de datos transferidos, etc.
Presionando la tecla "t" se visualiza el trafico de red solo de entrada , de salida o de entrada-salida.
Monitorización de consumo de CPU y Memoria
Otra de las tareas de un sysadmin es monitorear el consumo de CPU y Memoria (RAM y SWAP), linux viene con el comando “top”. A mi en lo personal no me gusta, así que uso el programa htop. Este programa es muy completo ya que nos detalla el consumo de CPU y Memoria por proceso, así como el consumo general de los recursos del sistema. Es mucho mas amigable a comparación del top normal. Incluso conforme se va usando el procesador o los núcleos del procesador el programa lo indica de una manera “gráfica” tal como lo muestra la siguiente imagen que tome de un servidor en producción:
Monitorización de consumo de disco duro
Cada cierto tiempo es necesario que entremos a revisar cuando espacio en disco hay libre en los servidores que manejamos. Para saber el espacio en disco duro se ejecuta el comando “df” en linux. A mi en lo personal no me gusta, prefiero uno mas “amigable” así que utilizo uno llamado discus. Este programa es que te indica cuanto espacio esta usado y cuando espacio hay libre, así como los porcentajes de los mismos. Aquí les adjunto una foto con la comparación del “df” con el “discus”.
Monitorización de I/O
Para que quede claro que es el I/O.
Para monitorear el I/O yo utilizo la herramienta “iotop” (se necesita python 2.5 y un kernel 2.6.20 para que funcione) es una interfaz simple que indica que proceso esta escribiendo o leyendo en el disco duro, tal como lo muestra la siguiente imagen:
Monitorización de peticiones de DNS
Si administras un servidor de DNS, en alguna ocasión vas a querer saber cuantas peticiones tu servidor de DNS tu servidor recibe. Para monitorear esto utilizo el programa dnstop con este se puede monitorear cuantas peticiones esta teniendo tu servidor ya sea por clase de dominio .net .org, direcciones ip, por dominio o por sub dominios.
Para ejecutarlo solo ejecutas el comando:
Adjunto imagen del programa:
Monitorización de trafico WEB
Si coleccionas dominios y tienes miles de visitas únicas diarias en algún momento te puede haber surgido la necesidad de monitorizar ese tráfico para decidir si tu servidor es suficiente o por el contrario necesitas contratar uno más potente…
Suponiendo que tienes almenos un VPS (mejor si es dedicado) puedes usar tu panel de control o mejor puedes conectar con tu shell (consola de comandos) vía SSH (usando un programa como Putty), entonces podemos hablar de varios niveles para comprobar la carga de tu servidor desde el más básico hasta algo un poco más sofisticado.
Con este programa podemos monitorear que archivos servimos con mayor frecuencia, cuantos bytes/kylobytes/megabytes servimos, cuantas peticiones por segundo, peticiones totales y un promedio general de todo lo que sirve el apache.
Adjunto una imagen del apachetop corriendo en un servidor en producción:
Ya que son bienvenidas las sugerencias, ¿Nunca intentaste con ntop? Desglosando el tráfico de un servidor es fenomenal… El hecho de que use gráficos además ayuda bastante a la hora de darse una idea generalizada del tráfico de la red.
La herramienta apachetop nos da información en tiempo real muy similar a top, para poder instalarla es necesario hacer los siguiente:
También esta herramienta nos ayuda a generar estadísticas de acceso.
Instalación en Debian/Ubuntu y derivados:
# apt-get install apachetop
Instalación en Centos/Fedora/RHEL, para este tipo de distribuciones es necesario tener habilitado repositorio de DAG.
# yum install apachetop
Instalación via ssh
Las opciones de configuracion son mas extensibles, solo hay que buscar la ayuda de Apachetop.
La forma más sencilla de ejecutar nuestro monitor de mensajes es la siguiente:
# apachetop -f [fichero de mensajes access.log]
si hemos compilado el programa con la opción with-logfile, el parámetro f no es necesario. La ejecuccion del comando convertirá nuestra consola en algo similar a esto:
# apachetop -f /usr/local/apache/logs/access_log
Como podemos observar, la similitud con el comando top es más que evidente. Las cinco primeras líneas presentan información interesante relativa a los procesos en curso.
last hit: 17:33:26 atop runtime: 0 days, 00:03:34 17:33:38
All: 4 reqs ( 0.0/sec) 3598.0B ( 24.0B/sec) 899.5B/req
2xx: 2 (50.0%) 3xx: 2 (50.0%) 4xx: 0 ( 0.0%) 5xx: 0 ( 0.0%)
R ( 30s): 2 reqs ( 0.1/sec) 1799.0B ( 60.0B/sec) 899.5B/req
2xx: 1 (50.0%) 3xx: 1 (50.0%) 4xx: 0 ( 0.0%) 5xx: 0 ( 0.0%)
La primera línea contienen la hora del último acceso, el tiempo de ejecución del comando y la hora actual.
last hit: 17:31:08 atop runtime: 0 days, 00:02:29 17:32:33
Las cuatro líneas siguientes presentan la información por pares:
En la segunda y tercera linea se contemplan los datos almacenados desde la ejecución del comando y en la curarta y quita se presenta la información actual en tiempo real, permaneciendo allí los datos durante un tiempo por defecto que se puede parametrizar.
Atendiendo al primer par, la segunda línea, de izquierda a derecha, contiene el total de solicitudes que el programa ha procesado desde su ejecución, el número de peticiones por segundo, el total de datos transferidos, el volúmen de transferencia de esos datos por segundo y, por último, una media de cantidad de datos por solicitud.
All: 4 reqs ( 0.0/sec) 3598.0B ( 24.0B/sec) 899.5B/req
La tercera línea presenta la información de respuesta del servidor por código y se divide en la cantidad de respuestas y, entre paréntesis, su porcentaje con respecto al total.
2xx: 2 (50.0%) 3xx: 2 (50.0%) 4xx: 0 ( 0.0%) 5xx: 0 ( 0.0%)
La cuarta y quienta línea muestran información idéntica al primer par, pero sólo se visualizará la media de los datos que se han leído desde el parámetro especificado durante la ejecución del programa. Por defecto, ese parámetro se establece en un valor treinta segundos. Mediante los parámetros H (hits) y T (time) podremos cambiar ese valor a nuestro antojo, lo cual reflejará distintos estados en el último par de líneas descrito.
Algunas capturas de lo que puede hacer ntop para simplificarte la vida:
Otro que uso bastante (y ya con la combinación de estos dos no necesito nada mas) es cacti. También con interface web pero con sensores para monitorear de todo un poco, desde hardware (uso de los discos, estado de los sensores de voltaje o temperatura, etc..) hasta tráfico en la red y carga del servidor.
Como tiene soporte para snmpwalk se puede desde una sola instancia de cacti monitorear varios servidores (o estaciones de trabajo) juntas.
De vez en cuando algún apache empieza a fallar regularmente y nos dedicamos a “probar” y a buscar entre docenas de valores con el objetivo de verlo cuando este fallando. Si recopilamos estos datos seguramente ahorraremos mucho tiempo y si encima los colocamos en una “bonita grafica” ya puede ser la ostia, trabajaremos la mitad y nuestros jefe/cliente percibira que hemos trabajado el doble cosa que no viene mal si queremos mejorar nuestra calidad de vida.
Asi que os propongo una cosa, si teneis un cacti en marcha os mirais esto:
y en el apache que quereis supervisar recoais el fichero de configuración añadiendo algo parecido a eso:
vi /etc/httpd/conf/httpd.conf
y a esperar que se dispare algo.
Monitorear el estado del servidor Apache.
Pegamos el siguiente código en /etc/apache2/httpd.conf o en /etc/apache2/apache2.conf, sustituyendo la ip de “Allow from” por la del equipo desde el cual se va a acceder al monitoreo (pueden ser varias ips o nombres de host separados por un espacio).
<Location /server-status>
SetHandler server-status
Order deny,allow
Deny from all
Allow from
ExtendedStatus On
Reiniciar apache
# /etc/init.d/apache2 restart
En el navegador disponemos de varias opciones de monitoreo: (básica) (refrescará los datos cada 5”) (muestra los datos sin HTML) (muestra los datos sin tablas. Apropiado para navegadores sin interfaz gráfica))
Monitoreo de puertos abiertos
Otra de las tareas de un sysadmin es estar al tanto de que puertos hay abiertos en un servidor. Como lo dice la regla, si un servicio no te sirve, quitalo del sistema. Para monitorear puertos uso la herramienta llamada nmap.
Con el comando:
Adjunto imagen del resultado que muestra nmap:
Había trabajado con herramientas parecidas para IIS pero me interesa más Apache así que aquí van algunas herramientas útiles para monitorizar el rendimiento de un servidor Apache (todas son software libre):
La siguiente sirve para optimizar una web más que para monitorizar un servidor y creo que en alguna otra ocasión ya la he comentado:
Monitoreo del servidor MySQL
mtop permite monitorizar la instancia de MySQL en tiempo real. Muestra el uptime de la instancia, el número de queries ejecutadas por segundo, la lista de slow queries, el número de threads activos, etc.
La instalación en entornos Debian/Ubuntu es muy sencilla:
sudo apt-get -y install mtop
Usa el siguiente comando para monitorizar las estadísticas del servidor MySQL cada 1 segundo de intervalo.
# apt-get -y install mytop
# yum -y install mytop
1. Instalación
Antes de la instalación necesitamos instalar un rpm no oficial del repositorio de DagWiers
Nos debería salir algo así
2. Ejecución
Ahora deberíamos poder ejecutar mtop de la siguiente forma
# /usr/local/bin/mtop –host=localhost –dbuser=root –password=password
y veremos algo así
3. Explicación de Valores
n Threads: running, cached
Los n Threads representa cuantos threads ha alojado mysqld. Un thread es alojado por cada conexión de usuario. Los threads adicionales son usados para replicación.
Queries/slow: Total queries / Total SLOW QUERIES
El primer número es el total de queries enviadas al servidor desde el último inicio o el último FLUSH STATUS. El segundo número es el número de queries que han tomado más tiempo que el la variable long_query_time
Cache Hit: Cache hit ratio
Esto es el porcentaje de tiempo que una lectura de key es accedida desde el key buffer cache.
Opened tables: tables opened
MySQL tiene cache para tablas abiertas. Si ‘opened tables’ es algo alta, puede que tu cache sea demasiado pequeña.
RRN: Handler_read_rnd_next
Número de peticiones para lectura de la siguiente fila en el archivo de datos (datafile). Esto será alto si estás haciendo escaneo de tablas. Generalmente esto sugiere que tus tablas no están siendo indexadas adecuadamente o que tus queries no están diseñadas para tomar ventaja de los índices.
TLW: Table_locks_waited
Número de veces que una table lock no pudo ser acceda inmediatamente y se tuvo que esperar. Si es alto, y tu tienes problemas de rendimiiento, debes optimizar primero tus queries y entonces partir tus tablas o usar replicación.
SFJ: Select_full_join
Número de joins sin keys (si esto no es 0, deberías comprobar adecuadamente los índices de tus tablas)
SMP: Sort_merge_passes
Número de “merge”
Number of merges passes the sort algoritm have had to do. Si este valor es alto deberías considerar incrementar el sort_buffer
QPS: Questions per second
El número total de comandos SQL manejados por el servidor MySQL desde su inicio o el último FLUSH STATUS.
Monitor the performance of your system is essential. If system resources become to low it can cause a lot of problems. System resources can be taken up by individual users, or by services your system may host such as email or web pages. The ability to know what is happening can help determine whether system upgrades are needed, or if some services need to be moved to another machine.
You can modify the output of top while it is running. If you hit an i, top will no longer display idle processes. Hit i again to see them again. Hitting Mwill sort by memory usage, S will sort by how long they processes have been running, and P will sort by CPU usage again.
In addition to viewing options, you can also modify processes from within the top command. You can use u to view processes owned by a specific user, k to kill processes, and r to renice them.
For more in-depth information about processes you can look in the /proc filesystem. In the /proc filesystem you will find a series of sub-directories with numeric names. These directories are associated with the processes ids of currently running processes. In each directory you will find a series of files containing information about the process.
If you want to know see the more performance details of your system you need to install a package called ‘sysstat’ .This package contains the the sar, mpstat and iostat commands for Linux
Installing sysstat package in debian
#apt-get install sysstat
We will see one by one command now
sar command
The sar command collects and reports system activity information. The statistics reported by sar concern I/O transfer rates, paging activity, process-related activities, interrupts, network activity, memory and swap space utilization, CPU utilization, kernel activities and TTY statistics, among others. Both UP and SMP machines are fully supported.
mpstat command
The mpstat command reports global and per-processor statistics
test:~# mpstat
Linux 2.4.27-1-686-smp (test) 16/11/05
09:05:11 CPU %user %nice %system %iowait %irq %soft %idle intr/s
09:05:11 all 0.01 0.00 0.03 0.00 0.00 0.00 99.96 106.03
For more details about each fields and other options check the man pages for mpstat.Click here for manpage
test:~# iostat
Linux 2.4.27-1-686-smp (test) 16/11/05
avg-cpu: %user %nice %sys %iowait %idle
0.01 0.00 0.03 0.00 99.96
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
0.36 0.08 5.08 370598 24543512
0.36 0.08 5.08 370572 24543512
0.00 0.00 0.00 8 0
For 2.4 kernels the devices is names using the device’s major and minor number. In this case the device listed is SCSI. To have iostat print this out for you, use the -x.
tice:~# iostat -x
Linux 2.4.27-1-686-smp (test) 16/11/05
avg-cpu: %user %nice %sys %iowait %idle
0.01 0.00 0.03 0.00 99.96
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
0.01 0.28 0.00 0.35 0.08 5.08 0.04 2.54 14.37 0.00 6.49 8.85 0.32
0.01 0.28 0.00 0.35 0.08 5.08 0.04 2.54 14.37 0.00 6.49 8.85 0.32
0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 8.00 0.00 20.00 20.00 0.00
iostat man page contains a detailed explanation of what each of these columns mean.Click here for manpage
A common use would be to list all processes currently running. To do this you would use the ps -ef command. (Screen output from this command is too large to include, the following is only a partial output.)
The first column shows who owns the process. The second column is the process ID. The Third column is the parent process ID. This is the process that generated, or started, the process. The forth column is the CPU usage (in percent). The fifth column is the start time, of date if the process has been running long enough. The sixth column is the tty associated with the process, if applicable. The seventh column is the cumulitive CPU usage (total amount of CPU time is has used while running). The eighth column is the command itself.
With this information you can see exacly what is running on your system and kill run-away processes, or those that are causing problems.
vmstat command
The vmstat command will provide a report showing statistics for system processes, memory, swap, I/O, and the CPU. These statistics are generated using data from the last time the command was run to the present. In the case of the command never being run, the data will be from the last reboot until the present.
For more details about each field and other options see vmstat man page.Click here for manpage
lsof command
The lsof command will print out a list of every file that is in use. Since Linux considers everythihng a file, this list can be very long. However, this command can be useful in diagnosing problems. An example of this is if you wish to unmount a filesystem, but you are being told that it is in use. You could use this command and grep for the name of the filesystem to see who is using it.Click here for lsof manpage
Or suppose you want to see all files in use by a particular process. To do this you would use lsof -p -processid
Es un comando que nos permite controlar prácticamente todos los valores del servidor de una sola vez, además de ser muy sencillo en su funcionamiento.
Con bmon podrás monitorear tu tarjeta de red o wi-fi. Podras ver tu velocidad de descarga y subida real cuando estés descargando/subiendo archivos, y consta de gráficas explicativas entendibles.
dnstop eth1
- El que incluye Apache: There are tools for Apache
web server allowing a real-time analysis of the web traffic: log files
can be used by specialised software to develop a comprehensive and
complete analysis of the traffic.
The output “server-status” can be displayed as a command line, simply by launching the “apachectl status” or “apachectl fullstatus” or online at http://servername/server-status.
For the server status to be accessible, the server must be compiled with mod_status module and its use should be allowed in the configuration file.
However, these methods give too much information to be able to make optimal use of it, especially on servers with a large traffic. - Si sólo necesitas saber como vas de memoria RAM: puedes usar el comando free.
Monitorear el estado del servidor Apache.
Pegamos el siguiente código en /etc/apache2/httpd.conf o en /etc/apache2/apache2.conf, sustituyendo la ip de “Allow from” por la del equipo desde el cual se va a acceder al monitoreo (pueden ser varias ips o nombres de host separados por un espacio).
<Location /server-status>
SetHandler server-status
Order deny,allow
Deny from all
Allow from
ExtendedStatus On
Reiniciar apache
# /etc/init.d/apache2 restart
En el navegador disponemos de varias opciones de monitoreo: (básica) (refrescará los datos cada 5”) (muestra los datos sin HTML) (muestra los datos sin tablas. Apropiado para navegadores sin interfaz gráfica))
Monitoreo de puertos abiertos
Otra de las tareas de un sysadmin es estar al tanto de que puertos hay abiertos en un servidor. Como lo dice la regla, si un servicio no te sirve, quitalo del sistema. Para monitorear puertos uso la herramienta llamada nmap.
Con el comando:
nmap -v un listado de puertos abiertos en el servidor. Si su servidor tiene varias direcciones IP es importante que hagan un escaneo de puertos a todos los IP.
Adjunto imagen del resultado que muestra nmap:
Monitorizar rendimiento en Apache
A través de una entrada en los foros de la empresa en la que trabajo encuentro una interesante pregunta sobre aplicaciones que permitan medir el rendimiento de un servidor web y de las aplicaciones que corren sobre él.Había trabajado con herramientas parecidas para IIS pero me interesa más Apache así que aquí van algunas herramientas útiles para monitorizar el rendimiento de un servidor Apache (todas son software libre):
La siguiente sirve para optimizar una web más que para monitorizar un servidor y creo que en alguna otra ocasión ya la he comentado:
Monitoreo del servidor MySQL
mtop permite monitorizar la instancia de MySQL en tiempo real. Muestra el uptime de la instancia, el número de queries ejecutadas por segundo, la lista de slow queries, el número de threads activos, etc.
La instalación en entornos Debian/Ubuntu es muy sencilla:
sudo apt-get -y install mtop
Usa el siguiente comando para monitorizar las estadísticas del servidor MySQL cada 1 segundo de intervalo.
mtop -se 1
Es un comando que nos permite controlar prácticamente todos los valores del servidor de una sola vez, además de ser muy sencillo en su funcionamiento.
Con bmon podrás monitorear tu tarjeta de red o wi-fi. Podras ver tu velocidad de descarga y subida real cuando estés descargando/subiendo archivos, y consta de gráficas explicativas entendibles.
