domingo, agosto 05, 2007

Sobre el nuevo Monitor de fiabilidad de Windows Vista

Continuando con los artículos referidos a cómo funcionan los nuevos componentes de Windows Vista, he elaborado un pequeño conjunto de preguntas y respuestas sobre el nuevo Monitor de confiabilidad (Reliability Monitor) de Windows Vista, componente que entre otras cosas se encarga de otorgar una puntuación numérica al equipo según el grado de estabilidad del sistema durante un periodo de tiempo.

¿Qué se tiene en cuenta a la hora de calcular la puntuación?

El índice de un día depende del número de "interrupciones" que ha sufrido el usuario en una sesión de trabajo en Windows. Por "interrupción" se refiere a cualquier suceso que esté en alguna de estas categorías: fallos de aplicaciones o "cuelgues" (eventos 1000 y 1002, respectivamente), fallos de hardware y fallos del sistema operativo (errores graves, pantallas azules o "bugchecks"). El número de "interrupciones", una vez filtrado mediante un algoritmo pendiente de patente, se hace corresponder con una puntuación de 1 a 10, ya sea directamente o mediante interpolación lineal.

¿Cuántos días se tienen en cuenta para el cálculo de la estabilidad?

Depende de la versión de Windows. Si es de la rama cliente, 28; si es de la rama servidora, 120.

¿Es cierto que la estabilidad depende de los días anteriores?

Sí, además la suma que se realiza es una suma ponderada, en la que la puntuación de los días más recientes tiene más peso que la puntuación de los días más alejados en el tiempo. Con esto se consigue observar un efecto de recuperación paulatina en la situación de un equipo que haya sufrido problemas de estabilidad durante un periodo determinado, pero que en estos momentos todo funcione correctamente pues se logró dar con el causante.

¿Se cuentan todos y cada uno de los eventos de fallo?

Se cuentan siempre y cuando no puedan ser emparejados, esto es, si son muy cercanos en el tiempo, o bien si tienen relación directa (por ejemplo, un evento que haga referencia a una pantalla azul y otro que explique que el equipo se reinició por un error grave). En estos casos sólo se tiene en cuenta uno de ellos.

¿Quién se encarga de recopilar toda esa información?

Un módulo denominado Racagent.exe y que se ejecuta programadamente en cada inicio del sistema operativo. Se ejecuta con bajas prioridades de CPU, E/S y memoria para tener un impacto mínimo en el arranque del sistema operativo. Su DLL asociada, RacEng.dll, se encarga de calcular un índice de estabilidad para la sesión en curso (si no ha sido calculado ya) y almacenarlo en el correspondiente repositorio.

¿Dónde se almacena toda la información sobre instalación de aplicaciones, desinstalación, errores de software, etc.?

Se almacenan en el directorio C:\ProgramData\Microsoft\RAC\PublishedData\, en los siguientes ficheros:
  • PublishedRacMonIndex.dat: Almacena el índice (puntuación).
  • PublishedRacMonSWITable.dat: Almacena las instalaciones de programas.
  • PublishedRacMonAFLTable.dat: Almacena fallos de aplicaciones.
  • PublishedRacMonHFLTable.dat: Almacena fallos de hardware.
  • PublishedRacMonOSFTable.dat: Almacena fallos del sistema operativo.
  • PublishedRacMonCLKTable.dat: Almacena fallos del sistema operativo.

El Monitor de fiabilidad es un componente muy útil para los administradores de sistemas que quieran observar, de un vistazo, el estado de la estabilidad del equipo, en qué momento surgieron los problemas y cuáles podrían ser sus causantes.

No hay comentarios: