21 November 2007
Wieviel Load ist noch okay?
Der Load Wert eines Unix Systemes wird oft als Maßeinheit für die Auslastung eines Systems benutzt. Meist wird allerdings von einem Durschnittswert der sogenannten Load Average gesprochen. Dieser Zahlenwert gibt die mittlere Länge der Run-Queue an. Der Wert gibt also an, wieviel Prozessoren das System im Schnitt auslasten könnten. Hat man eine Load Average von 1 wäre ein 1 Prozessorsystem in etwa ausgelastet. Eine Maschine mit 64 CPUs wäre also erst mit einer Load Average von 64 ausgelastet. Es gilt also, je niedriger der Wert desto unausgelasteter ist ein System. Schaut man in einem Linux System sich die Load AVG an, bekommt man meist 3 Werte geliefert, die jeweils die Durschnittswerte der letzten Minute, der letzen 5 Minuten und der letzen 15 Minuten angeben. Das Standart Tool um mal schnell einen Blick auf die Auslastung eines Systems zu Schauen dürfte wohl der Befehl top sein. Auf einem von mir betreuten Server sieht das zur Prime Time in etwa so aus:
Ganz oben rechts finden wir die Load Average. Wir sehen hier das die Last wohl in den letzten 5 Minuten wohl leicht gefallen ist. Zu Spitzenzeiten hab ich in der Regel eine Load von ca. 0,9 was einen Prozessor also zu ca. 90% auslastet. Die Kiste hat also nicht allzuviel Reserven mehr, ist aber noch gut im Saft. Aber es gibt hier noch weitere Werte zu sehen. So gibt in etwas “id” die ungenutzte Zeit der CPU an. Die anderen Zahlen sagen unteranderem aus mit was die CPU ihre Zeit verbringt: “us” (User Time) ist z.b. die Zeit die im Programm verbraucht wird, “sys” (System Time) ist die Zeit die vom Kernel im Auftrag des Programms verbraucht wird, “ni” (Nice Time) ist die Zeit die von herunterpriorisierten sinnvoll genutzt wird. “wa” (Wait Time) ist die Wartezeit auf I/O -Wait, also die Zeit, die gebraucht wird, bis die Daten z.b. von der Festplatte eingelesen wurden. Hat ein Server eine hohe Load Zahl, aber trotzdem eine niedrige CPU-Auslastung, kann man davon ausgehen, dass irgendwo aderst im System was faul ist. So konnte eine miserable Durchsatzrate bei der Festplatte z.B. der Auslöser hierfür sein.

