Hallo Leute,
gleiches Verhalten gestern Abend auch bei mir: Programme laufen nicht mehr. Ich möchte hier meine Erfahrung mit Euch teilen.
Als mir der Stillstand auffiel, habe ich auf der
CCU nachgesehen und ebenfalls Logeinträge (Errors) zuhauf gefunden (womit ich Euch hier natürlich NICHT quälen werde
), welche ca. zeitlich mit dem Stillstand übereinstimmen - in einem ähnlichen Zeitraum hörten auch die Debug-Messages des Heizungsthermostat-Skripts auf. So konnte man gut beobachten, wie die
CCU Programme langsam zum Arbeiten aufhörten. Die Begriffe "circa" und "ähnlicher Zeitraum" beziehen sich ca. auf einen Bereich von einer viertel Stunde.
Interessant war:
1) Als die Errors lt. Log begonnen haben (ja, möglicherweise sind die in den Logs dargestellten Errors nicht der Grund sondern ein Symptom) - liefen die Programme eine Zeit lang sehrwohl noch mit. Es gab also eine Art "Übergangszeit" von einer ca. viertel Stunde.
2) Die Load war recht hoch (ca. 3-4 Stunden nachdem alles begonnen hat)
Code: Alles auswählen
/etc # uptime
23:29:26 up 2 days, 22:44, load average: 7.38, 6.89, 5.28
3) Entscheidender Hinweis kam von Erik in
diesem Post:
erik hat geschrieben:
Blick in die Prozessliste zeigte mir dann:
(Ausschnitt)
Code: Alles auswählen
1088 root 12816 S ReGaHss -l 2
1089 root 12816 S ReGaHss -l 2
1090 root 12816 S ReGaHss -l 2
1093 root 12816 S ReGaHss -l 2
1247 root 304 S /usr/sbin/inetd
23847 root 10552 R ReGaHss -l 2
29508 root 276 S telnetd
Dabei fiel mir auf, das fast alle ReGaHss Jobs im 1000er Bereich waren, nur einer war mit 23847 verdammt hoch.
Als ich diesen mit kill 23847 beendet hatte, lief wieder alles perfekt.
Gleiches Symptom bei mir. Beenden dieses einzelnen Prozesses half und es ging danach wieder!
4) Okay, es ging nicht sofort - es dauerte noch ca. 10 Minuten. In der Zeit hat die
CCU alle(!) Programme abgearbeitet, welche in den rund 4 Stunden davor nicht gelaufen sind (war zum Leidwesen meiner Frau ein ziemliches Lichtspektakel in der Wohnung
).
5) Nach ca. einer viertel Std. hat sich auch die Load wieder etwas beruhigt (load average: 1.53, 2.93, 4.76), heute morgen war die Load überhaupt wieder ganz normal (load average: 0.98, 1.06, 0.85)
Werde es weiter beobachten.
LG
Michael