[gelöst] FBF 7270 mit XX.04.76/80: Hohe CPU-Last (multid braucht 99%)

Ich warte nun nur noch auf die Aussage, dass die Last durch das Erstellen der Ausgabe Datei verursacht wird.
Na, damit würde sich AVM aber echt disqualifizieren :-Ö.

hier:
# uptime
08:17:41 up 1 day, 7:28, load average: 0.00, 0.00, 0.00

immer noch ohne Mini. Aber hier wird auch wenig telefoniert.
 
So, da ham' wir den Salat (natürlich wenn ich nicht zu Hause bin):

# uptime
00:15:32 up 1 day, 23:26, load average: 3.30, 3.16, 3.07

Zwischen 16 und 17 Uhr fing das mit der Load an.

Es gab ausgehende Anrufe:

Code:
25.09.09 15:28~AVM-HD-Sprache (privat)611 WohnzimmerInternet: +49xxxxxx 00:01
25.09.09 15:34	
25.09.09 16:43

und ein paar WLAN-Stationen, die sich an und abgemeldet haben. Sonst nichts auffälliges.

Am Mini liegt es also nicht ...
 

Anhänge

  • 09-26-200912-13-09 img.jpg.jpg
    09-26-200912-13-09 img.jpg.jpg
    29.9 KB · Aufrufe: 30
Hallo!

Ich glaube, ich habe die Fehlerursache weiter eingegrenzt:
Das Problem tritt bei mir recht schnell auf wenn ich an einem per LAN an den Repeater angeschlossenem Gerät recht viel Internettraffic generiere, z.B. durch parallelen Download mehrerer großer Dateien aus dem Internet.
Mach ich (nach einem Reset) das gleiche per "direkter" WLAN Verbindung zum AP tritt das Problem nicht -- oder zumindest nicht annähernd so schnell -- auf.
Und der WLAN Rechner steht weniger als 1m vom Repeater entfernt, so dass ich auch eine zu schlechte WLAN Signalqualität als Ursache ausschliessen würde. Was ich aber sowieso ausschliessen würde, da sich die Last nicht normalisiert wenn dann kein weiterer Netzwerkverkehr mehr anfällt.

Ach ja: VoIP nutze ich zur Zeit auch nicht und ist auch nicht konfiguriert. Das ist also auch nicht die Ursache.

Diese neuen Erkenntnisse habe ich nun auch schon dem AVM Support mitgeteilt.

Sollte noch jemand wissen, ob und ggf. wo ich die offiziellen Vorläufer der aktuellen Firmware herunter laden kann, so wäre ich für Hinweise dankbar.

Grüße
Ingo
 
Ich habe mal die Mini-Unterstützung ausgeschaltet, hat aber auch nichts gebracht, es ging ca. 1 Tag + 20 Std gut. Aber dannn:

28.09.09 07:10:40 Keine WLAN-Station mehr angemeldet: Stromverbrauch wird reduziert.

Um ca. 7:30 / 7:40 Uhr dann wieder plötzlicher Anstieg:
# uptime
09:17:35 up 1 day, 21:57, load average: 2.80, 2.84, 2.77

In der Zeit gab es keine Downloads, keine Telefonate.
 
Mittlerweile habe ich wieder die Vorgänger Firmware (29.04.70) auf der Fritz Box 7170 installiert. Und siehe da: Das Problem ist noch nicht wieder aufgetreten -- auch nicht nachdem ich nun schon mehrmals für längere Zeit den Router mit Netzwerkverkehr über den Repeater gestresst habe. Mit der aktuell neuesten Firmware führte das bei all meinen bisherigen Tests immer innerhalb weniger Minuten zu extrem hoher Last.

(Nach mehrmaligem Nachfragen hatte AVM mir dann netter Weise die alte Firmware wieder zur Verfügung gestellt. Der Fehler wird dort auch noch weiter untersucht.)
 
Nochmal die Bitte, dass ein Mod das mit diesem Thread zusammenführt...
Hi Udo,
bist Du sicher, dass Du das willst?
Dann geraten beide Threads heillos durcheinander, da für die Sortierung nur der Zeitstempel der Beitragserstellung gilt. :shock:
Sollten wir nicht lieber einen Thread schließen und nur noch im anderen weiter machen? Der Link zu dem anderen Thread ist ja schon gegeben...
 
Dann geraten beide Threads heillos durcheinander, da für die Sortierung nur der Zeitstempel der Beitragserstellung gilt.
Ich habe mir die eben mal in zwei Fenstern nebeneinader gelegt, das passt zeitlich wunderbar und geht nicht durcheinander. Mach mal zusammenführen, bitte.
 
So sei es... ;)
 
AVM: Eine hohe CPU-Auslastung an sich ist noch kein Problem ...

Ich bin mitlerweile in einem Dialog mit AVM, alles sehr nett und sie bemühen sich wirklich, aber die Grundaussage ist: Solange es keine Störungen im Betrieb gibt, ist uns die Last egal. Ich bitte daher die anderen Betroffenen: Bleibt dran und meldet das Problem auch an AVM!

Kernpunkt ist m.E.: Alles was AVM sagt, kann nicht erklären, warum die Box nach einem Neustart oft viele Stunden lang mit einer Last von kaum über 0.00 sich quasi langweilt (und dabei natürlich sehr schön performant ist) und dann plötzlich ohne erkennbaren Anlass auf eine Last von 2.50 bis 3.XX ansteigt, ohne dann auch wieder von dieser Last runterzukommen!

Hier jetzt mal der Reihe nach mein Mailaustausch (teilweise gekürzt und sowieso anonymisiert) mit AVM aus den letzten Tagen:

Meine erste Meldung an AVM, 11.10.09:
Fehlerbeschreibung:
Spontan 100% CPU Load durch Prozess multid.

Das Problem tritt auf mit NICHT modifizierter Firmware ab XX.04.76 auf, auch nach Rücksetzen auf Werkseinstellungen.

Das Problem ist Ihnen bekannt ...[... Verweis auf IPPF ...]

Durch Stoppen des multid (multid -s) geht die Last wieder auf Normal, um 0.00, zurück). Nach Starten des multid steigt die Last sofort wieder an, unabhängig davon, ob USB-Geräte angeschlossen sind oder nicht.

Erst ein Neustart der Box schafft Abhilfe. Das Problem tritt dann spontan wider auf, ohne dass irgendwelche Ereignisse zu der Zeit, wo die Last hoch geht, sichtbar wären.

Die hohe Last kann 1 Stunde oder auch erst 2,5 Tage nach dem Neustart auftreten.
Anwort AVM vom 12.10.:
Bitte senden Sie mir einen Screenshot mit der Auslanstung und dem entsprechenden Prozess. Teilen Sie mir außerdem bitte mit, ob dies ein Prozess unter Windows ist oder ob es sich um einen Dienst auf der FRITZ!Box handelt.
Ok, das möchte ich dann nicht näher kommentieren ... :confused: meine Antwort am selben Tag:
[...] multid ist ein Dienst auf der FRITZ!Box. Ich hatte angenommen, das sei bekannt.

Nach dem spontanen Ansteigen der Last zeigt der Befehl Uptime z.B.:

# uptime
23:14:18 up 1 day, 19:16, load average: 2.90, 0.87, 0.31
ich stoppe multid -s
# multid -s
nach ca. 1 Minute ist die Last wieder 'normal':
# uptime
23:17:18 up 1 day, 19:16, load average: 0.00, 0.08, 0.15

Ich weiß schon, was jetzt kommt: Ja, ich habe telnetd auf der Box aktiviert, und somit ist es nicht mehr eine von Ihnen unterstütze Firmware. Aber ich betone nochmal: Das Problem tritt auf mit NICHT modifizierter Firmware ab XX.04.76
auf, auch nach Rücksetzen auf Werkseinstellungen. Nur lässt es sich dann natürlich nicht mehr durch die telnet-Ausgabe zeigen, nur noch im Energiemonitor.
Die Antwort von AVM folgte wie erwartet: Eigene Änderungen und Labor-FW wird nicht supportet, bitte die Box auf die offizielle FW zurücksetzen. Na gut, habe ich gemacht. Dann kam von AVM noch:
Wenn der Fehler auch unter der regulären Version der Firmware im NICHT modifizierten Zustand auftritt, so lassen Sie mir bitte noch einen Screenshot des Energiemonitors sowie Support-Daten zukommen, welche in diesem Zustand erstellt wurden. Vielen Dank!
Nun gibt es den Energiemonitor in der FW.76 noch gar nicht in der Form wie in der aktuellen Labor, und man kann der Verlauf der Last nicht sehen. Ich schrieb also an AVM:
anbei zwei Support-Dateien von heute morgen: Um 01:33 Uhr war die Last noch normal.
Um 09:48 Uhr ist die Last stark erhöht. Der Screenshot ist nicht so aussagekräftig, da es den Graphen mit der CPU-Auslastung in dieser Version ja noch nicht gibt.
Dann erhielt ich eine Anruf von AVM, und ein Mitarbeiter ließ sich von mir das ganze Thema nochmal am Telfon schildern. Ich bin dabei auch ausführlich auf das Problem mit telnet und/oder Freetz eingegangen, denn anders kann ich das Problem ja nicht erkennen ...
Zwischendurch war dann telnet an, obwohl ich es nicht bemerkt hatte, also wieder Ablehung durch AVM.
BTW: Wenn man nur einmal telnet auf der Box aktiviert hat, bleibt das vermerkt, auch wenn man es wieder ausschaltet oder sogar einen Werksreset macht. Erst ein Recover mit dem Recovery-Image von AVM stellt den Originalzustand der Box wieder her.
So, dann kam mal was Ausführliches, inzwischen haben wir den 22.10.:

Eine hohe CPU-Auslastung an sich ist noch kein Problem und somit nicht untersuchenswert. Es gibt einige Faktoren in der Einsatzkonstellation, die schon für eine latent hohe Last im Normalbetrieb sorgen können. Hinzu kommt eine recht hohe und mindestens grenzwertige USB-Last und auch der Einsatz eines von der FRITZ!Box nicht unterstützten USB-Gerätes. Der Einsatz im ATA-Mode bei einer zugleich recht hohen externen Bandbreite ist gleichfalls latent recht Performance-lastig. Wir können gerne einzelne Fehlerbilder betrachten, sofern Sie dies wünschen. Dazu benötigen wir aber zum jeweiligen Fehlerbild eine detaillierte Beschreibung. Wir werden Ihnen dann im nächsten Schritt mitteilen, welche Daten wir jeweils zu den
beschriebenen Problemen für eine Analyse benötigen. Es wäre hilfreich, wenn Sie sich auf ein bis zwei Fehlerbilder zunächst konzentrieren würden, da andernfalls ein strukturiertes Vorgehen erschwert würde.

Ein längerer Betrieb im DSL-Diagnosemodus sollte übrigens auch unbedingt vermieden werden. Dieser Modus dient ausschließlich zur Diagnose von
DSL-Problemen und führt zu einer sehr hohen Zusatzlast. Die Funktion sämtlicher anderer Module kann bei aktivem DSL-Diagnosemodus stark beeinträchtigt sein. Daher sind Seiteneffekte in diesem Modus für uns generell nicht untersuchenswert. Dieser Diagnosemodus war laut den Support-Daten vom 21.10.2009 mindestens in der Zeit von 08:45 bis 09:19 aktiv. Den Neustart hatten Sie übrigens zweimal ausgelöst, einmal durch den Start des DSL-Diagnosemodus kurz vor 08:45 und ein weiteres Mal durch das erstellen der Support-Daten im DSL-Diagnosemodus um 09:19. Durch letzteres wurde der DSL-Diagnosemodus dann auch wieder automatisch beendet. Es handelt sich in beiden Fällen um ein von uns gewolltes Verhalten.
Das mit dem Diagnose-Modus und Neustart hatte ich überlesen. Aber inhaltlich finde ich das schon gewagt: Soll die CPU ruhig braten, solange es nicht stört, macht das ja nichts ... das verdiente dann auch eine ausfühliche Antwort von mir, die folgte prompt (Zitate von AVM kursiv):
[...] vielen Dank für Ihre ausführliche Mail.
Eine hohe CPU-Auslastung an sich ist noch kein Problem und somit nicht untersuchenswert.
Nun ja, dass sehe ich als Linux-Admin anders. Wenn wir auf einem unserer
(Web/Mail)-Server eine dermaßen hohe Load haben, suchen wir die Ursache
*bevor* die Last zu einem Problem wird. Insbesondere dann, wenn wir keine
Erklärung für die Last haben.
Es gibt einige Faktoren in der Einsatzkonstellation, die schon für eine latent hohe Last im Normalbetrieb sorgen können.
Im Normalbetrieb liegt die Load meiner Box *weit* unter 1.00, auch wenn gesurft/gedownloaded und telefoniert wird.
Hinzu kommt eine recht hohe und mindestens grenzwertige USB-Last und auch der Einsatz eines von der FRITZ!Box nicht unterstützten USB-Gerätes.
Welches wäre das bei mir? Ich habe einen Canon Drucker, einen USB-Stick und eine per USB schaltbare Steckdosenleiste dran.
Der Einsatz im ATA-Mode bei einer zugleich recht hohen externen Bandbreite ist gleichfalls latent recht Performance-lastig.
Wiegesagt ist das normalerweise hier nicht der Fall.
Wir können gerne einzelne Fehlerbilder betrachten, sofern Sie dies wünschen. Dazu benötigen wir aber zum jeweiligen Fehlerbild eine detaillierte Beschreibung.
Wie am Telefon gesagt: Aussetzer und Knackser bei Telefonie und allgemein schlechte Performance (incl. sehr schlechter IP-Durchsatz).

Aber da haben wir das Problem: Ich kann Ihnen Fehlerbilder liefern, die Sie aber wegen Telnet und Freetz nicht akzeptieren.

Es ist der Prozess "multid", der bis zu 99% CPU Last macht, das kann ich zeigen wenn ich Freetz oder eine Busybox auf der Box habe, die "top" unterstützt. Ich hatte ja gedacht, dass es evtl. an Freetz liegt, aber die Last tritt ja eben mit Original-FW ebenfalls auf (und es erscheint mir unlogisch, wenn das eine andere Ursache hätte). Ok, ob multid die eigentliche Ursache ist, wissen wir natürlich nicht.

Entscheidend ist doch auch, dass die Last spontan auftritt. In der neuen Labor-FW kann man das ja grafisch sehr schön sehen, da hatte ich Ihnen anfangs Bilder geschickt. Es kam schon vor, dass die Box 2 Tage lang lief, und erst dann die Last anstieg (von 25 auf 100%), manchmal passiert das auch nach wenigen Stunden.

Dieses Verhalten widerspricht m.E. Ihren Ausführungen zur allgemeinen Ursachen der Performance-Lastigkeit.

Weiter ist es so, dass die Last sofort wieder auf Normalmaß (meist unter 0.50) sinkt, wenn ich den Prozess mit 'multid -s' beende. Nach Ihren Ausführungen müsste die Last aber auch durch Abtrennen der Box von alles USB-Geräten und vom Kabelmodem sinken, oder?
Wir werden Ihnen dann im nächsten Schritt mitteilen, welche Daten wir jeweils zu den beschriebenen Problemen für eine Analyse benötigen. Es wäre hilfreich, wenn Sie sich auf ein bis zwei Fehlerbilder zunächst konzentrieren würden, da andernfalls ein strukturiertes Vorgehen erschwert würde.
Ja, siehe oben, ich bin gespannt auf Ihre Vorschläge.
Ein längerer Betrieb im DSL-Diagnosemodus sollte übrigens auch unbedingt vermieden werden. ...
Ok, konnte ich natürlich nicht wissen. Das sollte evtl. angezeigt werden.

Anbei eine aktuelle Support Datei. Die Last ist 2.99. Ich werde die Box
jetzt neu starten.
Gesagt, getan ... dann gingen wieder jede Menge Support-Dateien an AVM.
Am nächsten Tag (23.10.) setzte ich nochmal nach, da AVM ja behauptet, es gäbe ganz 'normale' Gründe für die Last meiner Box
[...] Und warum läuft meine Box dann mindestens 3 Stunden lang (vermutlich länger) mit einer Last von nahezu 0.00 ? Siehe angeh. Support-Files:

18:42 - hohe Last 2.57 festgestellt, anschließend Neustart
19:40 - ok 0.12
20:16 - ok 0.00
20:52 - ok 0.00
21:46 - ok 0.05
10:07 - Last 2.46
10:38 - Last 3.27 (!)
10:47 - Last 3.13

Ich belasse die Box jetzt mal in den Zustand der hohen Last und werde
ca. alle 30 Minuten versuchen, eine Support-Datei zu erstellen.
Nach meinen bisherigen Beobachtungen geht die Last nicht von alleine
wieder herunter.

Die Downloadgeschwindigkeit ist in diesem Zustand stark beeinträchtigt,
nur noch ca. 10000 KBit/s (statt 30000 KBit/s)

Bitte teilen Sie mir mit, wie ich weiter vorgehen soll.
Daraufhin kam von AVM die genaue Anleitung, wie ich einen Paketmitschnitt während eines Telefongesprächs und Supportdateien damit hinschicken soll. Das habe ich getan, allerdings war das Gespräch (wo bei ich mich nur mit meinem eigenen Anrufbeantworter unterhalten habe) trotz der Last von fast 3.00 nicht gestört.

Mal sehen, wie's weitergeht ...

UdoSW
 
multid cpu load auch mit 7170 29.04.76

Ich habe das selbe Problem auch bei meiner 7170 mit Firmware 29.04.76 (freetz-devel-3811).

Code:
Mem: 28572K used, 1540K free, 0K shrd, 1260K buff, 10892K cached
CPU:  52% usr  47% sys   0% nice   0% idle   0% io   0% irq   0% softirq
Load average: 2.39 2.30 2.24
  PID  PPID USER     STAT   VSZ %MEM %CPU COMMAND
  621     1 root     R     3156  10%  98% multid
 2867  2602 root     R     1440   5%   2% top
  465     1 root     S N   7888  26%   0% ctlmgr
  661   655 root     S N   7888  26%   0% ctlmgr
  665   655 root     S N   7888  26%   0% ctlmgr
  655   465 root     S N   7888  26%   0% ctlmgr
  702     1 root     S     5808  19%   0% telefon a127.0.0.1
  712     1 root     S <   5272  17%   0% voipd
  672     1 root     S     3628  12%   0% dsld -i -n
  596     1 root     S     3364  11%   0% upnpd
  742   740 root     S     3364  11%   0% upnpd
  740   596 root     S     3364  11%   0% upnpd
  741   740 root     S     3364  11%   0% upnpd
...

Die hohe CPU-Load tritt in unrägelmäßigen Abständen auf, und läßt sich nur durch Reboot beheben. Ich habe bis jetzt noch keinen eindeutigen Auslöser gefunden.

Hier die RRDStats Auswertung der CPU-Load von gestern:
 

Anhänge

  • CPULoad.jpg
    CPULoad.jpg
    127.8 KB · Aufrufe: 26
Ich habe mitlerweile eine weitere 7270 ("Homebox" von Kabel Deutschland), und auch da tritt das Problem auf. Allerdings habe ich sie nicht lange genug im Original-Zustand (FW .76) gefahren, um mit Sicherheit sagen zu können, ob das Last-Problem ohne Modifikationen auch aufgetreten wäre. Nun ist Freetz drauf, und das Problem tritt auf.

Ich habe einen Verdacht, dass das 'Recover' nicht wirklich einen definierten Ausgangszustand wieder herstellt. Evtl. bleibt irgendetwas von Freetz auf den Boxen.

Ich muss mal sehen, ob ich meine 'alte' Box so hinbekomme, dass sie die Funktion der KD-Box übernehmen kann, dann die neue Recovern und abwarten. Oder mal sehen, was passiert, wenn ich eine Box quasi im 'Leerlauf' betreibe.

Gibt es hier einen User, der das Last-Problem hat, obwohl er nie Freetz o.ä. auf der Box hatte?

Udo

PS: Die Box von KD und die 7270 sind absolut baugleich, in Hard- und Software. Anders sind nur einige Environment-Variablen. Aber das ist OT.
 
74.04.80 scheint Verbesserungen zu bringen

Ich habe jetzt seit einigen Tagen die neue 74.04.80 drauf. Seitdem habe ich keine Probleme mehr gehabt. Ich hatte zuletzt auch immer wieder "Aufhänger" gehabt. Die Box war zwar am leben (interne Telefonate gingen), aber weder wurden IP-Pakete intern am LAN weitergeleitet, noch per WLAN oder extern.

Seit die neue FW drauf sind die Probleme weg.
- FB zeigt deutlich geringere Last und auch im Energiemonitor verbraucht sie weniger.
- DECT Reichweite wesentlich verbessert
- bisher keine Abstürze und keine Lastanstiege bei multid

Laut info.txt sind in diesen Bereichen auch Verbesserungen gemacht worden. Ich hoffe mal, dass die 80er Firmware da ein Durchbruch war.
 
Zuletzt bearbeitet:
Gibt es hier einen User, der das Last-Problem hat, obwohl er nie Freetz o.ä. auf der Box hatte?


Ja, ich. Hatte ein komplett originale Box und trotzdem das 'multid-Problem'. :(

Ich habe jetzt seit einigen Tagen die neue 74.04.80 drauf. Seitdem habe ich keine Probleme mehr gehabt. Ich hatte zuletzt auch immer wieder "Aufhänger" gehabt.
...

Ich hoffe mal, dass die 80er Firmware da ein Durchbruch war.

Offensichtlich nicht. Habe auch gehofft das mit der 80er alles besser wird und es sah auch danach aus (auf meiner Box läuft jetzt aber Freetz). Bis gestern Abend...

Code:
Mem: 55140K used, 6140K free, 0K shrd, 6972K buff, 23688K cached
CPU:  44% usr  35% sys   0% nice   3% idle   0% io   0% irq  16% softirq
Load average: 2.58 2.56 2.65
  PID  PPID USER     STAT   VSZ %MEM %CPU COMMAND
 1076     1 root     R     3596   6%  93% multid -t
...
Ach menno. :(
 
Du Ärmster. Ich habe Folgendes gemacht:
- Werksreset
- Upgrade auf die .80
- eigene Einstellungen importiert aus Export-Datei
- dann konnte ich den Mini nicht mehr anmelden (der Bug ist bei AVM ja schon bekannt, wie man hier nachlesen kann).
- Downgrade auf .76
- Mini erfolgreich angemeldet
- Upgrade auf offizielle .80
- Upgrade auf PHONE Labor-Version 54.04.80-15992

Die Box läuft in diesem Zustand seit mehr als 5 Tagen ohne das Last-Problem. Ich werde das mal bis ins neue Jahr so lassen.
Irgendwann brauche ich dann aber mal wieder Freetz und Asterisk auf der Box. Mal schauen wie das wird. Evtl. liegt es ja doch am Freetz oder Modifikationen überhaupt ...
 
Udo Du weißt schon, daß es für die Fritz!Mini auf der Basis der xx.04.80 eine eigene Firmware gibt?

54.04.80-15941, Klick mich

Happy computing!
R@iner
 
Nun ist es doch wieder passiert und ich habe das Last-Problem mit der 54.04.80-15992.

Ich bin jetzt mal auf die 54.04.80-15941(Mini) gegangen, mal sehen wie sich das entwickelt.
 

Anhänge

  • 12-28-200908-19-22 img.jpg.jpg
    12-28-200908-19-22 img.jpg.jpg
    59 KB · Aufrufe: 21
gleiches problem mit xx.80 freetz firmware. ging jetzt einige tage gut, aber seit gestern nachmittag pegelt sich die cpu last bei ca. 90% ein. das einzige, was ich gemacht habe, war telefonieren per dect und n paar downloads. und rechnet sich die fb wieder kaputt
 
So kaputt, dass auch schon Deine Shift-Taste in Mitleidenschaft gezogen wurde? Bitte repariere diese umgehend, wenn Du weiter hier posten möchtest. :?
 
Ich bin jetzt mal auf die 54.04.80-15941(Mini) gegangen, mal sehen wie sich das entwickelt.
Auch dort: Nach ca. 5 Tagen ein plötzlicher Last-Anstieg.
D.h. es kann nicht an Freetz liegen. Irgendwie drehen wir uns im Kreis ...:mad:
 
Holen Sie sich 3CX - völlig kostenlos!
Verbinden Sie Ihr Team und Ihre Kunden Telefonie Livechat Videokonferenzen

Gehostet oder selbst-verwaltet. Für bis zu 10 Nutzer dauerhaft kostenlos. Keine Kreditkartendetails erforderlich. Ohne Risiko testen.

3CX
Für diese E-Mail-Adresse besteht bereits ein 3CX-Konto. Sie werden zum Kundenportal weitergeleitet, wo Sie sich anmelden oder Ihr Passwort zurücksetzen können, falls Sie dieses vergessen haben.