Datenkorruption irgendwo auf dem Mainboard

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • Datenkorruption irgendwo auf dem Mainboard

      Hi,

      ich habe hier eine - inzwischen etwas angegraute - ET 10000, bei der reproduzierbar Daten verfälscht werden. Wenn ich z.B. eine 1,2 GB große Aufnahme kopiere, dann kann ich anschließend eine niedrige einstellige Zahl an Unterschieden feststellen. Es reicht sogar, die Datei mit sich selbst zu vergleichen. Und natürlich variiert das Ergebnis von Mal zu Mal:

      Quellcode

      1. root@et10000:/media/usb/# ls -lh 68-2.ts
      2. -rw-r--r-- 1 root root 1.2G Nov 15 12:15 68-2.ts
      3. root@et10000:/media/usb/# cmp -l 68-2.ts 68-2.ts
      4. 31972520 273 271
      5. root@et10000:/media/usb/# cmp -l 68-2.ts 68-2.ts
      6. 137501992 270 272
      7. 161068264 254 256
      8. 640632236 277 275
      9. 889027156 275 277
      10. root@et10000:/media/usb/#


      (Mir fällt gerade auf, dass es immer das zweite Bit ist, das kippt.)

      Das ist mir schon vor einiger Zeit aufgefallen, ich habe das auf die z.T. extremen Temperaturen im Inneren der ET 10000 geschoben. Einen Lüfter einzubauen hat zwar die Temperaturen deutlich gesenkt (von Spitzenwerten über 90 Grad am Prozessor und über 40 Grad im Gehäuse auf rund 40 bis 45 Grad am Prozessor und etwa 30 Grad im Gehäuse), der Fehler ist aber nicht verschwunden. An der Hitze hat es also nicht gelegen. Die Festplatte samt SATA-Kabel und -Interface kann ich auch ausschließen, das Problem tritt mit auf einem USB-Stick auf. Bleibt eigentlich nur noch der Speicher oder der Prozessor und was sonst noch auf dem Mainboard steckt (DMA-Controller, Memory-Controller, etc)

      Hat jemand schon mal ähnliches beobachtet? Irgendeine Idee? Dieses Bitkippen macht die Box nicht unbrauchbar, aber beim Sichern der Filme auf USB-Sticks oder übers Netzwerk nervt es doch.

      Viele Grüße,
      Meikel

      PS: Bei Interesse kann ich auch mal was schreiben zum Einbau des Lüfters, da gab es ja auch hier einen Thread zu.
    • Das was mir spontan dazu einfällt ist, daß die ETxxxx immer mal wieder Ärger mit den Kondensatoren haben.
      Es gibt hier einige Threads und Posts dazu. Hier nur mal 2 Stück:

      Nachfolger für meinen Clarke Tech ET9000 gesucht!

      et 9000 nach Netzteil reparatur kein booten mehr

      Ich weiß nicht ob das die Ursache ist aber vielleicht bringt Dich das ja ein Stück weiter.
      Viel Glück !
    • cricriat schrieb:

      Das was mir spontan dazu einfällt ist, daß die ETxxxx immer mal wieder Ärger mit den Kondensatoren haben.
      Es gibt hier einige Threads und Posts dazu. Hier nur mal 2 Stück:

      Nachfolger für meinen Clarke Tech ET9000 gesucht!

      et 9000 nach Netzteil reparatur kein booten mehr

      Ich weiß nicht ob das die Ursache ist aber vielleicht bringt Dich das ja ein Stück weiter.
      Viel Glück !


      Danke für euer Feedback. Bei fehlerhaften Kondensatoren wären die Symptome wohl stärker gestreut, da würde nicht so reproduzierbar immer das 2. Bit kippen. Ich hatte ursprünglich ja auch die Hitzeentwicklung in Verdacht, aber je länger ich mich damit beschäftige, umso mehr tippe ich auf eine defekte Speicherzelle. Klingt zwar immer noch etwas exotisch, aber im Moment scheint es mir die plausibelste Erklärung zu sein.

      Ich würde deswegen gerne mal einen Speichertest machen, leider läuft das unter Linux sonst gängige MemTest86 nicht auf solchen Boxen mit MIPS- oder ARM-Prozessor. Es gibt aber andere Tools, z.B. dieses hier: Memtester
      Praktischerweise läuft das als normales Programm unter Linux und einer ganzen Reihe anderer Kernel. Es greift über /dev/mem auf den Speicher zu, das ist portabel und nicht allzu komplex oder plattformspezifisch. Allerdings scheint es gar nicht so einfach zu sein, die nötigen Tools auf die Box zu bekommen: gcc ist da, make und Header scheinen zu fehlen. Gibt es da evtl. eine Anleitung, in welchen Paketen sich die fehlenden Teile (wie gesagt, GNU make und die gängigen Header wie stdio.h) finden? Alternativ auch, wie man eine Build-Umgebung unter Linux/x86 aufsetzt?

      Viele Grüße,
      Meikel
      pyropus.ca/software/memtester/
    • Speicherfehler würden vom System markiert werden.
      Diese Bereiche würde der Speicher dann nicht mehr benutzen.
      Defekte Speicherbereiche gibt es immer und sind in kleinem Maße auch völlig normal.
      Was bei den einzelnen Befehlen dann jeweils ausgegeben wird ist etwas variabel.
      Die defekten Einheiten/Bereiche in Zahlen zu wissen hilft auch nicht wirklich.
      Grob würdest du bei einem defekten Speicher schnell merken, das er wirklich defekt wäre.
      Du hättest quasi mit jedem Flash weniger Speicher zur Verfügung das würde sehr schnell deutlich auffallen.

      Grüße
    • rantanplan schrieb:

      Speicherfehler würden vom System markiert werden.
      Diese Bereiche würde der Speicher dann nicht mehr benutzen.
      Defekte Speicherbereiche gibt es immer und sind in kleinem Maße auch völlig normal.
      Was bei den einzelnen Befehlen dann jeweils ausgegeben wird ist etwas variabel.
      Die defekten Einheiten/Bereiche in Zahlen zu wissen hilft auch nicht wirklich.
      Grob würdest du bei einem defekten Speicher schnell merken, das er wirklich defekt wäre.
      Du hättest quasi mit jedem Flash weniger Speicher zur Verfügung das würde sehr schnell deutlich auffallen.

      Grüße


      Sorry, wenn das missverständlich war: ich meine den Hauptspeicher (RAM) und du den Flash-Speicher fürs Betriebssystem/die Firmware. Der Flash-Speicher der Box hier hat keine Probleme, beim Flashen werden zwar 7 Defekte angezeigt, aber das ist seit Jahren stabil. Und der Hauptspeicher hat bei der Box leider keine Mechanismen, um Fehler zu erkennen oder zu beheben, dazu braucht es dann schon die erwähnten Testprogramme.

      MfG, Meik
    • Ja, RAM-Fehler ist durchaus möglich. Ich habe hier eine Box, wo auch das RAM defekt ist. Tlw. funzt sie. Aber oft stürzt sie dann auch einfach ab und läßt sich dann oöfters nicht mehr booten. Muss man dann neu flashen, was auch oft zu einem Abbruch führt.
      ____
      Hans



      Achtung: Kein Support über private Nachrichten!


      TV - Hisense Ulra HD
      Eutelsat 13°E und Astra 19,2°E Unicable-Matrix mit Wide-LNB
    • cricriat schrieb:

      So bekommst Du den memtester:

      cd /tmp
      wget ftp.de.debian.org/debian/pool/…mtester_4.3.0-3_armhf.deb
      mkdir /tmp/mt
      cd /tmp/mt
      ar -x ../memtester_4.3.0-3_armhf.deb
      unxz data.tar.xz
      tar xvf data.tar
      cd usr/sbin (kein slash vor usr; Du bist in /tmp/mt)
      ./memtester


      Wald, Bäume. Ich war so darauf fixiert, selber zu kompilieren, dass ich an die Möglichkeit gar nicht gedacht habe. Ich lasse memtester gerade die Box quälen, und melde mich später nochmal.

      Vielen Dank!
      Meik
    • Datenkorruption irgendwo auf dem Mainboard

      An ein RAM Problem glaube ich nicht, das würde sich anders äußern.

      Nimm mal md5sum und vergleiche die Prüfsummen Deiner kopierten Aufnahmen.

      Gesendet von meinem EML-L09 mit Tapatalk
      _________________________________________________________________
      GB ue 4k mit ST3000LM024-2AN1 und Synology über Denon X1700H an LG OLED OLED65C17LB
      AX 4K HD51 mit Synology an OLED55C8LLA
      Anadol Multibox SE an Samsung c
      ET10000 an Pioneer PDP-436RXE
      Unicable mit IG-IDLU-UST110-CUO4O-32P

    Unsere Partnerboards

    ^
    Flag Counter