Verhaltensweise bei „unreadable sectors“

classic Classic list List threaded Threaded
10 messages Options
Reply | Threaded
Open this post in threaded view
|

Verhaltensweise bei „unreadable sectors“

Gerhard Wolfstieg
     Hallo zusammen!

Was ist die beste Vorgehensweise, wenn man diese Nachricht erhält:

›››››››››››››››
This message was generated by the smartd daemon running on:

   host name:
   DNS domain:

The following warning/error was logged by the smartd daemon:

Device: /dev/sdc [SAT], 1 Currently unreadable (pending) sectors

Device info:
WDC WD5000AAKX-003CA0, S/N:WD-WMAYUL014761, WWN:5-0014ee-1af450196,
FW:15.01H15, 500 GB

For details see host's SYSLOG.
‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹

In /var/log/syslog steht auch nicht mehr.

     Grüße und Dank im Voraus, Gerhard


Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Christoph Schmees
Am 25.02.19 um 15:47 schrieb Gerhard Wolfstieg:

>      Hallo zusammen!
>
> Was ist die beste Vorgehensweise, wenn man diese Nachricht erhält:
>
> ›››››››››››››››
> This message was generated by the smartd daemon running on:
>
>    host name:
>    DNS domain:
>
> The following warning/error was logged by the smartd daemon:
>
> Device: /dev/sdc [SAT], 1 Currently unreadable (pending) sectors
>
> Device info:
> WDC WD5000AAKX-003CA0, S/N:WD-WMAYUL014761, WWN:5-0014ee-1af450196,
> FW:15.01H15, 500 GB
>
> For details see host's SYSLOG.
> ‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹
>
> In /var/log/syslog steht auch nicht mehr.
>
>      Grüße und Dank im Voraus, Gerhard

Vorgehensweise? Platte auswechseln.

Wenn du es nicht glaubst, dann sieh dir mit GSmartControl die Attribute an und/oder mache den ausführlichen Selbsttest. ((geht auch mit smartmontools direkt, aber unhandlich.))

hth, Christoph

--
Bitte keine Mails von USA-Providern wie AOL, me.com (Apple),
gmail (Google), hotmail/outlook.com (Microsoft) oder yahoo.
Solche Mails werden ohne Rückmeldung gelöscht.
Siehe <http://www.pc-fluesterer.info/wordpress/downloads>

Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Peter Funk
Hallo ihr,

Christoph Schmees schrieb am Montag, den 25.02.2019 um 15:57:

> Am 25.02.19 um 15:47 schrieb Gerhard Wolfstieg:
> >      Hallo zusammen!
> >
> > Was ist die beste Vorgehensweise, wenn man diese Nachricht erhält:
> >
> > ›››››››››››››››
> > This message was generated by the smartd daemon running on:
> >
> >    host name:
> >    DNS domain:
> >
> > The following warning/error was logged by the smartd daemon:
> >
> > Device: /dev/sdc [SAT], 1 Currently unreadable (pending) sectors
> >
> > Device info:
> > WDC WD5000AAKX-003CA0, S/N:WD-WMAYUL014761, WWN:5-0014ee-1af450196,
> > FW:15.01H15, 500 GB
> >
> > For details see host's SYSLOG.
> > ‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹
> >
> > In /var/log/syslog steht auch nicht mehr.
> >
> >      Grüße und Dank im Voraus, Gerhard
>
> Vorgehensweise? Platte auswechseln.
Ist dieser Rat nicht ein wenig übertrieben und erzeugt noch
mehr Elektronik-Schrott als unsere Zivilisation sowieso schon
erzeugt?

Es kann doch immer mal vorkommen, dass die Elektronik einer
Festplatte die Daten eines einzelnen Sektor nicht wieder
rekonstruieren kann.  Das muss noch lange nicht bedeuten, dass
dieser Sektor oder weitere Bereiche der Platte physikalisch
defekt sind.  Wahrscheinlich lässt sich der Sektor ganz normal
wieder beschreiben.  Ärgerlich ist nur, dass die Daten,
die dort waren, nicht rekonstruiert werden konnten und dass
die obige Fehlermeldung alleine leider keine Rückschlüsse
darüber erlaubt, um was es sich dabei nun genau gehandelt hat.

Um den Fehler zu beheben, muss der betroffene Sektor nämlich
erneut mit Daten (z.B. aus einem Backup) beschrieben werden.

Wie kann heraus gefunden werden, um welche Daten es sich
gehandelt hat?  Eine Möglichkeit ist das Kommando::

  find / -xdev -type f -print0 | xargs -0 sha512sum

um jede Datei im System auszulesen.  Wenn der Sektor zu
einer dieser Dateien gehört, kann anhand einer Fehlermeldung
festgestellt werden, ob und welche Datei betroffen ist.

Bitte beachten, dass es eine schlechte Idee ist, die betroffene Datei
einfach zu löschen: Sie muss an Ort und Stelle mit Daten beschrieben
werden, damit die Platte die Chance bekommt, den Sektor „neu zu
magnetisieren“.  Falls obiges Kommando keinen Lesefehler produziert,
dann ist der betroffene Sektor vermutlich in der "freelist".
Bei Fehlern, die beim Ablaufen des Verzeichnis-Baumes auftreten, ist
der Sektor vermutlich Teil der Dateisystem-Infrastruktur.  In diesem
letzterem Fall kann u.U. nicht mal ein "fsck" helfen und es kann dann
notwendig werden, das Dateisystem komplett neu zu formatieren.

> Wenn du es nicht glaubst, dann sieh dir mit GSmartControl
> die Attribute an und/oder mache den ausführlichen
> Selbsttest. ((geht auch mit smartmontools direkt, aber
> unhandlich.))

Ich habe nicht verstanden, was das bei der Identifikation und
Rekonstruktion der verlorenen Daten helfen soll.

Liebe Grüße, Peter Funk
--
Peter Funk ✉:Oldenburger Str.86, D-27777 Ganderkesee; ☎:+49-179-640-8878
office✉: ArtCom GmbH, Haferwende 2, D-28357 Bremen, Germany
☎:+49-421-20419-0 <http://www.artcom-gmbh.de/>

signature.asc (180 bytes) Download Attachment
Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Klaus Maria Pfeiffer-6
In reply to this post by Christoph Schmees

On 2/25/19 3:57 PM, Christoph Schmees wrote:
>> Device: /dev/sdc [SAT], 1 Currently unreadable (pending) sectors
> Vorgehensweise? Platte auswechseln.

das gestaltet sich natürlich in einem RAID einfacher. :-)

> ((geht auch mit smartmontools direkt, aber unhandlich.))

(an den OP)

poste mal ein
        smartctl --all /dev/sdc

danach machst mal den angesprochenen kurz- und langtest
        smartctl -t short /dev/sdc
        smartctl -t long /dev/sdc

und eigentlich sollte man sowas wie folgt in der /etc/smartd.conf
drinnen haben, damit er selbst regelmäßig kurz und langtest macht.
        /dev/sdc -d ata -a -o on -S on -I 194 -W 4,40,45 -R 5! -s
(S/../.././02|L/../../6/04) -m root

galiegrü, Klaus

Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Christoph Schmees
In reply to this post by Peter Funk
Am 25.02.19 um 17:39 schrieb Peter Funk:

> Hallo ihr,
>
> Christoph Schmees schrieb am Montag, den 25.02.2019 um 15:57:
>> ...
>> Vorgehensweise? Platte auswechseln.
>
> Ist dieser Rat nicht ein wenig übertrieben und erzeugt noch
> mehr Elektronik-Schrott als unsere Zivilisation sowieso schon
> erzeugt?
>
> Es kann doch immer mal vorkommen, dass die Elektronik einer
> Festplatte die Daten eines einzelnen Sektor nicht wieder
> rekonstruieren kann.  

nein.

> Das muss noch lange nicht bedeuten, dass
> dieser Sektor oder weitere Bereiche der Platte physikalisch
> defekt sind.  

doch.

"Moderne" Platten haben eingebaute "Intelligenz" und Mechanismen  zur Sicherstellung der Daten-Integrität. Zu jedem Sektor wird eine checksum geschrieben und beim Lesen verglichen.
Wenn die beim Lesen nicht stimmt, wird der Lesevorgang wiederholt, typischerweise bis zu zehn mal. Manchmal lassen sich damit auch einem "weichen" Sektor noch seine Daten entlocken. Die vom OP genannte Meldung besagt, dass das in diesem Falle nicht gelungen ist! -> Der Sektor ist, wenn nicht bereits ganz kaputt, dann doch so weich, dass ich ihm keinesfalls mehr Daten anvertrauen würde.

Sektoren, die von dieser Selbstkontrolle für physisch defekt gehalten werden, ersetzt die Plattenelektronik durch Reservesektoren. Das bleibt für das System darüber erst mal transparent; man erkennt es nur an den /reallocatinos/ in den SMART Attributen.

> Wahrscheinlich lässt sich der Sektor ganz normal
> wieder beschreiben.  

nein, er lässt sich ja nicht einmal lesen!

> Ärgerlich ist nur, dass die Daten,
> die dort waren, nicht rekonstruiert werden konnten und dass
> die obige Fehlermeldung alleine leider keine Rückschlüsse
> darüber erlaubt, um was es sich dabei nun genau gehandelt hat.
>
> Um den Fehler zu beheben, muss der betroffene Sektor nämlich
> erneut mit Daten (z.B. aus einem Backup) beschrieben werden.

nein, die Platte ersetzt ihn stillschweigend durch Reserve.

>
> Wie kann heraus gefunden werden, um welche Daten es sich
> gehandelt hat?  Eine Möglichkeit ist das Kommando::
>
>   find / -xdev -type f -print0 | xargs -0 sha512sum
>
> um jede Datei im System auszulesen.  Wenn der Sektor zu
> einer dieser Dateien gehört, kann anhand einer Fehlermeldung
> festgestellt werden, ob und welche Datei betroffen ist.
>
> Bitte beachten, dass es eine schlechte Idee ist, die betroffene Datei
> einfach zu löschen: Sie muss an Ort und Stelle mit Daten beschrieben
> werden, damit die Platte die Chance bekommt, den Sektor „neu zu
> magnetisieren“.  Falls obiges Kommando keinen Lesefehler produziert,
> dann ist der betroffene Sektor vermutlich in der "freelist".
> Bei Fehlern, die beim Ablaufen des Verzeichnis-Baumes auftreten, ist
> der Sektor vermutlich Teil der Dateisystem-Infrastruktur.  In diesem
> letzterem Fall kann u.U. nicht mal ein "fsck" helfen und es kann dann
> notwendig werden, das Dateisystem komplett neu zu formatieren.
>
>> Wenn du es nicht glaubst, dann sieh dir mit GSmartControl
>> die Attribute an und/oder mache den ausführlichen
>> Selbsttest. ((geht auch mit smartmontools direkt, aber
>> unhandlich.))
>
> Ich habe nicht verstanden, was das bei der Identifikation und
> Rekonstruktion der verlorenen Daten helfen soll.

gar nichts. Es hilft nur bei der Einschätzung, *wie* krank die Platte ist. Die betroffene Datei ist mit großer Wahrscheinlichkeit hin. Die gute Nachricht: Meist sind Dateien des Betriebssystems betroffen, weil in den Bereichen häufig zugegriffen wird. Benutzerdateien erwischt es höchst selten.

Übrigens, die Platte stammt von 2010, da darf sie schon verschlissen sein. Vielleicht liest der OP auch mal die SMART Betriebsstunden und die Anzahl der Einschaltvorgänge aus.

Das Argument mit dem Elektronik-Schrott verstehe ich; ich bin selbst ein eingefleischter Ressourcen-Schoner. :-) Aber leider sind Festplatten als Verschleißteile konzipiert. Wenn so eine Platte einmal abgenudelt ist, dann ist sie am Ende, Punkt. Dann hilft nur Austausch. Die Platten kann man zum Recycling bringen, die gehören keinesfalls in den Hausmüll!

hth, Christoph

--
Bitte keine Mails von USA-Providern wie AOL, me.com (Apple),
gmail (Google), hotmail/outlook.com (Microsoft) oder yahoo.
Solche Mails werden ohne Rückmeldung gelöscht.
Siehe <http://www.pc-fluesterer.info/wordpress/downloads>

Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Ulf Volmer
On 25.02.19 18:55, Christoph Schmees wrote:
> Am 25.02.19 um 17:39 schrieb Peter Funk:

>> Um den Fehler zu beheben, muss der betroffene Sektor nämlich
>> erneut mit Daten (z.B. aus einem Backup) beschrieben werden.
>
> nein, die Platte ersetzt ihn stillschweigend durch Reserve.

Ja, aber erst bein nächsten Schreibzugriff. Solange bleibt er im Status
pending. Insofern kann es durchaus sinnvoll sein, den Sektor gezielt zu
überschreiben.

Viele Grüße
Ulf

Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Peter Funk
In reply to this post by Christoph Schmees
Hallo Cristoph,

Christoph Schmees schrieb am Montag, den 25.02.2019 um 18:55:

> Am 25.02.19 um 17:39 schrieb Peter Funk:
> > Hallo ihr,
> >
> > Christoph Schmees schrieb am Montag, den 25.02.2019 um 15:57:
> >> ...
> >> Vorgehensweise? Platte auswechseln.
> >
> > Ist dieser Rat nicht ein wenig übertrieben und erzeugt noch
> > mehr Elektronik-Schrott als unsere Zivilisation sowieso schon
> > erzeugt?
> >
> > Es kann doch immer mal vorkommen, dass die Elektronik einer
> > Festplatte die Daten eines einzelnen Sektor nicht wieder
> > rekonstruieren kann.  
>
> nein.
An dieser Stelle möchte ich Dir widersprechen.  In meiner langjährigen
Erfahrung waren in der Regel Dateien betroffen, die nur selten ausgelesen
worden sind.  Dort hat die Magnetisierung dann im Laufe der Zeit nach
gelassen und die Daten konnten trotz der in den Platten vorhandenen
Redundanz und Fehlerkorrektur nicht wieder hergestellt werden.

> > Das muss noch lange nicht bedeuten, dass
> > dieser Sektor oder weitere Bereiche der Platte physikalisch
> > defekt sind.  
>
> doch.
>
> "Moderne" Platten haben eingebaute "Intelligenz" und
> Mechanismen  zur Sicherstellung der Daten-Integrität. Zu
> jedem Sektor wird eine checksum geschrieben und beim
> Lesen verglichen.  Wenn die beim Lesen nicht stimmt, wird
> der Lesevorgang wiederholt, typischerweise bis zu zehn
> mal. Manchmal lassen sich damit auch einem "weichen" Sektor
> noch seine Daten entlocken. Die vom OP genannte Meldung
> besagt, dass das in diesem Falle nicht gelungen ist! ->
> Der Sektor ist, wenn nicht bereits ganz kaputt, dann doch so
> weich, dass ich ihm keinesfalls mehr Daten anvertrauen würde.
>
> Sektoren, die von dieser Selbstkontrolle für physisch
> defekt gehalten werden, ersetzt die Plattenelektronik durch
> Reservesektoren. Das bleibt für das System darüber erst
> mal transparent; man erkennt es nur an den /reallocatinos/
> in den SMART Attributen.
Das mag ja alles sein. Jedoch ist keine mir bekannte Platten
Firmware so ausgelegt, dass sie regelmäßig alle Daten „einmal
besucht“ und durch Lesen und Neuschreiben wieder auffrischt.

> > Wahrscheinlich lässt sich der Sektor ganz normal
> > wieder beschreiben.  
>
> nein, er lässt sich ja nicht einmal lesen!

Was soll das denn für ein Argument sein?
Lesen ist deutlich schwieriger als Schreiben!

> > Ärgerlich ist nur, dass die Daten,
> > die dort waren, nicht rekonstruiert werden konnten und dass
> > die obige Fehlermeldung alleine leider keine Rückschlüsse
> > darüber erlaubt, um was es sich dabei nun genau gehandelt hat.
> >
> > Um den Fehler zu beheben, muss der betroffene Sektor nämlich
> > erneut mit Daten (z.B. aus einem Backup) beschrieben werden.
>
> nein, die Platte ersetzt ihn stillschweigend durch Reserve.

Das passiert normalerweise nur dann, wenn sich der Sektor nach
dem erneuten Beschreiben nicht wieder auslesen ließ. Lesefehler
kann keine Firmware stillschweigend ersetzen: Dazu müsste sie
Zugriff auf einen kompletten Backup der Daten haben: Ergo die
Nettokapazität der Platte wäre weniger als die Hälfte der
verfügbaren Bruttokapazität: Soviel Redundanz sieht kein
Hersteller vor.

> > Wie kann heraus gefunden werden, um welche Daten es sich
> > gehandelt hat?  Eine Möglichkeit ist das Kommando::
> >
> >   find / -xdev -type f -print0 | xargs -0 sha512sum
> >
> > um jede Datei im System auszulesen.  Wenn der Sektor zu
> > einer dieser Dateien gehört, kann anhand einer Fehlermeldung
> > festgestellt werden, ob und welche Datei betroffen ist.
> >
> > Bitte beachten, dass es eine schlechte Idee ist, die betroffene Datei
> > einfach zu löschen: Sie muss an Ort und Stelle mit Daten beschrieben
> > werden, damit die Platte die Chance bekommt, den Sektor „neu zu
> > magnetisieren“.  Falls obiges Kommando keinen Lesefehler produziert,
> > dann ist der betroffene Sektor vermutlich in der "freelist".
> > Bei Fehlern, die beim Ablaufen des Verzeichnis-Baumes auftreten, ist
> > der Sektor vermutlich Teil der Dateisystem-Infrastruktur.  In diesem
> > letzterem Fall kann u.U. nicht mal ein "fsck" helfen und es kann dann
> > notwendig werden, das Dateisystem komplett neu zu formatieren.
> >
> >> Wenn du es nicht glaubst, dann sieh dir mit GSmartControl
> >> die Attribute an und/oder mache den ausführlichen
> >> Selbsttest. ((geht auch mit smartmontools direkt, aber
> >> unhandlich.))
> >
> > Ich habe nicht verstanden, was das bei der Identifikation und
> > Rekonstruktion der verlorenen Daten helfen soll.
>
> gar nichts. Es hilft nur bei der Einschätzung, *wie*
> krank die Platte ist. Die betroffene Datei ist mit großer
> Wahrscheinlichkeit hin. Die gute Nachricht: Meist sind Dateien
> des Betriebssystems betroffen, weil in den Bereichen häufig
> zugegriffen wird. Benutzerdateien erwischt es höchst selten.
Diese Einschätzung widerspricht meiner persönlichen Erfahrung:

Firmware aus dieser Zeit ist in der Regel schon so ausgelegt,
dass sie bei Einzelbit-Lesefehlern, die von der platteninternen
Fehlerkorrektur erwischt werden, die betroffenen Sektoren tatsächlich
stillschweigend neu schreibt.

Deshalb entwickeln sich nicht korrigierbare Lesefehler perfider
Weise häufig auf Platten in den Dateien, die nicht regelmäßig
im Zuge eines Gesamt-Backups komplett ausgelesen worden sind.

So ein langer Selbsttest kann deshalb die Lebenszeit der Platte
verlängern, da dabei auch selten benutzte Bereiche ausgelesen
und damit Einzelbit-Lesefehler verringert werden.

> Übrigens, die Platte stammt von 2010, da darf sie schon
> verschlissen sein. Vielleicht liest der OP auch mal die SMART
> Betriebsstunden und die Anzahl der Einschaltvorgänge aus.

Ich glaube nicht, dass diese Parameter in diesem konkreten
Fall bei der Einschätzung helfen, warum die Magnetisierung
von paar Bits zu viel in einem einzelnen Sektor zu stark nach
gelassen hat.  Ich weiß von vielen Festplatten bei uns in
der Firma und bei Kunden, die deutlich älter als 10 Jahre sind.
Es kann natürlich sein, dass die Platte vielleicht tatsächlich
bald ihren Geist aufgibt.  Aber ich würde das mit dem Neuschreiben
des Sektors als Erstes probieren.  Oft hat das Erfolg gehabt
und in der Platte steckten noch einige Jahre Betriebszeit.

> Das Argument mit dem Elektronik-Schrott verstehe ich; ich
> bin selbst ein eingefleischter Ressourcen-Schoner. :-) Aber
> leider sind Festplatten als Verschleißteile konzipiert. Wenn
> so eine Platte einmal abgenudelt ist, dann ist sie am Ende,
> Punkt. Dann hilft nur Austausch. Die Platten kann man zum
> Recycling bringen, die gehören keinesfalls in den Hausmüll!

Das stimmt.
 
Liebe Grüße, Peter Funk
--
Peter Funk ✉:Oldenburger Str.86, D-27777 Ganderkesee; ☎:+49-179-640-8878
office✉: ArtCom GmbH, Haferwende 2, D-28357 Bremen, Germany
☎:+49-421-20419-0 <http://www.artcom-gmbh.de/>

signature.asc (180 bytes) Download Attachment
Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Gerhard Wolfstieg
In reply to this post by Christoph Schmees
     Hallo Christoph, hall zusammen!

Am Mon, 25 Feb 2019 15:57:03 +0100
schrieb Christoph Schmees <[hidden email]>:

> Vorgehensweise? Platte auswechseln.
>
> Wenn du es nicht glaubst, dann sieh dir mit GSmartControl die Attribute an und/oder mache den ausführlichen Selbsttest. ((geht auch mit smartmontools direkt, aber unhandlich.))

›››››››››››››››
Den ausführlichen Selbstest habe ich jetzt mit gsmartcontrol-root
gemacht. Ergebnis der Extended self-test routine:

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status                  Re. LifeTime first_error
# 1 Extended offline Completed without error 00% 26278    -
# 2 Short offline    Completed without error 00% 26265    -
‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹

Short offline stammt von gestern.

Auszüge aus der:
›››››››››››››››
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:

  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail
Always       -       74

194 Temperature_Celsius     0x0022   103   097   000    Old_age
Always       -       40

196 Reallocated_Event_Count 0x0032   200   200   000    Old_age
Always       -       0

197 Current_Pending_Sector  0x0032   200   200   000    Old_age
Always       -       1

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age
Offline      -       0

199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age
Always       -       0

200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age
Offline      -       3
‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹

Sind 40° ok?
Current_Pending_Sector ist halt 1. Kriegt man das pending weg? smartctl
schreibt mir täglich die zuerst beschriebene Meldung in /var/mail/root.
Die 200 Multi_Zone_Error_Rate scheint mir erst kritisch zu werden, wenn
sie sich in kürzerer Zeit erhöht. (Liege ich da falsch?)

     Grüße, Gerhard


Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Peter Funk
Hallo Gerhard,

Das sieht doch noch ganz vielversprechend aus:

Gerhard Wolfstieg schrieb am Dienstag, den 26.02.2019 um 15:03:

>      Hallo Christoph, hall zusammen!
>
> Am Mon, 25 Feb 2019 15:57:03 +0100
> schrieb Christoph Schmees <[hidden email]>:
>
> > Vorgehensweise? Platte auswechseln.
> >
> > Wenn du es nicht glaubst, dann sieh dir mit GSmartControl die Attribute an und/oder mache den ausführlichen Selbsttest. ((geht auch mit smartmontools direkt, aber unhandlich.))
>
> ›››››››››››››››
> Den ausführlichen Selbstest habe ich jetzt mit gsmartcontrol-root
> gemacht. Ergebnis der Extended self-test routine:
>
> SMART Error Log Version: 1
> No Errors Logged
>
> SMART Self-test log structure revision number 1
> Num Test_Description Status                  Re. LifeTime first_error
> # 1 Extended offline Completed without error 00% 26278    -
> # 2 Short offline    Completed without error 00% 26265    -
> ‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹
>
> Short offline stammt von gestern.
>
> Auszüge aus der:
> ›››››››››››››››
> SMART Attributes Data Structure revision number: 16
> Vendor Specific SMART Attributes with Thresholds:
>
>   1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail
> Always       -       74
>
> 194 Temperature_Celsius     0x0022   103   097   000    Old_age
> Always       -       40
>
> 196 Reallocated_Event_Count 0x0032   200   200   000    Old_age
> Always       -       0
>
> 197 Current_Pending_Sector  0x0032   200   200   000    Old_age
> Always       -       1
>
> 198 Offline_Uncorrectable   0x0030   200   200   000    Old_age
> Offline      -       0
>
> 199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age
> Always       -       0
>
> 200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age
> Offline      -       3
> ‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹
>
> Sind 40° ok?
Laut Datenblatt kann diese Platte zwischen 0°C und 60°Celsius
betrieben werden.  Bei einem Laptop wären 40°C nicht ungewöhnlich.

Bei einem „richtigen“ Computer mit ordentlichem
Lüftungs-Entwurf des Gehäuses sollte die Temparatur jedoch
auf unter 35°C zu bekommen sein.  Es gibt Studien, die
gezeigt haben, dass eine um 5°C gesenkte Temparatur bereits
deutlich geringere Fehlerraten bringt.  Bei neueren flüssig
gelagerten Laufwerken soll das wohl nicht mehr so wichtig sein.

Bei unseren Servern haben wir im Durchschnitt Temperaturen um die
32°C laut den Sensoren der Platten. (Zum Vergleich: die Temperatur
kurz unter der Decke des Serverraumes beträgt ca. 24°C; Das ist
witzigerweise auch die Soll-Temperatur, die in unserer Klimaanlage
eingestellt ist ☺).

> Current_Pending_Sector ist halt 1. Kriegt man das pending weg?

Siehe meine E-Mail an diese Liste hier von gestern.  

Dort hatte ich das Vorgehen beschrieben.  Was ich nicht beschrieben
habe ist, was Du machen musst, falls der Pending Sector in der
freelist ist: Dann kannst Du die Meldung entweder einfach stumpf
ignorieren oder falls sie dich sehr stört, dann musst die Platte
einmal komplett voll schreiben z.B. mit dem Befehl::

    dd if=/dev/zero of=/tmp/vollmach_Datei ; rm /tmp/vollmach_Datei

> smartctl
> schreibt mir täglich die zuerst beschriebene Meldung in /var/mail/root.
> Die 200 Multi_Zone_Error_Rate scheint mir erst kritisch zu werden, wenn
> sie sich in kürzerer Zeit erhöht. (Liege ich da falsch?)

Der Wert ist für so viele Jahre Betriebszeit sehr gut.  
Da würde ich mir überhaupt keine Gedanken machen!

Liebe Grüße, Peter Funk
--
Peter Funk ✉:Oldenburger Str.86, D-27777 Ganderkesee; ☎:+49-179-640-8878
office✉: ArtCom GmbH, Haferwende 2, D-28357 Bremen, Germany
☎:+49-421-20419-0 <http://www.artcom-gmbh.de/>

signature.asc (180 bytes) Download Attachment
Reply | Threaded
Open this post in threaded view
|

Re: Verhaltensweise bei „unreadable sectors“

Gerhard Wolfstieg
Am Tue, 26 Feb 2019 16:26:33 +0100
schrieb Peter Funk <[hidden email]>:

> > Sind 40° ok?  
>
> Laut Datenblatt kann diese Platte zwischen 0°C und 60°Celsius
> betrieben werden.  Bei einem Laptop wären 40°C nicht ungewöhnlich.
>
> Bei einem „richtigen“ Computer mit ordentlichem
> Lüftungs-Entwurf des Gehäuses sollte die Temparatur jedoch
> auf unter 35°C zu bekommen sein.  Es gibt Studien, die
> gezeigt haben, dass eine um 5°C gesenkte Temparatur bereits
> deutlich geringere Fehlerraten bringt.  Bei neueren flüssig
> gelagerten Laufwerken soll das wohl nicht mehr so wichtig sein.

Das schien mir auch ein bißchen hoch – werde mich als Erstes drum
kümmern, die zu senken. Das Andere mache ich auch.

     Vielen Dank und Grüße, Gerhard