PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : IB-NAS4220-B Raid fliegt mir um die Ohren



SUECHTI
11.09.2008, 21:50
Hallo leute,


hab schon versucht zu meinem Problem was zu finden aber bisher irgendwie erfolglos.

Also ich hab mir vor ner Woche die Box gekauft mit 2 Platten (WD10EACS).

Raid 1 eingerichtet und funktionierte auch ganz prima. Dann von meinen anderen Externen Platten per FTP auf NASBox geschoben und ein Backup vom Laptop gezogen. Gestern abend wollt ich sie dann wieder ausmachen und sehe das das Festplattenlämpchen permanent leuchtet, denk ich mir nur so kann nich sein, --> weboberfläche und nachgeschaut "rebuilding RAID" dacht ich mir so hm ok, wer weis was das is lässtn erstmal machen.

Heute mach ich Platte an und sehe

Disk status:

The disk occur wrong. Please power off and exchange disk.

Zeigt aber beide Platten mit einen grünem Häkchen an, denk ich mir nur WTF!

Status der Platte:

1 Raw_Read_Error_Rate 0x100f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 188 188 021 Pre-fail Always - 7575
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 19
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000e 200 200 051 Old_age Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 57
10 Spin_Retry_Count 0x0012 100 253 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0012 100 253 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 19
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 4
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 929
194 Temperature_Celsius 0x0022 111 108 000 Old_age Always - 41
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 051 Old_age Offline - 0

nur sagt mir das relativ wenig, könnt ihr damit etwas anfangen? Im moment Rebuildet er das System mal wieder, ka was ich machen soll. Hab mir die Platte und Box eigentlich gekauft weil ich einen Permanenten Datenspeicher brauch der zuverlässig ist, aber ich glaub da hab ich den falschen gekauft :)

Ähm mal ne Frage am Rande, wo und wie bekomme ich raus welche Rev ich habe?

Firmware update hab ich mir ein neues gezogen aber solange das system lief wollt ich getreu dem Motto "never touch a running system" nichts ändern, aber nun habe ich wohl gelegenheit dazu.

Also wenn ihr noch mehr Infos braucht oder Ideen habt sagt bitte bescheid, wäre euch für jede hilfe Dankbar.


IB-NAS4220-B
2x1TB-WD-WD10EACS
GBIT LAN

ElektromAn
11.09.2008, 22:05
Hallo

Der Smart-Status der Festplatten sagt nichts aus.
Auch die Weboberfläche gibt keine genaue Info.

Besser ist der Kernel direkt.

Tippe
cat /proc/mounts
cat /proc/mdstat
ein


E-mAn

gmeyer
11.09.2008, 22:16
Hallo Suechti,

willkommen im Forum.

Um herauszufinden, welche Board-Rev du hast, musst du das NAS schon aufschrauben. Das Board ist beschriftet. Falls es noch Rev 1.1 sein sollte, schick das NAS bitte (ohne die Platten) zu Raidsonic zum Umtausch ein. Hinweise zum Ablauf findest du hier (http://forum.nas-portal.org/showthread.php?t=1246&highlight=boardtausch+raidsonic).

Falls es sich schon um Rev 1.2 handelt, spiel erstmal die aktuelle Firmware ein (2.6.0.IB.1.RS.1).

Gruß
Gerhard

SUECHTI
11.09.2008, 22:16
gehe jetz mal davon aus (da mir sonst nix andres bis jetz bekannt is, sry ;)) das du Telnet oder SSH meinst, dann spuckt er folgendes aus:

cat /proc/mounts
rootfs / rootfs rw 0 0
/dev/root / ext2 rw,nogrpid 0 0
/proc /proc proc rw,nodiratime 0 0
/sys /sys sysfs rw 0 0
usbfs /proc/bus/usb usbfs rw 0 0
/dev/md0 /system ext3 rw,data=ordered 0 0
/dev/md1 /mnt/md1 ext3 rw,data=ordered,usrquota,grpquota 0 0


cat /proc/mdstat
Personalities : [linear] [raid0] [raid1] [raid5] [multipath] [raid10]
md1 : active raid1 hdb2[1] hda2[2]
976398464 blocks [2/1] [_U]
[==>..................] recovery = 13.7% (134022528/976398464) finish=413.8min speed=33920K/sec

md0 : active raid1 hdb1[1] hda1[0]
104320 blocks [2/2] [UU]

unused devices: <none>

sieht wohl so aus als ob er rebuilden würde, aber im webdingens zeigt er es nicht an.
Danke dir schon mal.

gmeyer
11.09.2008, 22:25
sieht wohl so aus als ob er rebuilden würde, aber im webdingens zeigt er es nicht an.
ja, nur "cat /proc/mdstat" sagt die Wahrheit. Vergiss die Angaben der WEB-Oberfläche.

SUECHTI
11.09.2008, 22:52
ja, is doch aber recht blöd, wie soll denn dann "otto normalverbraucher" damit umgehen? für den isses warscheinlich garnich gedacht ;) die version die du beschreibst ist auch für das einpflegen eigener pakete wenn ich das richtig verstanden hab oder? werde ich aufspielen nachdem er das raid wieder geflikt hat und ich mal nach der Rev schauen konnte. er wird sicher erstmal wieder die ganze nach rödeln, sind ja noch 372 minuten. sollte kurz vor dem aufstehen also fertig werden. was gibts denn noch so für interesannte befehle für die NASBox Danke euch

speedport701
12.09.2008, 03:15
Tipp kauf Dir ST3500320AS (http://www.seagate.com/ww/v/index.jsp?locale=en-US&name=barracuda-7200-11-sata-3-0-gb/s-500-gb-hard-drive-st500320as&vgnextoid=c89ef141e7f43110VgnVCM100000f5ee0a0aRCRD&vgnextchannel=47f281f8c0f43110VgnVCM100000f5ee0a0a RCRD&reqPage=Model) oder ST3500320NS
(http://www.seagate.com/ww/v/index.jsp?locale=en-US&name=barracuda-7200-11-sata-3-0-gb/s-500-gb-hard-drive-st500320as&vgnextoid=c89ef141e7f43110VgnVCM100000f5ee0a0aRCRD&vgnextchannel=47f281f8c0f43110VgnVCM100000f5ee0a0a RCRD&reqPage=Model) Platten die machen im allg. am wenigsten Probleme.

Aber wie @gmeyer schon geschrieben hat ist die Board REV 1.2. schon entscheiden.
Son schau doch mal hier (http://de.nas-4220.org/index.php/Festplatten) vorbei dort findest du die meisten Info über die laufenden Festplatten.

SUECHTI
12.09.2008, 07:12
hm da steht das ja auch mit dem rebuilding raid system. in der tat habe ich 177GB am stück mal per ftp geschoben. wo sehe ich die CRC fehler?
heute morgen war er fertig mit rebuilden:

Personalities : [linear] [raid0] [raid1] [raid5] [multipath] [raid10]
md1 : active raid1 hdb2[1] hda2[0]
976398464 blocks [2/2] [UU]

md0 : active raid1 hdb1[1] hda1[0]
104320 blocks [2/2] [UU]

unused devices: <none>

hoffe nur das er beim nächsten neustart nich gleich wieder probleme macht ...

@speedport, meinst du ich soll meine platten zurückschaffen und mir die anderen kaufen? wäre zwar ne idee aber was mit den daten machen die momentan draufliegen.


werd heut mal drüber nachdenken und schauen ob ich rev 1.1 hab oder 1.2 ... hab aber eigentlich keine lust auf einschicken usw
danke erstmal :)

SUECHTI
15.09.2008, 12:29
also hab nun endlich nachgeschaut, Rev1.2 definitiv
neue Firmware drauf 2.6.0.IB.1.RS.1
am anfang ging es ohne probleme, nun schiebe ich aber wieder ein paar Daten rauf (mp3 Sammlung) und kurz danach fing er wieder an das RAID neu zu bilden. ist doch irgendwie merkwürdig, woran kann das liegen?
oder verstand ich bisher die funktionsweise eines RAIDsystems nur falsch?
Ich ging immer davon aus das wenn man was auf das RAID legt legt er es auf beide Platten gleichzeitig.
Funktioniert das hier anders? das er es erst auf eine legt und dann "synchronisiert"? und zwar nicht was neu dazugekommen ist sondern im ganzen?
habt ihr vielleicht noch ideen woran das liegen könnte, bzw könnt ihr meine Theorie belegen/wiedersprechen?

ElektromAn
15.09.2008, 21:46
Hallo

Die CRC-Fehler kannst du normalerweise nur auf der Systemkonsole (Serielle-Schnittstelle) oder per SMART abfragen.


smartctl -a /dev/hda


Wurde das RAID komplett neu aufgebaut ?? Oder nur für die Daten die neu auf der Platte gelandet sind.

Ich gehe mal davon aus das aus performance Gründen die Blöcke er mal geschrieben werden. Und danach das RAID synchronisiert wird. Von der Kernelseite weiß ich für jeden "Cluster" ist ein "Valid-Bit" vorhanden.

E-mAn

hobi
16.09.2008, 12:32
am anfang ging es ohne probleme, nun schiebe ich aber wieder ein paar Daten rauf (mp3 Sammlung) und kurz danach fing er wieder an das RAID neu zu bilden.


rein aus interesse: Kannst du mal schauen wieviel Platz du auf dem Raid inzwischen verbrauchst?

Ich habe ähnliche Probleme - und ich hatte/habe das Gefühl, dass die Probleme erst angefangen haben, als ich über 100 GB auf den Raid drauf hatte ... kann das bei dir auch so sein?

Hobi

SUECHTI
16.09.2008, 22:08
hi, danke für eure ideen, also mittlerweile habe ich über 58% der 1TB verbraucht also 562 GB um genau zu sein.
@ElektromAn:
er synchronisiert alles komplett neu, jetzt hat er mal zur abwechslung die eine Platte (hdba) als defekt mit ausrufezeichen im web angezeigt, kann ich das irgendwie auf der konsole nachvollziehen?

cat /proc/mdstat
Personalities : [linear] [raid0] [raid1] [raid5] [multipath] [raid10]
md1 : active raid1 hda2[2] hdb2[1]
976398464 blocks [2/1] [_U]
[>....................] recovery = 1.7% (17034240/976398464) finish=462.5min speed=34562K/sec

md0 : active raid1 hda1[0] hdb1[1]
104320 blocks [2/2] [UU]


was mich auch wundert grad ist das die eine Festplatte anscheinen nur 104K Blocks hat und die andere 976Mio. normaler weise sind beide Zahlen gleich groß.

aber du hast schon recht die CRC rate sollte man sich genauer anschauen:

199 UDMA_CRC_Error_Count 0x0032 200 192 000 Old_age Always - 194

sind nun 194 viel oder wenig? (die andere Platte hat 0)
resümé: hda ist defekt oder? austauschen würd ich sagen?

also was mir in letzter zeit passiert ist ist voll komisch:

am Montag habe ich wieder etwas rübergeschoben und nach etwa 34 GB hat er wieder "raid synchronisiert" (so nenn ichs jetz einfach mal) dachte mir aber raufladen per ftp klappt immernoch also weiter
bei 64 GB upload (also weidere 30GB) war dann feierabend, kein ping garnichts mehr, neustart, kein ping möglich, bekomme auch keine IP usw (is ja klar)
heute abend hats mich gepackt und ich hab mir gesagt probierst also jetz den total reset und wenns heute abend nich geht schaffstes morgen zurück, kann ja nich sein. (hatte vorher auch schon mit dem "reboot" probiert)
wollte ich es also anmachen, gingen zwar die Platten an aber weiter passierte nichts, auch keine lampe für OS ging an. neustart ging soweit.
nach dem reset auf Werkseinstellungen war ich erstaunt, platte nicht über normale IP erreichbar (.1.1) also hab ich die von mir eingestellt nochmal genommen, und siehe da, alles da alle user alle freigaben alles komisch he.
auch das RAID funktionierte ohne probleme. ich also wieder ahha platte geht kannstse nutzen :)
war aber fehler: nach weiteren 16 GB upload fing er wieder an das RAID zu rebuilden, diesmal so wie oben mit den wenigen blocks. (sehe aber grad dsa war beim letzten mal auch schon so.

mit dem CRC fehlercode macht mir jetz schon sorgen, aber auf platte sollte garantie sein, habe sie nichtmal eine Woche (kann ich gleich mal testen wie das alles funktionert "falls mal eine platte ausfallen sollte" ;)


EDIT
ich stell grad fest das der Upload schneller ist wenn sich das raid rebuildet ... kann das sein? oder stimmen meine messprogramme nich richtig?