never buy a LSI

Heute ist es mir ein Bedürfnis folgende Begebenheit darzustellen.

Ich hatte die Aufgabe einen NAS-Server zusammenzustellen. Bin eigentlich ein eingefleischter Adaptec-Jünger, aber man muss ja mal was neues ausprobieren.

Eine längere Suche ergab den LSI-9361-8i als netter Kandidat – noch schnell ein paar erprobte NAS-Platten dazu und fertig ist der NAS-Würfel…

Dachte ich – was bei Adaptec kein Problem ist (ich hab die selben Platten in mehreren anderen Servern verbaut) führte hier zu einer Offenlegung von schlechter Servicequalität.

Nach dem Zusammenbau ergaben die ersten Tests dass der Server immer wieder stockte – zwischendurch nette Performance, aber es waren Pausen von 3-5 Sekunden, die sich merkbar in der Gesamtperformance darstellten.

Die Log´s zeigen dass das PD –0 ein Problem hätte. Hmmmm – neue Platten ? Na gut – Reihenfolge der Platten getauscht. Selbes Problem. Kabel getauscht – selbes Problem.

Nachdem ich die Firmware vom Server und Controller auf die letzte Version gehoben hatte, gab es noch immer keine Besserung.

Also – Mail an Support….

Trotz des Hinweises dass ich die Reihenfolge der Platten sowie die Kabel getauscht hatte, kam die Aufforderung die Platte zu tauschen und mit einem Tool von LSI das System auslesen und das Ergebnis hochladen.

Nachdem ich doch sehr paranoid bin, hab ich mir das tar.gz vorher angesehen. Und ich hatte recht – kopieren die doch ganz frech die /etc/shadow inkl. Backup der Shadow in das File.

Als ob das irgendeinen Zusammenhang zum Problem hätte. NÖ – meinen Passworthash kriegt ihr nicht. Kurzerhand die shadow wegkopiert und das Kennwort auf „“ gesetzt – Tool nochmal laufen lassen und hochgeladen.

Antwort vom Support: Ihre Platten sind nicht auf der „Compatibility list from LSI“ – siehe da. Tatsächlich war die Ultrastar gelistet die Deskstar-NAS nicht ….

Hat man da Worte ? Jetzt bin ich wirklich schon ein Urgestein, aber bei Adaptec kam das bis jetzt noch nicht zum vorschein – ja – OK – bei billigen Platten hatte ich auch schon mal Probleme, aber bei höherwertigen (bei mir HGST) Platten gab es noch nie ein Problem….

Sage und schreibe 3 mal hab ich noch geantwortet mit diversen Argumenten und versucht den Support davon zu überzeugen, dass es in egal welcher Konstellation zur selben Fehlermeldung kommt. „PD –0 had a problem“ => Physisches Gerät 0 hat ein Problem…..

Ich (!) vermute ein Firmware-Problem – unterstützt wird meine These durch den Fakt, dass im Changelog der Firmeware einige Issues gelistet sind die gefixt wurden. Warum sollte das nicht ein Problem sein, dass vermeindlich zwar behoben ist – aber halt dann doch nicht. Beispiele gibt es in der Vergangenheit genug dass ein Fix nicht alles behoben hat, bzw. andere Fehler erzeugte…

Einen Kommentar bekam ich noch:

Thomas,

NAS drives still do not use the error recovery of Enterprise drives.

From the western Digital web site:

When an error is found on a desktop edition hard drive, the drive will enter into a deep recovery cycle to attempt to repair the error, recover the data from the problematic area, and then reallocate a dedicated area to replace the problematic area. This process can take up to 2 minutes depending on the severity of the issue. Most RAID controllers allow a very short amount of time for a hard drive to recover from an error. If a hard drive takes too long to complete this process, the drive will be dropped from the RAID array. Most RAID controllers allow from 7 to 15 seconds for error recovery before dropping a hard drive from an array. Western Digital does not recommend installing desktop edition hard drives in an enterprise environment (on a RAID controller).

Critical: WD Black, WD Green, and WD Blue hard drives are not recommended for and are not warranted for use in RAID environments utilizing Enterprise HBAs and/or expanders and in multi-bay chassis, as they are not designed for, nor tested in, these specific types of RAID applications. For all Business Critical RAID applications, please consider WD’s Enterprise Hard Drives that are specifically designed with RAID-specific, time-limited error recovery (TLER), are tested extensively in 24×7 RAID applications, and include features like enhanced RAFF technology and thermal extended burn-in testing.

From the WD NAS page:
* Business critical RAID environments – Please consider WD Network Hard Drives for all multi-bay consumer NAS environments up to 5 bay chassis.
WD Desktop Mainstream hard drives are not recommended for and are not warranted for use in RAID environments utilizing Enterprise HBAs and/or
expanders and in multi-bay chassis, as they are not designed for, nor tested in,these specific types of RAID applications.

For prompt assistance, please call us at 1 800 633-4545
or email tech.support@avagotech.com

Thank you,
xxxxxxx xxxx,
Technical Support Engineer
Data Center Solutions Group

Avago
4165 Shackleford Road
Norcross, GA 30093

OK – Frage: Was interessiert mich das Statement von WD ? Ich hab HGST-Platten und damit gute Erfahrungen …..

Na gut – einige Tage verzweifeltes Grübeln später hab ich mich entschlossen LSI noch eine Chance zu geben. Ich bestellte nochmal 4 * 4TB HGST Ultrastar – die in der „compatibiliy list from LSI“ aufgelistet sind.

Einige Tage später kamen die Platten an – eingebaut  – und ? Siehe da : selbes Ergebnis !

Diesen Umstand per eMail an mein Ticket geschickt und auf Antwort gewartet. Nachdem am nächsten Tag keine Antwort kam (bis dato kam die Antwort immer innerhalb eines Tages), hab ich mal auf der Webseite. Siehe da – mein Ticket ist geschlossen – ohne Information. Sprachlosigkeit macht sich breit ….

Also – ein neues Ticket bei LSI erstellt. Wieder alles reingeschrieben – auf Antwort warten.

Jetzt glaubt mir wahrscheinlich keiner was in der Antwort stand:

Thomas,

Most of the errors that are happening are on Slot 0 :
<Fehlerzeilen entfernt>
If this drive has been replaced more than 1 time, then it is a cable or backplane issue. If the cable has been replaced, replace the backplane.
For prompt assistance, please call us at 1 800 633-4545
or email tech.support@avagotech.com

Thank you,
xxxxxxx xxxxx,
Technical Support Engineer
Data Center Solutions Group

Avago
4165 Shackleford Road
Norcross, GA 30093

Meine Hinweise dass es eventuell die Firmeware sein könnte, da ich die Kabel und die Platten und den Treiber des Controllers ausgeschlossen hatte, interessierte den Support überhaupt nicht.
Auch dass der Controller keine Backplane hat und die Platten direkt (über die schon getauschten Kabel) angeschlossen sind, wurde vollständig ignoriert …
So nebenbei hab ich in einigen Foren noch ähnliche Meldungen gelesen, die auch nicht gefixt werden konnten.

Meine persönliche Zusammenfassung: Genug Lehrgeld gezahlt – Controller mit Verlust zurückgegeben und anderen Controller bestellt. (Ihr dürft raten welcher Hersteller es wurde 😉 )
Mag sein dass die Controller für andere tauglich sind, aber im Falle eines Problems einen dermaßen inkompetenten Support zu haben ist mehr als ein Armutszeugnis. Ich hab persönlich habe andere Vorstellungen wie Kundensupport auszusehen hat – insbesondere da ich selbst schon Unternehmen beraten habe wie der Support ausgestattet sein soll.

Liebe Leute bei LSI : So nicht …

Daher auch der Titel – möchtet ihr nicht nur coole Prospekte, sondern auch coole Techniker die bei Problemen zur Verfügung stehen und den Kunden ernst nehmen, dann seit ihr (auch) bei dieser Firma schlecht beraten.

Was nicht heißen soll, dass es bei anderen großen viel besser ist. Leider ist das gerade bei großen Unternehmen sehr verbreitet.

Meine Empfehlung die nicht so ganz dramatisch ist: Beim geringsten Anzeichen von Problemen mit dem Lieferanten Kontakt aufnehmen. Gibt es den Originalkarton noch und man kann das ganze „wie Original“ zurückschicken, sind meiner Erfahrung nach die Lieferanten sehr gnädig…. Meistens …. Manchmal …. zumindest bis jetzt 😆

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert