File system clustering su debian: odi et amo 2° parte (Barlumi di funzionamento?)

Rieccoci alla seconda parte della triste vicenda su file system GFS su Debian.

Con la storia precedente vi avevo lasciati su quella fantastica schermata di kernel panic.

Appena arrivato in web farm quindi, avevo subito intuito che il pomeriggio sarebbe stato più lungo e faticoso del previsto, decido quindi di togliermi il giubbotto, agguantare una sedia e mettermi comodo.

Non avendo ben molto da fare incasso il pugno e riavvio la macchina: 1 – 0 Le macchine stanno vincendo.

Al riavvio noto con (dis)piacere che il demone open-iscsi viene si avviato, ma scade in un bel timeout non riuscendo a contattare lo storage, lasciando il boot appeso per un minuto scarso, e me a ravanarmi la capa cercando di capire perchè al secondo tentativo (automatico dopo il timeout) invece la procedura si conclude con successo…

"BAH…sarà da cambiare la priorità agli script di init..poi vedo"

…parte open-iscsi, vengono avviati gli altri demoni, arriva il turno di gfs2….

[ 31.133223] BUG: soft lockup – CPU#0 stuck for 61s!

"ennocazzo allora è vizio questo"

…riavvia di nuovo la macchina, aspetta che open-iscsi si decida di lavorare, aspetta il turno di gfs2…CTRL+C

"fanculo ti ho fregato"

…il boot prosegue, debian sale. Bene adesso rimane da capire PERCHE’ prima open-iscsi ed adesso GFS2 mi fulminano la macchina, controllo le configurazioni, sembrano ok; la rete, ok; va beh riavviamo il demone a manella e speriamo…

:~# /etc/init.t/cman restart
Warning! cman daemon not yet started, trying to start….

Andato O_o

"questa è bella, perchè al boot non parte ed a macchina appena avviata parte??!"

…controllo se tutto è andato bene, volume montato, cluster "joinato", dmesg muto, syslog muto, apparentemente sembra che tutto vada bene si vedono i primi barlumi di funzionamento.

Per esserne sicuro procedo con un altro reboot della macchina..non si sa mai: solita solfa, attendo i demoni e quando arriva il turno di gfs2:

[ 31.133223] BUG: soft lockup – CPU#0 stuck for 61s!

Sembra che vada in timeout quando provi ad entrare dentro al cluster: 2 – 0 Le macchine raddoppiano…

"va bene se mi dici che è un bug probabilmente lo sarà…"

Inizio a surfare il web armato del buon google e l’unica fonte utile che trovo è per l’appunto un bug aperto presso il launchpad di Red Hat (sembra che sto minchia di gfs lo usino in 2 forse 3 al mondo…che culo), dove ad un utente che lamentava lo stesso problema, ma su RHEL, è stato consigliato di upgradare il pacchetto (rilasciato a seguito della sua segnalazione).

"evvai sono fottuto…dove lo prendo un pacchetto più aggiornato adesso"

N.B. SI ho già vagliato l’ipotesi di compilare gfs2-tools a manina e NO è stata la mia risposta, primo perchè non ne avevo voglia, secondo perchè dalla documentazione vista sembra che la compilazione sia una procedura lunga e tortuosa.

come se non bastasse, su SID (avevo vagliato un eventuale pinning dei pacchetti), il pacchetto in questione è rimasto alla stessa versione, ringraziamo mamma debian…

sconsolato e con le mani legate telefono al capo con la coda tra le gambe:

Boss: Si
Io: non ho buone notizie, sembra che il pacchetto gfs2-tools sia buggato…
Boss: e quindi?
Io: e quindi ciccia dobbiamo trovare un altro metodo gfs2 è troppo inaffidabile,
senza contare che su 4 macchine sicuramente non funzionerà.
Boss: Ale devi trovare la soluzione, liferay deve girare su 4 macchine, vedi tu…
[click]

Mentre nella mia testa c’era una voce insistente e persistente che diceva "dai le dimissioniiiiiii, manda tutto a puttane ed apri un bar in brasileeeee" mi resi conto che erano le 19:00 passate e quindi ora di tornare a casa, raccattai la mia roba, misi a posto i ferri e mi incamminai verso la mia macchina…più pensieroso che mai…


Articoli (forse) correlati:

  1. File system clustering su debian: odi et amo 3° parte (La soluzione finale)
      Terza (ed ultima?) puntata della tragedia commedia che mi vede (purtroppo) protagonista....
  2. File system clustering su debian: odi et amo 1° parte (l’incubo del kernel panic)
      Storia di un povero, disperato sysadmin (me) alle prese con una clusterizzazione complessa e difficile, nonchè....non funzionante :(...
  3. Creiamo un server DNS con Bind [Parte 2.1° - I file di zona e la risoluzione diretta]
    Ieri vi ho spiegato cos'è e come funziona un server dns a seconda della tipologia alla quale appartiene... durante il...
  4. Creare un pacchetto debian – parte 3°
    Siamo arrivati alla fine di questo set di guide sulla pacchettizzazione debian dei sorgenti linux... ...
  5. Creiamo un server DNS con Bind [Parte 2.2° - I file di zona e la risoluzione inversa]
    Ecco come promesso, la seconda parte della guida ai file di zona e la risoluzione nome host... Partiamo con i...
    • M0rF3uS
      mmmm
      stiamo parlando di

      mmmm


      stiamo parlando di debian non di ubuntu eheheh

    • M0rF3uS
      stasera cercherò di

      stasera cercherò di scrivere come ho risolto e poi farò ovviamente l'how to relativo

    • Driver2000
      Anche noi all'università

      Anche noi all'università abbiamo avuto gli stessi problemi nel mettere su GFS su Debian ed ancora nn abbiamo trovato una soluzione!! se ce l'hai facci sapere! che il nostro LiteCloud deve iniziare a girare!

    • M0rF3uS
      pazienza e fede

      pazienza e fede ;)

    • T~d~L
      E dai, voglio sapere come è

      E dai, voglio sapere come è finita... :-)

    blog comments powered by Disqus