Tolerância a falhas

Keywords: Tolerância a falhas, Falha, Erro e Defeito, HP, Hardware, IBM, Sistema de alta disponibilidade, Software, Plano de Contingência, Plano de Continuidade de Negócio

Sistemas tolerantes a falhas são dispositivos que foram desenhados e construídos para operar com sucesso mesmo quando houver uma falha ou partes com defeito. O termo é mais comumente usado para descrever sistemas computacionais desenhados para recuperar-se da falhas em pouco ou sem perda de tempo, tanto no que se refere a hardware ou no software que roda nele.

Tolerância a falhas a nível de Hardware é um problema bem entendido. Consiste em incluir duas ou mais cópias idênticas de cada peça, construídas de uma forma que a peça reserva assuma em caso de quebra. Também requer que as peças com defeito possam ser trocadas por novas enquanto o sistema ainda está no ar.

Normalmente o tempo entre as falhas na mesma peça é longo o suficiente que os operadores/administradores tenham tempo o suficiente para trocar/consertar os dispositivos com problemas antes que a peça reserva falhe também.

Deve ser notado que existe diferença de sistemas tolerantes a falhas, sistemas que possam continuar ativos mesmo que uma falha ocorra e sistemas que raramente têm problemas. Por exemplo, se o fornecimento de energia elétrica na sua casa for muito confiável então ele é pouco sujeito a falhas. Mas se um caminhão derrubar o poste em que a energia da sua casa estiver ligada, o fornecimento pára completamente.

Exemplos de sistemas tolerantes a falhas são os servidores de rede. Servidores de rede de qualidade como os que a Dell, IBM e HP fabricam, têm fontes de alimentação, discos e até memória redundantes. Estes componentes avisam antes de falhar e em caso de falhas podem ser trocados com o sistema ativo.

Veja também

Keywords: Tolerância a falhas, Falha, Erro e Defeito, HP, Hardware, IBM, Sistema de alta disponibilidade, Software, Plano de Contingência, Plano de Continuidade de Negócio