Ainda sobre o SMR em discos da Western Digital Red!

Olá a todos,

Este é um post suplementar esta semana, mas achei que também tinha que contribuir para este tema que já começou a criar problemas a utilizadores de NAS.

Recentemente tem sido referido em muitos sites da especialidade, que a Western Digital (WD) começou a utilizar nos seus discos WD RED a tecnologia SMR.

Esta tecnologia é utilizada para se obter um aumento exponencial em capacidade por prato de disco mas devido a forma de leitura/escrita é uma tecnologia que penaliza a escrita de dados no mesmo disco.

O que é a tecnologia SMR?

In: https://www.seagate.com/pt/pt/tech-insights/breaking-areal-density-barriers-with-seagate-smr-master-ti/

A SMR ou Shingled Magnetic Recording (gravação magnética em setores sobrepostos) da Seagate está ultrapassando os limites com novas densidades de área e aumentando a capacidade em mais de 25% com a maximização do número de trilhas por polegada em um único disco.
smr shingled magnetic recording - vídeo

Tradicionalmente, o espaçamento das trilhas encolhia com o tamanho dos elementos de leitor e gravador da cabeça de gravação (Figura 1).


Figura 1. Espaçamento de trilhas convencional

Os elementos de leitor e gravador dos HDDs de gravação magnética perpendicular atuais atingiram seu limite físico. Sem tecnologias de gravação futuras, é impossível reduzir ainda mais seu tamanho e os das trilhas que eles leem e gravam.

A SMR alcança densidades de área mais altas aproximando as trilhas. As trilhas sobrepõem-se umas às outras, como telhas em um telhado, possibilitando que mais dados sejam gravados no mesmo espaço. À medida que novos dados são gravados, as trilhas da unidade são aparadas, ou sobrepostas. Como o elemento de leitor na cabeça da unidade é menor do que o de gravador, todos os dados ainda podem ser lidos a partir da trilha aparada sem comprometer a integridade ou a confiabilidade dos dados. Além disso, os elementos de leitor e gravador tradicionais podem ser usados para a SMR. Essa tecnologia não exige que um capital de produção novo significativo seja investido em um produto e possibilitará que os HDDs SMR ajudem a manter os custos baixos.


Figura 2. Espaçamento de trilhas viabilizado pela tecnologia SMR

Quando um usuário regravar ou atualizar informações existentes, as unidades SMR precisarão corrigir não só os dados solicitados, mas quaisquer dados nas trilhas seguintes. Como o gravador é mais largo do que a trilha aparada, todos os dados nas trilhas adjacentes são apanhados e, como resultado, deverão ser regravados posteriormente (Figura 3). Assim que os dados na trilha seguinte são regravados, a unidade SMR deve corrigir os dados na trilha subsequente, repetindo o processo até o final da unidade.


Figura 3. Sobreposição do gravador em trilhas aparadas

Por esse motivo, a SMR agrupa as trilhas em bandas (ou setores), onde o processo de sobreposição é interrompido (Figura 4). Com isso, uma unidade SMR pode gerenciar melhor essas regravações. Isso também aprimora o desempenho de gravação da unidade, agrupando as trilhas em bandas que otimizam o número de trilhas que precisam ser regravadas.


Figura 4. Estrutura de bandas da SMR.

Resumindo, em troca do aumento de densidade por prato de disco, é penalizada a escrita, e consequentemente a latência nos acessos e escritas ao disco.

Este é um tema amplamente falado, em redes sociais e sites da especialidade, onde têm sido apontadas opiniões que variam entre o “não se nota nada no meu NAS” até ao “isto está inutilizável”.
Decidi portanto demonstrar graficamente o comportamento de um array onde sei que existe um disco destes, com tecnologia SMR, com discos que não tem.
Sei que não é uma configuração optimal – deve-se sempre utilizar discos do mesmo fabricante, mesmo modelo e se possível mesma firmware – num array, mas a diferença de comportamento é tanta que para efeitos de teste num mundo real, onde é comprado um disco novo para aumentar a capacidade do NAS, a experiência será efetivamente demonstrativa.

Na pratica é isto que acontece:

Este é um gráfico da latência das I/O Queues dos discos num array em RAID. O da0, da1, da3 a da7 são discos Toshiba N300 7200rpm de 6TB. O da2 é um disco da WD Red 7200rpm.
É perfeitamente visível a latência do disco de SMR. Como estamos a falar de um ambiente de RAID, todo o array será severamente penalizado por esta quebra de performance.

Porque isto é mau?

Em primeiro lugar a velocidade. Este disco é LENTO para escrita.
Segundo a WD quebrou a confiança num produto que era a norma para NAS. Quem pensava em discos para NAS, pensava em WD RED’s: Rápidos, resilientes e de confiança.
Depois e para piorar tentaram desculpar-se dizendo que um produto caro como a linha RED afinal é perto do entry level, e que existe OUTRO produto ainda mais caro, que não sofre da penalização na velocidade de escrita.

No mundo real, os aumentos de latência nos discos, irão causar uma lentidão ENORME em plataformas com grande IO – por exemplo quando colocados em NAS/SAN que suportem ambientes de virtualização , base de dados, produção de video, etc – ao ponto de se notar, e muito, com a degradação respetiva da experiência ao utilizador final que consuma o que lá está armazenado, coloque lá novos dados, ou utilize como live storage para projetos on-going.

Todo este celeuma está a tomar uma proporção tal, que a própria Segate que esteve por detrás do desenvolvimento da tecnologia SMR já veio a publico dizer que o SMR não tem lugar nos discos que são utilizados em ambientes de alto IO/NAS, o que se pode verificar nos discos IronWolf Pro deles (que estão dentro do mesmo price range para altas capacidades).

Existem soluções para esta lentidão, como por exemplo ambientes em bcache (que já foi demonstrado aqui), mas implica sempre o gasto de portas SATA/SAS extra no vosso equipamento, custo suplementar no hardware a adquirir.

Infelizmente é uma quebra grave de confiança nos produtos deles, quebra que irá agora demorar alguns anos a ser recuperada.

Resumindo, a tecnologia SMR  é uma tecnologia eficiente para atender à necessidade imediata por capacidade mais alta. No entanto esta tecnologia não foi feita para velocidade.
É um produto perfeitamente aceitável, desde que o consumidor final, tenha conhecimento do que está a comprar e da penalização que isso irá causar a velocidade do seu sistema NAS, DAS ou equivalente.
Portanto verifiquem quais os produtos afetados, e verifiquem se existem na vossa próxima compra.

Até ao próximo post!

Abraço
Nuno

Update: O Mario Oliveira, gentilmente enviou-se a lista atualizada dos discos que se conhecem para já ser SMR: https://www.ixsystems.com/community/resources/list-of-known-smr-drives.141/