Please wait...

Our Blog

Qual a técnica para armazenar petabytes de dados?

datacentre

No último post, falei sobre quantos dados o experimento LHC do CERN gera a cada ano: 15PB ou 15.000.000GB por ano. [leia aqui]

Hoje vamos nos aprofundar mais nas técnicas que são utilizadas para administrar essas quantidades de dados. Perceba que o objetivo é esclarecer de forma bastante didática, os aspectos envolvidos nessas técnicas mas sem cobrir todas as possibilidades que estão aquém do objetivo dessa matéria.

Um pouco de história

Para quem como eu não é tão novo, deve lembrar que a alguns anos atrás os mainframes reinavam absolutos no processamento de grandes massas de dados. Os mainframes surgiram em 1946 e de lá para cá vem sendo aperfeiçoados e  ainda são utilizados em muitas aplicações.

Com a popularização do “Personal Computer” ou PC e da rede e mais tarde a World Wide Web ou Internet, surgiu a possibilidade de agregar o poder computacional de vários computadores através da rede para o processamento de dados. Essa técnica ficou conhecida como Grid Computacional. A ideia é usar a possibilidade dos computadores se comunicarem para apresentar a eles um grande problema a ser resolvido, esse grande problema é quebrado em problemas menores e enviado, pedaço à pedaço, aos computadores participantes. É utilizada, por exemplo, para cálculos complexos e análises climáticas.

Saiba mais sobre uso de Grids Computacionais no Brasil

Resumindo: a técnica de grid computacional utiliza-se de uma grande quantidade de computadores para lançar mão de seu poder de processamento agregado na solução de problemas complexos.

A parte do armazenamento dos dados

Com o armazenamento de dados, técnicas semelhantes às utilizadas no processamento foram criadas. Uma dessas técnicas é conhecida como LoAN – Logistical Area Network. Através dessa tecnologia, é possível consolidar, ou seja, agregar os dispositivos de armazenamento de computadores (normalmente hard disks) através de algoritmos de software sofisticados que aplicam regras usadas em logística de mercadorias no cenário computacional levando, por exemplo, em conta a localização geográfica, velocidade de link, tempo dentre outras variáveis para gerenciar o armazenamento dos dados.

Hoje em dia, é comum ouvirmos esse tipo de técnica com o nome de “Cloud Storage” ou “Armazenamento em Nuvem”. A verdade é que nem sempre a técnica aplicada utiliza conceitos como a LoAN. Existem fornecedores que, apesar de chamar seu produto de Cloud Storage, oferecem aos clientes uma solução de armazenamento tão antiga quanto os primeiros mainframes: o protocolo FTP.

Qual é a técnica que o Projeto LHC utiliza?

Armazenar dados como o do projeto LHC só é viável através de técnicas de virtualização de armazenamento como as técnicas LoAN. Existem algumas soluções e todas elas baseiam-se na premissa de agregar os dispositivos de armazenamento de vários computadores, normalmente computadores “commodity“, ou seja, baratos e com HDs SATA.

A segurança dos dados nesse tipo de plataforma, como as políticas de RAID, são feitas através do software que administra a chamada “malha de armazenamento” que compõe todo o sistema.

Porque eles não utilizam armazenamento tradicional?

Imagine que você tivesse que armazenar os 15PB anuais gerados pelo experimento LHC e não só isso, que tivesse que distribuir esses dados para 35 países diferentes a kilometros de distância.

Em 2009, se você optasse por uma solução utilizada atualmente por empresas no mundo todo, você teria o seguinte orçamento  para 1 PB (um petabyte):

Perceba que fica inviável, mesmo para um projeto do porte do LHC com bilhões de dólares investidos, todo ano gastar o equivalente a US$ 37milhões anuais com storage! Observação: valor baseado na média dos três principais players do mercado de storage da lista.

Empresas podem se beneficiar de tecnologias como LoAN?

Sem dúvida! As empresas que precisam armazenar grandes quantidades de dados (e elas estão se dando conta o que a palavra “grande” significa), podem com toda a certeza, utilizar os benefícios que a virtualização oferece. No próximo artigo, vou explorar quais alguns meios das empresas utilizarem todo o potencial que existe nessa “nova onda” no mercado de armazenamento de dados.

A ser continuado...

Sobre o autor

[staff name=”Fabio Gomes Ferreira” position=”Co-fundador e Diretor de Operações” img=”http://nevoanetworks.com/wp-content/uploads/2012/10/Fabio-Blog.jpg”]
Formado em Sistemas de Informação pela Universidade Paulista com especialização em Gestão de Projetos pela UNICAMP e pós-graduado em Gestão Estratégica de TI pelo IBTA. Atualmente é diretor da Nevoa Networks, tendo 20 anos de experiência na área de Tecnologia da Informação, grande parte prestando consultoria em soluções nas áreas Financeira, ERP, Supply Chain e Virtualização.
[/staff]

[spacer size=”25″]

Fundada em 2005 a Nevoa Networks é pioneira no mercado brasileiro em desenvolvimento de soluções de armazenamento virtualizado, tecnologia que permite a implantação de Cloud Storage em ambientes corporativos e data centers comerciais. Sua tecnologia torna mais acessível infraestruturas de capacidade ilimitada para organizações que geram e movimentam grandes volumes de dados.

Para saber mais…

Related Posts Plugin for WordPress, Blogger...

Deixe uma resposta