A EMC , anunciou o primeiro appliance de Big Data Analytics unificado da indústria, o EMC® Greenplum® Data Computing Appliance (DCA), com um redesenho de sua arquitetura escalável, orientada a Analytics, utilizados para a análise estatística, modelagem preditiva e aprendizagem de máquina. Volumes explosivos de dados, novos tipos de dados e desafios competitivos crescentes levaram a mudanças radicais nas tecnologias analíticas e a uma nova abordagem aos dados explorados. Arquiteturas de antigos legados para a gestão e análise de dados são inerentemente impróprios para volumes atuais na escala Big Data. A combinação do crescente volume de dados, a diversidade ampla de tipo e estrutura, bem como a necessidade de matemática complexa para desbloquear o valor dos dados sobrecarregou as arquiteturas tradicionais e levou ao surgimento de uma nova classe de plataformas analíticas.
Para atender a estas prioridades, a nova edição do EMC® Greenplum® Data Computing Appliance (DCA) Unified Analytics Platform (UAP) permite a análise de dados estruturados e não estruturados, em conjunto dentro de um único dispositivo integrado. O novo DCA integra Greenplum Database para análise otimizadas com SQL, Greenplum HD para processamento baseado em Hadoop e a inteligência de parceiros com seus softwares de ETL e aplicações analíticas dentro de um único appliance. A solução integrada expande as capacidades analíticas do sistema e a flexibilidade da solução a uma fração do custo total de propriedade do "portfólio de produtos" concorrentes da Oracle, IBM ou Teradata.
Preço/Desempenho líder da indústria
O novo DCA oferece uma arquitetura de processamento paralelo em grande escala (MPP, sigla em inglês de massively parallel processing), enquanto fornece a taxa de carga de dados mais rápida e a melhor relação preço/desempenho do setor - sem a complexidade e as limitações de hardware proprietário. Fornece melhora de +70% no desempenho em relação à geração anterior em carga e leitura em disco, e aumento de 100% de desempenho para cargas de trabalho de consulta simultâneas, o que mantém a Greenplum firme como a líder de desempenho analítico da indústria para grandes cargas de trabalho mistas. As empresas podem crescer seus DCAs conforme sua demanda por capacidade de processamento aumenta, ou conforme a sua exigência de análise evolui.
Integração de armazenamento EMC para alta disponibilidade
O Greenplum DCA fornece a mais alta disponibilidade dos dados por meio de uma integração simples com as soluções EMC líderes do mercado de armazenamento. Ao integrar o DCA com sistemas de armazenamento de desduplicação EMC Data Domain oferece backup e recuperação para os módulos Greenplum Database a taxas de até 13 TB/hora, com serviços de replicação para Data Centers secundários para ambientes de Disaster Recovery .
O novo DCA apresenta tanto armazenamento com tripla redundância pra HDFS em servidores com discos do tipo “direct-attach” quanto a integração com o NAS de Scale-Out do EMC Isilon para fornecer também armazenamento em HDFS, que proporciona proteção de dados usando snapshots, espelhamento, backup, recuperação e replicação. O Isilon também simplifica o carregamento de dados e permite escala independente de recursos de computação e armazenamento. Ao utilizar o Data Domain e o Isilon, os clientes da EMC podem aproveitar sua experiência e investimentos existente para garantir a proteção de dados da empresa, à medida que eles se movem para Big Data Analytics.
Para Josh Klahr, vice-presidente de produtos da Greenplum, "As empresas que desejam fazer investimentos estratégicos em uma plataforma de Big Data precisam considerar a amplitude das capacidades necessárias para uma solução completa - ingestão de dados de alta velocidade, suporte para dados estruturados e não estruturados, interfaces para os cientistas de dados, bem como usuários de inteligência de negócios, e a capacidade de escalar horizontalmente, conforme os volumes de dados crescem. Os clientes podem tirar proveito do novo DCA para aumentar o desempenho do Greenplum Database para o processamento de consultas SQL e carga de dados de melhor nível de resposta na categoria, e também explorar as capacidades inovadoras de distribuição Hadoop (GPHD) da Greenplum. Com o lançamento da Edição Unified Analytics Plataform (UAP) do DCA, nós continuaremos com a nossa história de inovação - com melhores opções para implementações de Hadoop que potencializam o armazenamento de NAS de scale-out do EMC Isilon, suporte otimizado ecossistema de parceiros, incluindo parceiros como SAS e Informática", finaliza.