Automação predial em sites com data center


Por ser um ambiente de missão crítica, um data center precisa de um sistema de gestão predial (BMS) exclusivo. Este artigo explica como o gerenciamento predial é afetado pela presença de um data center e descreve as características-chave típicas de um sistema BMS eficiente. Também são fornecidas as armadilhas comuns na implementação e uso de um BMS, além de recomendações sobre como evitá-las.


Bryan Anderson e Patrick Donovan, da Schneider Electric

Data: 20/09/2017

Edição: RTI Setembro 2017 - Ano XVIII - No 208

Compartilhe:

Uma instalação de tecnologia da informação (TI) de missão crítica é substancialmente diferente de um edifício de escritórios comerciais, site de varejo ou escola. Nos sites que exigem operação contínua 24x7, uma falha pode desligar toda a empresa e causar perdas financeiras graves, imediatas e muitas vezes de longo prazo. Alguns comparam a operação e manutenção (O&M) desses locais à “manutenção de um avião durante seu voo”.

Em geral, muitas empresas são totalmente dependentes da respectiva TI ou TI é a empresa. Isso vale, particularmente, para companhias de serviços da web, varejistas, provedores de serviços de “cloud/colocation” e instituições financeiras. A complexidade é maior e o ritmo de mudanças no data center é mais rápido do que na maioria dos demais tipos de instalação. A criticidade, complexidade e a natureza dinâmica da carga de TI afeta enormemente os requisitos do programa O&M da instalação, bem como as ferramentas do software de gestão da infraestrutura necessária para o suporte.

Este artigo fornece diretrizes para seleção das ferramentas de BMS Sistemas de Gestão Predial e de EPMS Sistemas de Monitoramento de Energia Elétrica para o gerenciamento da infraestrutura de energia e refrigeração de sites com TI de missão crítica. As interfaces e interações de BMS e EPMS com um sistema de gerenciamento de informações do data center também são abordadas. O efeito da TI de missão crítica sobre os requisitos do programa O&M global está fora do escopo deste artigo.

Recursos-chave de um BMS

A presença de equipamentos de TI de missão crítica altera fundamentalmente como um site deve ser operado e mantido pela equipe de instalações. A TI depende dos sistemas elétricos e mecânicos que fornecem alimentação de energia e refrigeração. Mesmo a menor das interrupções ou alocações incorretas da fonte de energia e refrigeração podem resultar em tempo de inatividade das aplicações de TI. E isso tem efeitos desastrosos numa empresa. Para complicar, essas cargas críticas flutuam em função de sua demanda por recursos de energia e refrigeração. As cargas podem ser movidas tanto fisicamente quanto, cada vez mais, virtualmente por meio da utilização de tecnologias de container e virtualização automática. A TI está se tornando mais “definida por software”, onde recursos de networking, armazenamento e computação são virtualizados. Essas máquinas virtuais podem ser criadas, movidas e dissolvidas com base na demanda em qualquer determinado momento. Esse ambiente dinâmico estabelece novos requisitos para um sistema BMS.

Os sistemas BMS têm como objetivo controlar a infraestrutura mecânica e fornecer monitoramento em tempo real dos equipamentos das instalações, além de gerenciar ativamente o desempenho da refrigeração. O BMS é capaz de reagir automaticamente a mudanças na carga de refrigeração ou falhas de equipamentos, ligando aparelhos adicionais, abrindo válvulas ou aumentando o fluxo de ar para manter a refrigeração. Quando ocorre uma falha, um BMS tem que fornecer à equipe de gestão de instalações as informações necessárias para efetuar ações que mantenham os equipamentos de TI alimentados e refrigerados.

Os registros de alarme e painéis do sistema fornecem informações em tempo real sobre o status do sistema aos usuários locais e remotos. Estratégias para redução do consumo de energia podem ser incorporadas à lógica para a redução dos custos operacionais. Uma vez que um BMS tenha sido devidamente programado e comissionado, ele é a ferramenta mais eficiente para a gestão de equipamentos mecânicos redundantes, comuns nesses ambientes de missão crítica. Os principais recursos do BMS para controle e monitoramento de equipamentos, além de sua interface com o EPMS, fazem dele uma plataforma ideal para consolidar o monitoramento do sistema e alarmes do sistema elétrico.

A tabela I relaciona e descreve os recursos-chave de um sistema de gestão predial em um site contendo um data center ou TI de missão crítica. Essas funções são exigidas para monitorar continuamente o status do sistema em tempo real, ser tão próativas quanto possível e responder imediatamente a incidentes, assim que ocorram, por meio de controle físico ativo.

Considerações adicionais sobre os recursos-chave

Os data centers atraem maior atenção dos executivos empresariais. A atenção dos CxOs para o BMS de um imóvel comercial típico é limitada aos relatórios de eficiência energética e, talvez em algumas partes do mundo, aos relatórios de emissão de carbono. Contudo, o impacto direto que data centers e salas de TI têm sobre o desempenho e custo das empresas exige ampliar a emissão dos relatórios fornecidos para uma ampla variedade de partes interessadas (acionistas).

O BMS tem que fornecer informações ao CFO para o planejamento de capital; ao CMO para a verificação de desempenho e capacidade; e ao CIO para o desempenho do sistema. Além disso, há frequentemente outras demandas de diretores de conformidade e funções de vendas, linhas de negócios e contabilidade dentro da organização. Alguns sistemas BMS são projetados para gerar relatórios altamente configuráveis que fornecem informações diretamente, em termos claros e simples, para cada um desses acionistas.

Sistemas BMS comerciais básicos não têm capacidade de exportação de dados em formatos como serviços web baseados em API Interface de Programação de Aplicativos ou relatórios que permitem interfaces personalizadas baseadas na web. Como resultado, um sistema básico pode apenas gerar relatórios e dados em seus formatos proprietários ou em protocolos abertos técnicos onde faltam ferramentas para os propósitos de informações corporativas personalizadas.

O consumo de energia representa um custo significativo tanto para aplicações de data centers quanto de edifícios comerciais. Ambas as aplicações podem usar a eficiência energética como uma vantagem competitiva. Nas aplicações de data centers, contudo, o consumo de energia representa um percentual muito maior dos custos operacionais. Um prédio comercial com ocupação entre 7h00 e 18h00 de segunda a sexta-feira precisará operar em condições de ocupação durante aproximadamente 2860 horas por ano. Um data center (ou qualquer sala de TI de missão crítica) opera durante 8760 horas por ano. Mudanças na eficiência dos equipamentos do data center resultam em cerca de três vezes as economias da refrigeração de conforto para a organização.

Contudo, a agressividade adotada para aumentar a eficiência (eliminando redundâncias ou reduzindo as margens de segurança da capacidade) expõe a empresa a um risco maior de falha de alto custo, que pode impedir a potencial economia de energia. A eficiência precisa ser equilibrada com uma margem de segurança da capacidade necessária para manter o sistema operacional. Trabalhar com fornecedores que tenham experiência em equilibrar a necessidade de eficiência com a necessidade de permanecer operacional pode representar a diferença entre economias e perdas consideráveis. E isso também enfatiza a necessidade de um BMS que possa controlar e reportar as capacidades de energia globais e o consumo em tempo real, compartilhando essas informações com os sistemas DCIM.

Os sistemas BMS precisam ser capazes de ajudar a atenuar o risco de erro humano ou reduzir seu impacto quando ocorrer. Cerca de 70% das interrupções dos data centers são diretamente atribuíveis a erros humanos, de acordo com uma análise do Instituto Uptime baseada em seu banco de dados de relatórios sobre “incidentes anormais” (AIR) (WP197, Essential Elements of Data Center Facility Operations).

O erro humano pode ocorrer de duas formas. Erro ativo acontece quando um operador executa uma ação que provoca a perda de refrigeração ou de energia no data center. Erro passivo consiste em uma falha na execução de uma ação para impedir a perda de refrigeração ou de energia. Os dois tipos podem acontecer durante operação normal, manutenção, upgrades ou projetos de renovação. O sistema BMS precisa reagir para manter/colocar novos equipamentos on-line, além de alertar a ocorrência de uma falha ou erro e fornecer instruções claras, precisas e oportunas sobre como se recuperar do incidente específico.

É considerado um benefício significativo quando o BMS pode ajudar os operadores, fornecendo o MOPs Método de Procedimentos, EOPs Procedimentos de Operação de Emergência e instruções específicas para equipamentos/alarmes junto com o alarme e respectivos dados brutos. Quanto mais contexto for fornecido com um alarme, mais rápido os operadores podem resolver o problema e determinar a causa raiz. Por contexto, queremos dizer informações que explicam mais sobre “onde”, “como” e “por que” vs. o simples “o que”.

A segurança de rede em data centers e salas de TI de missão crítica é uma prioridade muito alta para todas as empresas. De acordo com o relatório Verizon Data Breach Investigations Report 2016, 63% das violações de dados confirmadas foram relacionadas a senhas fracas, padrão ou roubadas e 70% das violações envolvendo o uso indevido por insiders (“indivíduos reconhecidos ou aceitos como membros da organização”) levaram meses ou anos para serem descobertas. O BMS que reside nesses ambientes, para controle e monitoramento dos equipamentos, precisa também incluir políticas e recursos robustos para segurança de rede. A segurança da rede, protocolo de senhas dos usuários e gerenciamento de conexões remotas precisam ser ativamente gerenciadas em conformidade com as políticas corporativas da empresa e melhores práticas do setor. As data rooms são projetadas para comunicações seguras com controle do tráfego de rede de entrada e saída através de ferramentas de segurança da TI.

Os técnicos que trazem suas ferramentas de software e hardware para o espaço representam risco para a segurança cibernética global do sistema. A implantação da rede do BMS e práticas de segurança do fornecedor que instala o sistema representam um risco muito maior do que as aplicações fora do espaço da TI.

É evidente que a extrema criticidade e o ritmo de mudanças na TI impulsionam a necessidade de um sistema de gerenciamento seguro que forneça uma visão eficiente de todos os recursos de segurança e dependências, desde a conexão da concessionária até o servidor, notificações proativas e informativas, rápida resposta física aos incidentes e relatórios claros e úteis fornecidos para os principais acionistas.

BMS como parte de um sistema de gerenciamento mais amplo

Nos edifícios comerciais, os instaladores têm tradicionalmente trabalhado de forma independente de outros departamentos e funções da organização. Eles têm sido encarregados de manter o sistema de energia elétrica funcionando, o ambiente seguro e confortável e o local seguro contra riscos de incêndio e outras ameaças físicas. Desde que não ocorra qualquer incidente ou contas de energia incomuns, as instalações são deixadas sozinhas em seu próprio mundo.

Em um data center, essa independência e separação devem ser desencorajadas. Conforme mencionado anteriormente, a dependência total que a carga de TI tem dos recursos de energia, refrigeração e segurança da instalação dita a necessidade de abertura e cooperação com o seu cliente número um: o departamento de TI.

Em organizações avançadas, cada vez mais voltadas para o futuro, onde o data center é a empresa, esta cooperação tem sido tratada com diretores das áreas de instalações e TI, reportando para o executivo sênior e compartilhando muitos dos mesmos objetivos e metas organizacionais. Esse tipo de estrutura é uma maneira de garantir o trabalho em equipe e obter o objetivo comum de manter o data center disponível 24x7 de forma tão eficiente quanto possível.

Outra maneira é ter instalações e TI com os mesmos acionistas e participantes ativos nas fases de planejamento, projeto e comissionamento de todos os trabalhos que impactam a TI. Para a fase mais longa e de maior custo do ciclo de vida da instalação, a de operação, os principais meios de compartilhamento de informações e esforço conjunto são os sistemas de gerenciamento de software, ou seja, o BMS, EPMS e DCIM.

Os modernos sistemas BMS otimizados para instalações de missão crítica têm capacidade de compartilhar e receber informações de status e alarme com outros sistemas de gestão da infraestrutura. Por meio do suporte de protocolos abertos comuns como BACNet IP, MSTP, Modbus IP e RTU sobre uma rede Ethernet TCP/IP padrão, o BMS pode enviar e receber informações para e de sistemas EPMS e DCIM.

Alguns sistemas BMS também têm capacidade de transmitir dados via APIs para hospedar informações como bancos de dados, serviços web e relatórios. As APIs para serviços da web hospedam dados brutos em formatos adequados para que os acionistas criem interfaces do usuário personalizadas de acordo com suas necessidades. Os relatórios são uma extensão das APIs, incluindo alguma manipulação dos dados brutos antes da entrega.

Essas ferramentas das APIs permitem que os dados, normalmente restritos ao BMS e respectiva interface do usuário, sejam aproveitados em toda a empresa de um cliente por uma ampla variedade de aplicações e interfaces do usuário. Contratar um fornecedor com experiência na provisão desses serviços de integração é essencial para garantir uma implementação bem-sucedida.

Para simplificar o esforço de efetuar essas conexões, é importante que instalações e TI trabalhem juntas na fase de avaliação e implementação. Para determinar corretamente as opções das ferramentas de software, ambos os lados devem se reunir para definir e chegar a um acordo sobre o que os sistemas conectados devem fazer, usando o produto desta reunião para comparar soluções. A comparação deve considerar a capacidade de cada solução para fazer o que você quer, bem como o esforço necessário para que isso aconteça. Esta definição requer uma entrevista com o fornecedor, sendo específico sobre suas necessidades.

Observe que a escolha de um fornecedor que ofereça e tenha projetado todos os três conjuntos de ferramentas para trabalharem juntos deve tornar a integração mais simples e menos sujeita a erros. Para a fase de implementação, ambos os grupos devem chegar a um acordo sobre as políticas de notificação de alarme e valores limites e garantir que os requisitos da fase de avaliação continuem válidos na implementação real. Finalmente, durante o comissionamento, instalações e TI devem testemunhar o comportamento do sistema durante a operação, chegando a um acordo sobre aprovação ou falha nos testes antes de o sistema ser energizado.

Armadilhas comuns e como evitá-las

Um BMS integrante de um sistema mais amplo de gestão da infraestrutura do data center tem potencial para oferecer alto valor aos gerentes de instalações e outros acionistas. Um sistema bem implementado fornece uma visão clara e concisa do que seria, de outra forma, um ecossistema distinto e complexo com diferentes instalações e componentes de TI. Um BMS que compartilha e recebe informações de servidores e equipamentos via ferramentas de gerenciamento da infraestrutura pode garantir que os recursos sejam eficientemente utilizados, planejados e mantidos de forma a fornecer alta confiabilidade. E isso pode ser feito com menos recursos humanos do que por monitoramento e gerenciamento manual.

A seguir é apresentado um resumo das descobertas e principais armadilhas.

Escolher uma solução inadequada

As ferramentas de gerenciamento variam em relação ao escopo e função. Há também uma sobreposição de função entre ferramentas projetadas para instalações de edifícios tradicionais e sistemas da área de TI de data centers. Por exemplo, um BMS pode monitorar e coletar informações de sistemas localizados dentro da data room. Ao mesmo tempo, existem ferramentas projetadas para monitorar, planejar e gerenciar sistemas de infraestrutura de data rooms que também podem coletar informações das plantas de energia e mecânicas da instalação.

Embora uma ferramenta de software possa ser capaz de cobrir múltiplos domínios similares a estes, ela tende a ser otimizada para uns e não para outros. Quando uma ferramenta é substituída para efetuar o trabalho de outra, o resultado pode ser uma falha devido à incapacidade de executar ou à falta de uso, porque a interface é muito complicada para ser efetiva. As interfaces BMS são versáteis e capazes de coletar dados de diversas fontes. No entanto, quando um BMS é usado para ajudar os operadores dentro do espaço de TI pode ocorrer um erro de funcionamento significativo.

Os templates para gráficos e relatórios de atividades da área de TI ainda são insuficientes. A interface do usuário para o BMS é projetada para os usuários de instalações com alguns painéis de alto nível, cujos dados reportados se baseiam em um número limitado de pontos para equipamentos mecânicos. Os gerentes de TI, por outro lado, precisam de informações específicas dos equipamentos de TI, de rede, UPS, CRAC, racks e PDUs para racks, bem como suas dependências uns dos outros.

Portanto, uma ferramenta DCIM deve ser usada para aplicações da área de TI e as ferramentas do BMS e EPMS para aplicações prediais e elétricas, respectivamente. Essa diversidade e sobreposição, combinadas, talvez com alguma promessa de marketing exagerada, tiveram o efeito colateral não intencional de causar confusão e perda de expectativas para alguns usuários.

Existem diversas característicaschave a serem observadas ao selecionar as ferramentas BMS e DCIM para garantir que esta armadilha seja evitada, conforme resumido na tabela II.

Depender de processos inadequados ou incompatíveis

Os sistemas de gestão são muitas vezes vendidos separadamente e procurados pelos gerentes de instalações e TI como um meio de preencher lacunas em seus processos operacionais. Eles representam uma maneira para simplificar e automatizar o monitoramento e gerenciamento, reduzindo a necessidade de tempo e mão de obra.

Na verdade, sistemas bem implementados e eficientes podem fornecer esse valor. Contudo, o usuário ainda tem que fazer sua parte para que os sistemas BMS e DCIM funcionem efetivamente e cumpram sua promessa. Mesmo os melhores sistemas não vão eliminar a necessidade de que os processos do operador sejam implementados, operados e mantidos. Um processo ruim é uma causa comum da não agregação do valor desejado de um sistema de gestão.

O grau de esforço do operador e o número de processos necessários para manejar um sistema vão variar de fornecedor para fornecedor. E isso é outro ponto de comparação para a fase de avaliação. Conhecer os requisitos específicos do operador de uma determinada oferta normalmente significa entrevistar o fornecedor diretamente. Muitos fornecedores vão oferecer programas de treinamento sobre como operar e manter o sistema de gestão. É importante garantir que haverá recursos humanos suficientes (e instruções contínuas para usá-los) para atender ao esforço e processo necessários.

A tabela III descreve quatro processos importantes e comuns relacionados aos sistemas BMS/DCIM, os quais, se negligenciados, comprometerão o funcionamento e benefícios do sistema de gestão.

Focar nos quatro processos-chave indicados na tabela ajudará a garantir a agregação do valor dos sistemas BMS/DCIM. Em um nível básico, a efetivação dos processos requer:

Falta de compromisso, propriedade e conhecimento

Um processo sem um proprietário ou recursos/conhecimento para executá-lo certamente está condenado a falhas. Há uma história de estruturas organizacionais baseadas em “silo” entre equipes de instalações e TI. Frequentemente, a gestão é um terceiro silo. Esta é uma situação onde informações e objetivos nem sempre são compartilhados ou mesmo comunicados. Considerando a total dependência que a TI tem da infraestrutura elétrica e mecânica subjacente, a isolação e falta de cooperação devem ser eliminadas. A implementação e operação de um sistema de gerenciamento amplo que abrange os três silos serão, no mínimo, prejudicadas, se não condenadas ao fracasso em tal ambiente.

Há também uma resistência natural para mudar a forma como as coisas são gerenciadas, particularmente se a mudança for percebida como vinda de “fora” de um silo estabelecido. A experiência tem mostrado que, se a gestão tomar uma decisão de adotar um novo sistema sem a participação daqueles que vão operá-lo, há um alto risco de incompatibilidade com processos existentes ou hardware, que aumenta o montante de mudanças necessárias. Isso leva a falhas imprevistas na solução implementada ou incompatibilidades que limitam sua eficiência; ou a solução é escolhida e implementada sem propiciar tempo e recursos para que os operadores aprendam a usá-la. Tudo isso pode fazer com que o sistema seja abandonado e ignorado.

Conclusão

Este trabalho mostrou as exigências exclusivas para a gestão e operação de sites com data centers ou salas de TI. O objetivo foi abordar tanto os edifícios de data centers dedicados e amplos, quanto prédios comerciais com salas de TI menores e/ou armários de TI. Diferenças na gestão desses espaços de outras ocupações incluem consequências financeiras significativas para falhas de equipamentos, necessidades de relatórios e visibilidade, compartilhamento e comunicação com o departamento de TI e redução drástica do tempo de resposta a incidentes críticos. Estratégias para gestão de maior complexidade e supervisão interna expandida incluem assegurar uma instalação adequada e recursos necessários do sistema de software selecionado, usar ferramentas para as tarefas pretendidas e manter a solução simples. Dicas para evitar erros comuns na implementação dos sistemas focam principalmente na comunicação, cooperação e processo.

É importante conversar com projetistas e fornecedores para obter sistemas que se comuniquem. Adicionalmente, é preciso trabalhar com acionistas internos e definir expectativas e processos claros. Selecionar um fornecedor que tenha experiência em projetar e implementar soluções completas com todos os sistemas de software necessários para uma solução completa vai reduzir o risco, tempo de implantação e o custo do projeto.