lunes, 29 de agosto de 2011

ASEGURAMIENTO DE LA CAPACIDAD EN EL DESARROLLO DE NUEVOS SERVICIOS DE TECNOLOGÍA

José Luis Abdallah
Gerente de Infraestructura de TI de la Electricidad de Caracas-Corpoelec
Caracas, D.C, Venezuela
E-mail: Jose.abdallah@gmail.com

Resumen
Este documento revisa algunos conceptos básicos sobre la capacidad de la infraestructur, analizando e identificando su importancia en los servicios y sistemas de información que ofrecen los departamentos de IT en las organizaciones, de igual forma identifica métricas asociadas que pueden ayudar a controlar este importante proceso dentro de la organización.
.

Palabras clave: Proceso, tecnología, capacidad, proyecto.

1.      Proyectos

Los procesos de negocio y administración de las empresas están soportados hoy día  por sistemas de información, lo cual convierte  a todos los sistemas asociados en críticos para asegurar la supervivencia y calidad de gestión dentro de las organizaciones.
De acuerdo a la Real Academia Capacidad  “es la propiedad de una cosa de contener a otras dentro de un límite”, en el caso de la tecnología, de acuerdo a ITIL (2008) está referido a la provisión de recursos necesarios para soportar servicios y tendencias de estos, dentro de los acuerdos de servicio (SLA) convenido con los usuarios.
Así mismo el PMBOK (2008) expresa que dentro del ciclo de proyecto existen distintos momentos importantes para asegurar los aspectos de capacidad, pero quizás los principales sean: la definición del alcance del proyecto, el WBS (work breakdown structure) para identificar los principales componentes afectados dentro del proyecto,  el control  de alcance de entradas y salidas (control scope), control de administración del tiempo (duración del tiempo), y la gerencia del riesgo, este último permite explorar escenarios probables y desarrollar planes de mitigación, a través de consulta con expertos, equipo de trabajo e involucrados (stakeholders)

1.1  Disponibilidad de sistemas y subsistemas
En sistemas eléctricos la disponibilidad en especial asociada a redes debe ser de 99,999% de acuerdo con el documento de Kema (2006), ya que una falla en las comunicaciones ocasiona pérdidas de fluido eléctrico, inestabilidad del sistema (posibilidad de Blakcout), daño en equipos, personas y al final afecta los ingresos e imagen de la empresa. Esta relación de consecuencias puede ser extrapolada a cualquier subsistema que se relacione con el sistema eléctrico, ya que una falla por ejemplo en un servidor que indisponga el acceso de clientes eléctricos al portal, ocasiona intensos impactos, muchas veces no contabilizados.
1.2  Modelo de prueba
Existen algunas metodologías para medir la madurez de los sistemas en términos de calidad, algunos de los más conocidos son:
·         ITIL Diseño de Servicios versión 3, apéndice “J”  explica de forma muy general algunos aspectos a ser tomados en cuenta dentro de un plan de capacidad, entre ellos señala que debe levantarse información de la infraestructura y traducirla en un informe ejecutivo que permita identificar la condición actual, problemas que se presentan, sobre capacidad si existe, rendimiento de los sistemas en relación al servicio.
Sin embargo en muy genérico en los aspectos tratados, lo cual impide tomarlo como referencia para desarrollar un plan detallado de capacidad.
·         Capability Maturity Model desarrollado por el Software Engineer Institute, y el Standard ISO/IEC 9001:2000 TR 15504 desarrollado por el International Organization for Standarization (ISO) y el Internacional Electro-Technical Comission (IEC) , este mide la coherencia del modelo, valoración de las actividades, valoración de las entradas, definición de roles y responsabilidades, valoración de las salidas.

Fuente: Rivero 2004

Fuente: Rivero 2004, pag 29.
Rivero (2004, pag 32.), define claramente 6 niveles para medir la capacidad del proceso o sistema, utilizando una escala de cumplimiento de atributos, logrando medir el grado de calidad de un producto generado por las referencias definidas en el diseño utilizando el estándar.
·         Military Standard 105E (ANSI/ASQC Z1.4, ISO 2859), el cual fue desarrollado por el año 1950 y ha tenido multiples revisiones de mejora, el mimo comprende: MILQ9858 calidad estándar, MILST785 demostración de confiabilidad, MILSTD781 predicción de confiabilidad, MIL HDBK217 análisis y prueba. (MIL 2010)

.
1.3  Capacidad de los sistemas
Como estar seguro que la capacidad actual o la redimensión es suficiente para garantizar la calidad del servicio?
Es necesario formular una serie de preguntas o análisis de distintos aspectos, a continuación se indica un ejemplo:
·         La capacidad especificada cumple para todo el alcance del proyecto o está condicionada para una fase específica.
·         Describir los componentes afectados de cada uno de los subsistemas y equipos responsables de cada uno de los componentes
·         Describir la capacidad actual, la requerida y la que finalmente debe tener el sistema para soportar el servicio con el alcance y especificación con el que fue diseñado
·         Existe riesgo por falla de un componente o sistema, Existe  plan de mitigación por afectación de la capacidad operativa de los servicios en producción

1.4  Responsabilidad del equipo de capacidad
El equipo de personas responsables del manejo de la capacidad de la infraestructura debe atender bajo un enfoque proactivo, el uso y explotación de la infraestructura, de tal forma de analizar indicadores y resultados de estudios proactivos para evitar colapsos en los sistemas. A continuación se indican algunas de las actividades más relevantes que deben ser atendidas:
·         Desarrollar estadísticas sobre indicadores y actualizarlas a medida que se consumen los recursos, y/o se reconfiguran o repotencian componentes por proyectos, se sugiere tener un mapa con todos los proyectos y grado de afectación en los distintos proyectos.

·         Caracterizar los componentes sistémicos de la infraestructura y definir atributos y formas de mantener actualizados los parámetros.


·         Proponer un esquema para llevar el mapa de capacidad con el registro de los proyectos por componentes

·         Tener curvas de proyección de las capacidades actuales y correr algunos modelos de simulación ante la degradación de componentes o la readaptación de alcances en proyectos que sobre carguen o degraden la holgura de crecimiento vegetativo que debe tener cada sistema

·         Identificar indicadores que permitan validar el estado de capacidad de los componentes, por medio de curvas de la media, % de holgura, nueva curva de capacidad al final del proyecto, para cada componente con los proyectos que lo afectan.
o   Comunicaciones: Estadísticas de ancho de banda utilizado (transporte, acceso, Internet, otros9
o   Servidores: % uso CPU (evidenciando picos), holgura, reserva
o   Discos: Espacio utilizado (mapeo por aplicación y tiempo de retención de los datos), holgura reserva
o   UPS: KW utilizados, holgura, reserva ( expresar autonomía para cada uno de los servicios que alimenta: tagma, comunicaciones, servidores, telefonía, suiches, routers)
o   Capacidad del personal de operar sistemas y resolver sin soporte externo: definido por el grado de experticia del personal para realizar un mantenimiento correctivo.
o   otros
·         Definir escala de criticidad de componentes y grado de tolerancia a fallas que debe tener, estado actual y condición al final del proyecto
o   Expresar para cada componente su criticidad (definir de acuerdo a su importancia); ejemplo:
§  critico (3) tiene redundancia, esta monitoreado, activa personal de guardia
§   medio (2),  no tiene redundancia, tiene definido un sla, y activa personal de guardia
§  baja (1), puede esperar a ser atendido
                  Ejemplo: enlace entre SCADAs, debe ser 3 pero actualmente es 2,
Como conclusión se puede indicar que el manejo de capacidad es una actividad estratégica, que vela por los factores de éxito asociados a la disponibilidad de la infraestructura para acometer cambios bruscos de la organización, la cual finalmente se apoyará en la disponibilidad de capacidades, para poder aumentar producción, concluir proyectos de rápido desarrollo (fast track), o ajustar sistemas por cambios en el entorno legal o u operativo, los cuales pueden hacer colapsar a la empresa o parte de ella, al no responder a la velocidad del cambio, de no realizar oportunas intervenciones para mantener el control de las holguras por crecimiento vegetativo, o aumento del gradiente de explotación.

2.      REFERENCES
(1)     Mil 2010. Engineering Statistics Handbook Disponible en línea http://www.itl.nist.gov/div898/handbook/pmc/section2/pmc22.htm#Acceptable Quality Level
(2)     Rivero Carlos, 2004. “Certificación de procesos de desarrollo de software” Basado en el Estándar ISO 9001:2000. Universidad de Buenos Aires.
(3)     Kema. 2006. Substation Communications: Enabler of Automation. An Assessment of Communications Technologies Options and Opportunities for Substations Automation. Unated Telecom Council.
(4)     PMBOK. 2008. A guide to the proyect managment body of knowledge. Proyect Managment Intitute, An american national standard ANSI/PMI 99-001-2008.
(5)     ISO 9000:2000. Sistemas de gestión de la calidad, Directrices para la mejora del desempeño. Comisión electrotécnica CEI. Impreso en Suiza. Derechos reservados. 2000.
(6)     ITIL. 2008. Informatión Technology Infraestructure Library. Disponible en línea: http://www.itil-officialsite.com/