Saltar al contenido principal
Microsoft 365
Suscríbete

Servicios en la nube en los que puedes confiar: disponibilidad de Office 365

Nos imaginamos Microsoft Office 365 como «tu oficina completa en la nube». Aunque nos enorgullece que mil millones de personas usen Office, apreciamos verdaderamente nuestra responsabilidad por cumplir y superar diariamente las expectativas de nuestros clientes. Sabemos que las aplicaciones de productividad son críticas y que para hacer el trabajo es necesario usarlas. Para nosotros es fundamental garantizar que nuestro servicio sea de confianza y fiable al tiempo que agregamos nuevas funcionalidades a Office 365. Y para medirlo nos basamos en la disponibilidad del servicio.

Disponibilidad de Office 365

Desde el lanzamiento de Office 365 hace dos años, hemos seguido invirtiendo en nuestra infraestructura para garantizar la alta disponibilidad del servicio.  Aunque nuestros clientes actuales han dispuesto de información detallada, hoy ofrecemos esta información para todos los clientes que están considerando la posibilidad de usar Office 365.   Medimos la disponibilidad como el número de minutos que está disponible un el servicio de Office 365 durante un mes natural como porcentaje del número total de minutos de ese mes.  Denominamos número de tiempo de actividad a esta medida de la disponibilidad. En el cálculo incluimos nuestros servicios empresariales, educativos y de administración Pública. El número de tiempo de actividad mundial para Office 365 correspondiente a los cuatro últimos trimestres, desde julio de 2012 a junio de 2013, ha sido 99,98 %, 99,97 %, 99,94 % y 99,97 % respectivamente.  En el futuro, informaremos de los números de tiempo de actividad por trimestre en el Centro de confianza de Office 365.

Estos son algunos detalles adicionales sobre el número de tiempo de actividad:

  1. El número de tiempo de actividad incluye Exchange, SharePoint, Lync y Office Web Apps, ponderado sobre el número de usuarios de cada uno de estos servicios. Los clientes usan estos servicios de manera conjunta, por lo que todos se tienen en cuenta al calcular el tiempo de actividad.
  2. Este número de tiempo de actividad se aplica a Office 365 para empresas, educación y administración pública. En este cálculo no se incluyen los servicios al consumidor.
  3. Office 365 ProPlus es una parte integral de nuestra oferta de servicios pero no se incluye en este cálculo del tiempo de actividad dado que principalmente se ejecuta en los dispositivos de los usuarios.
  4. Los clientes pueden experimentar porcentajes de tiempo de actividad más altos o más bajos comparados con las cifras globales según la ubicación y patrones de uso.

Como compromiso para ejecutar un servicio de alta disponibilidad, disponemos de un Contrato de nivel de servicio del 99,9 % con respaldo financiero.

Principios de diseño de disponibilidad

Llevamos décadas creando soluciones de categoría empresarial. Además, Microsoft ejecuta diversos servicios en la nube como Office 365, Windows Azure, CRM Online, Outlook.com, SkyDrive, Bing, Skype y Xbox Live, entre otros. Gracias a esta diversidad de servicios aprovechamos los procedimientos recomendados de cada uno para mejorar el diseño del software y los procesos operativos.

A continuación se muestran algunos ejemplos de procedimientos recomendados aplicados en procesos de diseño y operativos para Office 365.

Redundancia. Redundancia en todos los niveles (físico, de datos y funcional):

  • generamos redundancia física en el nivel del disco o la tarjeta en los servidores, en el nivel del servidor en un centro de datos y en el nivel de servicios entre centros de datos separados geográficamente para la protección contra fallos. Cada centro de datos tiene instalaciones y redundancia de energía. Tenemos varios centros de datos para proporcionar servicios a cada región.
  • Para crear redundancia en el nivel de los datos, los replicamos de manera constante entre centros de datos separados geográficamente. Nuestro objetivo de diseño es mantener varias copias de los datos ya sea en tránsito o en reposo, y funcionalidades de conmutación por error para permitir una recuperación rápida.
  • Además de la redundancia física y de datos, como uno de nuestros puntos fuertes, creamos clientes de Office para proporcionar redundancia funcional que te permita ser productivo mediante funciones sin conexión cuando no haya conectividad de red.

Resistencia. Equilibrio de carga activo y pruebas de recuperación constantes entre dominios de error:

  • Equilibramos la carga de forma activa para ofrecer a los usuarios finales las mejores experiencias posibles de manera automática. Estos mecanismos también priorizan de forma dinámica, realizando tareas de prioridad baja durante periodos de baja actividad y aplazándolas durante fases de mucha carga.
  • Disponemos de conmutación por error automática y manual a recursos con estado correcto durante errores de hardware o software, y alertas de supervisión.
  • Realizamos la recuperación de manera periódica entre dominios de error para garantizar la disponibilidad en circunstancias que requieran conmutaciones por error.

Servicios distribuidos. Servicios de componentes distribuidos de manera funcional:

  • Los servicios de componentes de Office 365, como Exchange, SharePoint, Lync y Office Web Apps, se distribuyen de manera funcional, para garantizar que el alcance y el impacto de un error en un área se limiten exclusivamente a ese área y no afecten a otras.
  • Replicamos los datos de directorios entre estos servicios de componentes para que en caso de que un servicio experimente un problema, los usuarios puedan conectarse y usar otros servicios sin problemas.
  • Nuestros equipos de operaciones e implementación se benefician de la naturaleza distribuida de nuestro servicio, y simplifican todos los aspectos del mantenimiento y reparación, diagnóstico, reparación y recuperación.

Supervisión. Herramientas completas de supervisión, recuperación y diagnóstico:

  • Nuestros sistemas internos de supervisión supervisan de manera continuada el servicio en busca de errores y están diseñados para iniciar la recuperación automática del servicio.
  • Nuestros servicios analizan cualquier desviación en el comportamiento del servicio para avisar a ingenieros de guardia para emprender medidas proactivas.
  • Contamos también con supervisión de interacción indirecta que se ejecuta de manera constante desde varias ubicaciones del mundo desde servicios de terceros de confianza (para la verificación independiente del SLA) y nuestros propios centros de datos internacionales para generar alertas.
  • Para el diagnóstico, disponemos de completos registros, auditorías y seguimientos. El seguimiento y la supervisión pormenorizados nos ayudan a aislar los problemas a la raíz del origen.

Simplificación. La complejidad reducida fomenta la predictibilidad:

  • Siempre que es posible usamos componentes estandarizados. Esto reduce la complejidad de la implementación y aislamiento de los errores, y lleva a errores y recuperación predecibles.
  • Siempre que es posible usamos procesos estandarizados. No nos centramos solamente en la automatización, sino también en asegurarnos de que los procesos se repiten y reiteran.
  • Los componentes de software se han creado para acoplarse de forma imprecisa, para que su implementación y mantenimiento constante no requieran una orquestación compleja.
  • Nuestra administración de cambios se somete a ciclos de ámbito y validación progresivos, escalonados e instrumentados antes de implementarlos a nivel mundial.

Asistencia humana. Soporte técnico de guardia ininterrumpido:

  • Aunque contamos con acciones de recuperación automáticas siempre que es posible, también disponemos de un equipo de profesionales de guardia que te ofrecen soporte técnico ininterrumpido. Este equipo incluye ingenieros de soporte técnico, desarrolladores de productos, directores de programas y productos, y líderes experimentados.
  • Con un equipo completo de guardia, podemos ofrecer una respuesta rápida y recopilar información para la resolución de problemas.
  • Nuestros profesionales de guardia, ademas de proporcionar asistencia, también mejoran los sistemas automáticos cada vez que se solicita su ayuda.

Aprendizaje continuo

Sabemos que en ocasiones es posible que experimentes interrupciones en el servicio. Realizamos una revisión exhaustiva después de que se produzca cada incidente independientemente de la magnitud del impacto. Una revisión posterior al incidente consta de un análisis de lo que ha sucedido, cómo hemos respondido y cómo evitaremos incidentes similares en el futuro. Para garantizar la transparencia y la responsabilidad, compartimos la revisión posterior al incidente de los principales incidentes de servicio en caso de que tu organización resulte afectada. Como una gran empresa, en Microsoft también «probamos nuestra propia medicina», es decir, usamos nuestro propio servicio de preproducción para realizar nuestras actividades diarias. La mejora continuada es un componente esencial para ofrecer un servicio de alta disponibilidad de categoría mundial.

Comunicación coherente

La transparencia requiere una comunicación coherente, en especial cuando se usan servicios de productividad online para realizar una actividad empresarial. Tenemos distintos canales de comunicación, como correo electrónico, fuentes RSS y el panel de estado del servicio. Como cliente de Office 365, obtendrás una vista detallada de la disponibilidad de los servicios relevantes para tu organización. El panel de estado del servicio de Office 365 es la ventana al estado actual de tus servicios y licencias. Continuamos mejorando el panel de estado del servicio, incluyendo escalas de tiempo de seguimiento para asegurarnos de que tienes toda la información del estado de tus servicios.

También tenemos herramientas nuevas y llamativas para mejorar la capacidad de estar al día del servicio.  La semana pasada lanzamos una nueva característica en el portal de administración denominada «Centro de mensajes». El Centro de mensajes es un punto central para las comunicaciones de los servicios, informes del espacio empresarial y acciones requeridas por los administradores.  Además, al final de este año, los administradores verán una nueva aplicación móvil que proporcionará información sobre el estado del servicio y otras comunicaciones relacionadas con este.

La ejecución de un servicio integral y en continua evolución a una escala cada vez mayor es un reto y, a pesar de nuestros esfuerzos, se producirán interrupciones en el servicio. Queremos asegurarte que estamos aprendiendo constantemente y no cejaremos en nuestro compromiso por ofrecer un servicio de alta disponibilidad que satisfaga tus expectativas.  La continuidad del servicio es algo más que un compromiso de ingeniería; es un compromiso con los clientes de nuestro SLA y uno de los pilares fundamentales del Centro de confianza de Office 365 (los otros cuatro son la privacidad, la seguridad, el cumplimiento normativo y la transparencia). Esta divulgación pública del tiempo de actividad de Office 365 es una prueba de nuestro compromiso permanente por la continuidad y la transparencia del servicio.