En Google, el aprendizaje automático encuentra nuevas formas para ahorrar energía

0
278

Extractamos este interesante publicación directamente del web de Google. La compañía se encuentra muy interesada en el ahorro de energía y por tanto en implementar energía a partir de recursos renovables. Le dejamos la información generada por Google:

El mundo virtual está construido sobre infraestructura física. Cada búsqueda que se envía, se envía un correo electrónico, se envía una página, se publica un comentario y se carga un video pasa por centros de datos que pueden ser más grandes que un campo de fútbol.

Jim Gao

Esos miles de racks de servidores de tarareo utilizan grandes cantidades de energía; en conjunto, todos los centros de datos existentes utilizan aproximadamente el 2% de la electricidad del mundo y, si no se controlan, esta demanda de energía podría crecer tan rápidamente como el uso de Internet. Por lo tanto, hacer que los centros de datos funcionen de la manera más eficiente posible es un gran problema.

Afortunadamente, a pesar de la creciente demanda de computación, el uso de electricidad en el centro de datos se ha reducido en los últimos años, en gran parte debido a las enormes oportunidades para mejorar la eficiencia a medida que estas instalaciones aumentan.  Pero capturar estas oportunidades puede ser un proceso muy complicado.

La medida estándar de la eficiencia energética en los centros de datos (eficacia del uso de energía (PUE)) puede verse afectada por docenas de variables. Una instalación típica tiene muchos tipos de equipos, que incluyen enfriadores, torres de enfriamiento, bombas de agua, intercambiadores de calor y sistemas de control, cada uno con su propia configuración y todos interactuando de formas complejas y a menudo contradictorias.

Agregue factores como la temperatura del aire y la velocidad del ventilador, y la complejidad del sistema se vuelve astronómica. Considere un escenario simplificado: solo 10 equipos, cada uno con 10 configuraciones, tendrían 10 a la décima potencia, o 10 mil millones, configuraciones posibles, un conjunto de posibilidades mucho más allá de la capacidad de cualquier persona para realizar pruebas reales, pero mucho menos que posibles configuraciones de un centro de datos real.

Google ha estado pensando en la eficiencia del centro de datos durante tanto tiempo como hemos estado pensando en los centros de datos. Desde el principio, decidimos diseñar y construir nuestras propias instalaciones desde cero, para permitirnos probar continuamente nuevas tecnologías de enfriamiento y estrategias de operaciones.

Nuestros centros de datos emplean técnicas avanzadas de enfriamiento, utilizando enfriamiento evaporativo altamente eficiente o aire exterior siempre que sea posible en lugar de enfriadores mecánicos. Redujimos el uso de energía en las instalaciones al instalar controles inteligentes de temperatura e iluminación y rediseñamos la forma en que se distribuye la energía para minimizar la pérdida de energía. Nuestros servidores de alto rendimiento están diseñados a medida para usar la menor cantidad de energía posible, sin componentes innecesarios como tarjetas de video, y se mantienen tan ocupados como sea posible para que podamos hacer más con menos servidores. Y así.

El resultado de todos estos esfuerzos: en la primavera de 2014, los centros de datos de Google utilizaron un 50% menos de energía que el promedio de la industria. Lo que, por supuesto, significaba que la siguiente pregunta era si podían correr aún más delgados. Un ingeniero de eficiencia llamado Jim Gao, que despertó su interés en una clase en línea sobre aprendizaje automático, decidió averiguarlo.

El aprendizaje automático le da a las computadoras la capacidad de aprender cosas sin ser programado explícitamente, al enseñarse a sí mismos mediante la repetición cómo interpretar grandes cantidades de datos. Google ya lo usa para mejorar funciones como la traducción y el reconocimiento de imágenes. Cuando le pide a Google Photos imágenes de personas abrazándose, es el aprendizaje automático el que encuentra las fotos que busca.

Gao esperaba que pudiera ayudarlo a comprender mejor la tormenta de información del centro de datos al ” encontrar la historia oculta en los datos”. “Pasó” seis meses propensos a errores y golpes en la cabeza “construyendo un modelo de prueba de concepto de todos los componentes en un centro de datos. “Era un código súper janky”, dice, “en gran medida un prototipo, para demostrar que la idea era válida y valía la pena seguirla”.

Los resultados iniciales no fueron del todo prometedores. “Las primeras predicciones fueron totalmente erróneas”, admite Gao. “Los modelos no hicieron un muy buen trabajo al predecir PUE o las consecuencias de nuestras acciones”. De hecho, la primera recomendación del modelo para lograr la máxima conservación de energía fue cerrar todas las instalaciones, lo que, estrictamente hablando, no era inexacto, pero tampoco fue particularmente útil. “Tuvimos que obligar a nuestra IA a ser un adulto responsable, disciplinarse un poco”, dice Gao. Cambió las variables y ejecutó las simulaciones nuevamente, ajustando el modelo con el tiempo cada vez más cerca de la configuración que predijo con mayor precisión, y por lo tanto, era más probable que pudiera mejorar, el rendimiento real de la instalación. Cuando sintió que su prototipo era lo suficientemente preciso, publicó un libro blanco y comenzó a trabajar con el equipo de operaciones del sitio para implementar las recomendaciones del modelo en instalaciones reales.

Solo 10 equipos, cada uno con 10 configuraciones, tendrían 10 a la décima potencia, o 10 mil millones, configuraciones posibles, un conjunto de posibilidades mucho más allá de la capacidad de cualquier persona para probarlo de verdad.

Al mismo tiempo, el grupo de investigación de inteligencia artificial líder de Google, DeepMind, había causado revuelo con un artículo que describía a DQN, un agente informático que era realmente bueno jugando juegos de Atari. Todos los juegos de Atari. Una cosa era entrenar un programa para jugar un juego en particular realmente bien, pero un programa capaz de enseñarse a sí mismo para sobresalir en una gama completa de juegos era algo completamente diferente. En la comunidad de aprendizaje automático, esto era algo alucinante, y cuando Gao se enteró, rápidamente le envió un correo electrónico al jefe de DeepMind, Mustafa Suleyman, con el siguiente asunto: Aprendizaje automático + centros de datos = ¿increíble?

Suleyman estuvo de acuerdo en que Gao estaba realmente en algo increíble, y DeepMind comenzó a trabajar con Gao y su equipo de inteligencia del centro de datos (DCIQ) en modelos de trabajo más “robustos y generales”. Del mismo modo que no quieres un agente altamente enfocado que pueda jugar un juego de Atari, sino una inteligencia generalizada que pueda aprender todos los juegos de Atari, los ritmos generales también son específicos cuando se trata del aprendizaje automático de centros de datos. Sería relativamente simple crear un programa personalizado que modele cada centro de datos, pero “sería mucho mejor”, dice Gao, “si creáramos una inteligencia general que todos puedan aprovechar”.

Entonces eso fue lo que hicieron. Dieciocho meses después, los modelos se han probado en múltiples instalaciones y han producido una reducción del 40% en la energía utilizada para la refrigeración y una reducción del 15% en la carga general de energía. Aunque uno de estos pilotos ya ha logrado llevar el PUE en uno de los centros de datos de prueba de Google a un nuevo mínimo, el creciente equipo de DCIQ cree que solo ha arañado la superficie de las aplicaciones más generales del aprendizaje automático. El equipo ambiental de Google quiere que nuestras operaciones emitan menos carbono. Las operaciones de hardware aspiran a menos fallas de componentes. Las plataformas a las personas les importa el consumo de energía del servidor. El aprendizaje automático puede ayudarlos a todos a alcanzar sus sueños de eficiencia.

Sin mencionar los del resto del mundo. “Estamos tratando de ser realmente de código abierto sobre esto”, dice Gao. “Creemos firmemente que el trabajo que estamos haciendo también puede beneficiar a otros”. Esperamos que un segundo documento técnico, que saldrá pronto con más detalles sobre el trabajo de DCIQ, ayude a otros centros de datos a reducir su uso de energía, y muchos otros tipos de instalaciones (plantas de energía, fábricas, etc.) tienen infraestructuras que también podrían beneficiarse. Esperamos que el trabajo que DCIQ haya hecho y que haga en el futuro ayude a otras compañías e industrias a ser mucho más ecológicas, en ambos sentidos.

Dejar un Comentario

Por favor ingrese su comentario
Por favor entre su nombre aquí