¿Te perdiste Next '24? Ya están disponibles todas las sesiones bajo demanda. Ver ahora

Arquitectura de supercomputación integrada

Hiperordenador con IA

Hardware, software y consumo optimizados con IA para mejorar la productividad y la eficiencia.

Haz la encuesta rápida sobre tu preparación para la IA

Blog: Presentamos Cloud TPUv5 y AI Hypercomputer

Información general

Hardware con rendimiento optimizado

Nuestra infraestructura con optimización del rendimiento, que incluye las TPU de Google Cloud, la GPU de Google Cloud, Google Cloud Storage y la red de Jupiter subyacente de forma coherente proporciona un tiempo más rápido para entrenar modelos de vanguardia a gran escala debido a las sólidas características de escalado de la arquitectura que ofrecen la mejor relación precio-rendimiento para servir modelos grandes.

Potencia tus LLMs con las TPU de Google Cloud

Descubre cómo optimiza el acelerador de IA de Google Cloud, diseñado a medida para las cargas de trabajo de modelos de lenguaje de gran tamaño (LLM), el rendimiento de las cargas de trabajo de los LLMs, la TPU de Google Cloud.

Ver bajo demanda

Software libre

Nuestra arquitectura está optimizada para admitir las herramientas y bibliotecas más habituales, como Tensorflow, Pytorch y JAX. Además, permite a los clientes beneficiarse de tecnologías como las configuraciones de TPU de Cloud Multislice y Multihost y servicios gestionados como Google Kubernetes Engine. De esta forma, los clientes pueden desplegar cargas de trabajo habituales de forma inmediata, como el framework NVIDIA NeMO orquestado por SLURM.

LLMs abiertos en GKE-Llama 2 y otros ámbitos

Descubre cómo puedes llevar tu juego de plataforma de IA generativa al siguiente nivel con los LLMs abiertos en GKE-Llama 2 y muchos más.

Ver bajo demanda

Flexibilidad de uso

Nuestros modelos de consumo flexibles permiten a los clientes elegir costes fijos con descuentos por compromiso de uso o modelos dinámicos bajo demanda en función de las necesidades de su negocio.Gracias a Dynamic Workload Scheduler, los clientes pueden obtener la capacidad que necesitan sin tener que asignar demasiadas tareas para que paguen solo por lo que necesitan.Además, las herramientas de optimización de costes de Google Cloud ayudan a automatizar el uso de recursos para reducir las tareas manuales de los ingenieros.

Optimiza el acceso a los recursos y la economía de cara a las cargas de trabajo de IA y aprendizaje automático

Descubre cómo optimiza el servicio Dynamic Workload Scheduler para optimizar la ejecución de cargas de trabajo de IA.

Leer el blog

Cómo funciona

Google es un líder en inteligencia artificial gracias a la invención de tecnologías como TensorFlow. ¿Sabías que puedes aprovechar la tecnología de Google en tus propios proyectos? Descubre la historia de Google en materia de innovación en infraestructura de IA y cómo puedes aprovecharla para tus cargas de trabajo.

Ver bajo demanda

Diagrama de la arquitectura de hiperordenador de IA de Google Cloud junto con la foto de Chelsie, responsable de producto de Google Cloud

Usos habituales

Ejecutar entrenamiento de IA a gran escala

Curso en IA potente, escalable y eficiente

La arquitectura de hiperordenador de IA ofrece la opción de usar la infraestructura subyacente que mejor se adapte a tus necesidades de entrenamiento.

Cómo definir una infraestructura de almacenamiento para cargas de trabajo de IA

Tres gráficos que describen los factores de crecimiento de la IA

Instrucciones

Curso en IA potente, escalable y eficiente

La arquitectura de hiperordenador de IA ofrece la opción de usar la infraestructura subyacente que mejor se adapte a tus necesidades de entrenamiento.

Cómo definir una infraestructura de almacenamiento para cargas de trabajo de IA

Otros recursos

Curso en IA potente, escalable y eficiente

Mide la eficacia de tu entrenamiento a gran escala al estilo de Google con ML Productivity Goodput.

Presentamos ML Productivity Goodput: una métrica para medir la eficiencia de los sistemas de IA

Velocidad de entrenamiento de TPUv4(bf16) frente a TPUv5(int8)

Ejemplos de clientes

Character AI aprovecha Google Cloud para escalar verticalmente

"Necesitamos GPUs para generar respuestas a los mensajes de los usuarios. Además, cuantos más usuarios lleguen a nuestra plataforma, necesitaremos más GPUs para ofrecer sus servicios. Por ello, en Google Cloud podemos experimentar para encontrar la plataforma adecuada para una carga de trabajo concreta. Es fantástico tener esa flexibilidad para elegir qué soluciones son más valiosas". Myle Ott, ingeniero fundador de Character.AI

Ver ahora

Myle Ott, ingeniero fundador de Character.AI

1:36

Proporciona aplicaciones basadas en IA