인프라를 관리할 필요 없이 프런트엔드 및 백엔드 서비스를 실행하고, 작업을 일괄 처리하고, LLM을 호스팅하며, 처리 워크로드를 큐에 추가하세요.
매월 요청 200만 개가 무료로 제공됩니다.
기능
원하는 언어, 프레임워크, 라이브러리를 사용하여 코드를 작성하고 컨테이너로 패키징하고 'gcloud run deploy'를 실행하면 앱이 활성화됩니다. 프로덕션 환경에서 실행하는 데 필요한 모든 것이 제공됩니다. 컨테이너 빌드는 전적으로 선택사항입니다. Go, Node.js, Python, Java, .NET Core, Ruby를 사용하는 경우 사용 중인 언어의 권장사항에 따라 컨테이너를 빌드하는 소스 기반 배포 옵션을 사용할 수 있습니다.
이벤트 기반의 장기 실행 서비스를 소유하고 있든 컨테이너화된 작업을 배포하여 데이터를 처리하든 Cloud Run은 컨테이너를 0에서부터 자동으로 확장 및 축소하므로 코드가 실행될 때만 비용을 지불하면 됩니다.
(현재 공개 프리뷰 버전) NVIDIA L4 GPU에 대한 주문형 액세스로 AI 추론 워크로드를 실행할 수 있습니다. GPU 인스턴스가 5초 만에 시작되며 Scale-to-zero 기능도 사용할 수 있습니다.
(현재 공개 프리뷰 버전) Cloud Run으로 직접 함수를 작성하고 배포하여 기본 서비스 구성을 완벽하게 제어할 수 있습니다.
Cloud Run은 또한 빌드팩을 사용하여 프로덕션 단계로 전환하는 방법을 자동화할 수 있으므로 머신에 Docker를 설치하지 않고도 소스에서 직접 배포할 수 있습니다. 새 커밋이 특정 Git 저장소 분기로 푸시될 때마다 빌드를 자동화하고 코드를 배포할 수 있습니다.
Cloud Run 작업을 사용하면 인스턴스를 동시 실행하여 일괄 처리를 수행할 수 있습니다. HTTP 요청에 응답하지 않는 완료될 때까지 실행되는 작업을 모두 서버리스 플랫폼에서 실행합니다. 작업을 최대 24시간 동안 실행합니다.
트래픽을 VPC 네트워크로 직접 전송하고 VPC에서 실행 중인 모든 서비스와 연결합니다.
작동 방식
Cloud Run은 Google의 확장 가능한 인프라에서 바로 코드를 실행할 수 있는 완전 관리형 플랫폼입니다. Cloud Run은 간단하고 자동화되어 있으며 생산성을 높일 수 있도록 설계되었습니다.
일반적인 용도
Cloud Run으로 웹사이트 배포 및 호스팅
원하는 스택을 사용해서 웹앱을 빌드하고 SQL 데이터베이스에 액세스하고, 동적 HTML 페이지를 렌더링합니다. Cloud Run을 사용하면 웹사이트로 들어오는 요청이 없을 때 Scale-to-zero 기능을 사용할 수도 있습니다.
이 Codelab에서는 Cloud Shell에서 트리거하는 Cloud Build를 통해 만든 Docker 이미지로 시작합니다. 그런 다음 Cloud Shell에서 명령어를 사용하여 이미지를 Cloud Run에 배포합니다.
Cloud Run으로 웹사이트 배포 및 호스팅
원하는 스택을 사용해서 웹앱을 빌드하고 SQL 데이터베이스에 액세스하고, 동적 HTML 페이지를 렌더링합니다. Cloud Run을 사용하면 웹사이트로 들어오는 요청이 없을 때 Scale-to-zero 기능을 사용할 수도 있습니다.
이 Codelab에서는 Cloud Shell에서 트리거하는 Cloud Build를 통해 만든 Docker 이미지로 시작합니다. 그런 다음 Cloud Shell에서 명령어를 사용하여 이미지를 Cloud Run에 배포합니다.
Cloud Run GPU로 LLM 호스팅
Cloud Run에서 Llama 3.1, Mistral, Gemma 2 등 원하는 LLM을 사용하여 실시간 AI 추론을 수행합니다. 또한 영상 인식, 동영상 트랜스코딩, 스트리밍과 같은 컴퓨팅 집약적인 애플리케이션에도 적합합니다.
Cloud Run GPU로 LLM 호스팅
Cloud Run에서 Llama 3.1, Mistral, Gemma 2 등 원하는 LLM을 사용하여 실시간 AI 추론을 수행합니다. 또한 영상 인식, 동영상 트랜스코딩, 스트리밍과 같은 컴퓨팅 집약적인 애플리케이션에도 적합합니다.
가격 책정
Cloud Run 가격 책정 방식 | 종량제 요금으로, 100밀리초 단위로 반올림하여 사용한 만큼만 비용이 청구되며 항상 무료 등급도 제공됩니다. 사용하지 않으면 요금이 부과되지 않습니다. | |
---|---|---|
SKU | 무료 등급 초과 시 가격(할인 미적용) | 무료 |
CPU | $0.00001800/vCPU-초 | 처음 240,000vCPU-초/월 무료 |
메모리 | $0.00000200/GiB-초 | 처음 450,000GiB/월 무료 |
약정 사용 할인을 구매하여 Cloud Run의 지속적인 사용을 줄일 수 있습니다.
Cloud Run 가격 책정 방식
종량제 요금으로, 100밀리초 단위로 반올림하여 사용한 만큼만 비용이 청구되며 항상 무료 등급도 제공됩니다. 사용하지 않으면 요금이 부과되지 않습니다.
CPU
$0.00001800/vCPU-초
처음 240,000vCPU-초/월 무료
$0.00000200/GiB-초
처음 450,000GiB/월 무료
약정 사용 할인을 구매하여 Cloud Run의 지속적인 사용을 줄일 수 있습니다.
비즈니스 사례
다른 기업에서 Cloud Run을 사용하여 어떻게 비용을 절감하고 ROI를 높이며 혁신을 주도하는지 알아보세요.
BBC: 엔드 투 엔드 서버리스 아키텍처로 수많은 뉴스 따라잡기
BBC는 트래픽이 급증하는 동안 컨테이너 인스턴스를 150~200개에서 1,000개 이상으로 늘렸습니다. "그럼에도 인프라는 문제 없이 작동했습니다."
스토리 읽기주요 고객
FAQ
Cloud Run을 사용하면 VM 또는 Kubernetes 기반 배포에 필요한 오버헤드 없이 웹사이트를 관리하고 배포할 수 있습니다. 이는 관리 관점에서 보다 간단한 접근 방식일 뿐만 아니라, 웹사이트에 들어오는 요청이 없을 때 Scale-to-zero 기능도 제공합니다.
Cloud Run은 App Engine 표준 환경과 App Engine 가변형 환경의 최고의 기능을 다양하게 통합하여 App Engine 환경을 개선하도록 설계되었습니다. Cloud Run 서비스는 웹사이트 배포 및 호스팅을 포함하여 App Engine 서비스와 동일한 워크로드를 처리할 수 있지만, Cloud Run을 사용하면 고객이 이러한 서비스를 훨씬 더 유연하게 구현할 수 있습니다.