IT Japan
빅쿼리란? 본문
BigQuery는 자율형 데이터-AI 플랫폼으로, 수집부터 AI 기반 통계까지 전체 데이터 수명 주기를 자동화하여 데이터에서 AI로, AI에서 액션으로 더 빠르게 이동할 수 있습니다.
기능
AI에 데이터 연결
익숙한 SQL을 사용하여 BigQuery 내에서 바로 ML 모델을 만들고 실행할 수 있습니다. 기본 제공되는 선행 학습된 모델, Vertex AI로 학습된 모델 또는 커스텀 모델을 활용하고 Vertex AI Model Registry에 등록합니다. 최신 AI 모델을 사용하여 문서 처리, 이미지 주석, 오디오 스크립트 작성 등의 멀티모달 데이터 분석, 텍스트 요약, 감정 분석 등의 생성형 AI 작업, 이상 감지, 제품 추천 등의 벡터 검색 사용 사례를 위한 임베딩 생성을 수행할 수 있습니다.
기본 제공 AI 에이전트 및 워크플로 자동화
BigQuery의 Gemini를 통해 워크플로를 위한 AI 기반 경험과 자동화를 활용하세요. 데이터 캔버스에서 자연어 프롬프트를 사용하여 데이터 세트를 찾고, 조인하고, 쿼리하고, 결과를 시각화합니다. 데이터 준비, 오류 감지, 변환을 자동화합니다. 테이블 메타데이터에서 자동으로 쿼리를 파악하고 컨텍스트 인식 코딩 지원을 받습니다. 파티션 나누기, 클러스터링, 구체화된 뷰에 대한 지능형 추천으로 비용을 절감하고 데이터 인프라를 최적화하세요.
오픈소스 및 개방형 형식 선택
통합 보안, 런타임 메타데이터, 거버넌스를 갖춘 BigQuery에서 SQL 워크로드와 함께 서버리스 Spark를 실행합니다. BigQuery는 BigQuery의 스토리지 혁신 기술과 Apache Iceberg를 결합해 '하나의 관리형 테이블' 접근 방식을 제공하므로 처리량이 높은 수집과 멀티모달 분석을 지원하여 Apache Iceberg, Delta, Hudi와 같은 개방형 형식으로 쉽게 작업할 수 있습니다.
Apache Iceberg용 BigQuery 테이블 | Google Cloud
Iceberg 테이블에 BigQuery를 사용하는 방법을 설명합니다.
cloud.google.com
데이터 및 AI 거버넌스 기본 제공
데이터 거버넌스는 메타데이터, 데이터 품질, 계보 및 프로파일링을 지원하는 새로운 BigQuery 유니버설 카탈로그와 함께 Dataplex 기능의 완전한 통합을 포함하여 BigQuery에 기본 제공됩니다. 고객은 데이터 세트 스키마, 노트북, 보고서, 공개 및 상용 데이터 세트 목록 등 자산에 대한 풍부한 AI 기반 메타데이터 검색 및 탐색 기능을 사용할 수 있습니다. BigQuery 사용자는 거버넌스 규칙을 사용하여 BigQuery 객체 테이블의 정책을 관리할 수도 있습니다.
BigQuery 범용 카탈로그(Dataplex Catalog)의 데이터 카탈로그 관리 정보 | Google Cloud
BigQuery 범용 카탈로그(이전 명칭: Dataplex Catalog)는 메타데이터를 저장, 관리, 액세스할 수 있는 플랫폼을 제공합니다.
cloud.google.com
엔터프라이즈 규모 및 효율성을 위해 빌드
BigQuery의 고유한 아키텍처는 스토리지와 컴퓨팅을 분리하여 페타바이트 규모의 분석을 수행하는 한편 압축 스토리지, 컴퓨팅 자동 확장, 유연한 가격 책정 등으로 비용을 최적화합니다. 내부적으로 BigQuery는 Borg, Colossus, Jupiter, Dremel과 같은 광범위한 Google 인프라 기술을 사용합니다. 또한 BigQuery는 미션 크리티컬 워크로드에 대해 리전 간 데이터 세트 복제 기능을 활용하여 전체 리전이 중단되는 경우 관리형 재해 복구를 제공합니다.