개요
- BigQuery ML을 소개한다.
- BigQuery ML을 사용하면, 머신러닝 모델을 만들고 또한 실행할 수 있다.
목표
- BigQuery ML에서 CREATE MODEL 문을 사용하여 선형회귀 모델 만들기
ML.EVALUATE 함수를 사용하여 ML 모델 평가ML.PREDICT 함수를 사용하여 ML 모델 예측
주의 사항
- BigQuery 비용 관련된 문서는 다음과 같다.
1단계: 데이터 세트 만들기
- 데이터 세트 ID에
bqml_practice 입력 - 데이터 위치로 미국 US 선택
- 나머지는 모두 Default로 설정한다.

2단계: 모델 만들기
데이터 소개
- 먼저 데이터를 소개한다.
- 데이터 원 자료는 해당 논문에서 확인할 수 있다.
- 데이터 셋에 대한 설명은 다음과 같다.
species — 펭귄의 종(문자열)island — 펭귄이 사는 섬(문자열)culmen_length_mm — 컬멘 길이(밀리미터)(FLOAT64).culmen_depth_mm — 컬멘 깊이(밀리미터)(FLOAT64)flipper_length_mm — 지느러미의 길이(밀리미터)(FLOAT64)sex — 펭귄의 성별(문자열)
모델 만들기 코드 실행
CREATE MODEL 명령어를 실행하여 모델을 생성한다.
#standardSQL
CREATE OR REPLACE MODEL `bqml_practice.penguins_model`
OPTIONS
(model_type='linear_reg',
input_label_cols=['body_mass_g']) AS
SELECT
*
FROM
`bigquery-public-data.ml_datasets.penguins`
WHERE
body_mass_g IS NOT NULL
- 실행 결과는 보는 것처럼 Preprocess, Train, Evaluate 작업이 진행 된 것을 확인할 수 있다.
