]TensorFlow2[ Estimator를 사용한 비선형회귀

통계/Tensorflow2.0 예제

2020. 11. 28.

# !pip install tensorflow==2.2.0

Import the required modules

import numpy as np
import tensorflow as tf
from tensorflow import keras as ks
from keras.layers import Dense
from sklearn.model_selection import train_test_split

Model configurations

base_config = {
    'model_path': 'model_path',
    'model_version': '0', 
    'dataset_size': 100000,
    'test_ratio': 0.33,
    'activation': 'relu',
    'hiddens': [1],
    'epochs': 25,
    'batch_size': 1000,
    'loss_function': 'mean_squared_error',
    'optimizer': 'adam',

from copy import copy

config_hidden_1 = copy(base_config)
config_hidden_1['model_version'] = '1'
config_hidden_1['hiddens'] = [11, 1]

config_hidden_2 = copy(base_config)
config_hidden_2['model_version'] = '2'
config_hidden_2['hiddens'] = [33, 11, 1]

config_hidden_3 = copy(base_config)
config_hidden_3['model_version'] = '3'
config_hidden_3['hiddens'] = [99, 33, 11, 1]

config_hidden_4 = copy(base_config)
config_hidden_4['model_version'] = '4'
config_hidden_4['hiddens'] = [297, 99, 33, 11, 1]

모델 생성에 쓰여질 값들은 외부에서 수정할 수 있도록 하면 재사용과 테스트가 편리하다. 가장 기본적인 설정을 base_config에 선언하여, 이것을 상속 및 수정한 값들 config_hidden1, ..., config_hidden4 가 선언됐다. 히든 레이어의 깊이와 형상이 변경되었고, 모델이 저장될 폴더 이름에 쓰일 model_version 값이 바뀌었다.

Define the cubic function

def cubic_generator(a, b, c, d, e):
    def cubic(x):
        입력: 3차원 벡터
        출력: 입력 벡터에 대한 3차 함수 계산 값
        x1, x2, x3 = x[0], x[1], x[2]
        return a + b*x1 + c*x2**2 + d*x3**3 + e
    return cubic

cubic_function = cubic_generator(1, 3, 5, 10, 20)

이번 회기에서 사용할 3차원 벡터에 대한 삼차함수를 선언했다.

Create the train & test datasets with the cubic function

xs = np.random.uniform(0, 1, (base_config['dataset_size'], 3))
ys = [cubic_function(x) for x in xs]
x_train, x_test, y_train, y_test = train_test_split(xs, ys, test_size=base_config['test_ratio'])

삼차함수를 사용해서 데이터 셋을 생산한다음 학습 데이터와 테스트 데이터로 쪼갠다.

Define a data feeder

def input_feed_generator(x, y, epochs=base_config['epochs'], shuffle=True, batch_size=base_config['batch_size']):
    def input_feed():
        dataset = tf.data.Dataset.from_tensor_slices((x, y))
        if shuffle:
            dataset = dataset.shuffle(2000)
        dataset = dataset.batch(batch_size).repeat(epochs)
        return dataset
    return input_feed

고수준 텐서플로 API는 학습과 평가 국면에서, 모델에 순전파시킬 tf.data.Dataset 객체를 input_fn에게 요청하여 획득한다. 학습 및 평가 모듈이 데이터 셋을 솎아내는 과정에 관여하지 않도록 책임을 잘 분리한 설계로 여겨진다.

  • tf.data.Dataset.from_tensor_slices((x, y)) 절은 입력과 타겟을 튜플로 묶어서 tf.data.Dataset 객체로 만들었다.

  • dataset.shuffle(n) 절은 데이터 셋을 적절히 섞을 것을 설정하며

  • dataset.bacth(batch_size).repeat(epochs) 절은 지정된 에폭 수에 도달할 때까지 배치 크기만큼 데이터를 뱉어내도록 설정한다.

이제 dataset은 일종의 파이썬 generator로서 호출될 때마다 지정된 배치크기의 데이터 셋을 랜덤 추출해 반환할 것이다. 한 편, 에폭이 도달되면 더 이상 데이터 셋을 뱉지 않을 것이다.

Define the training & testing phase

def train(x_train, y_train, config):
    train_dataset_feed = input_feed_generator(x_train, y_train)
    steps = config['epochs'] / config['batch_size'] * len(x_train)

    model = ks.models.Sequential()
    activation = config['activation']
    hiddens = config['hiddens']

    for i, hidden in enumerate(hiddens):
        if 1 == len(hiddens) or i == 0:
            model.add(Dense(hidden, activation=activation, input_shape=(3,)))
        elif i == len(hiddens)-1:
            model.add(Dense(hidden, activation=activation))

    loss_function = config['loss_function']
    optimizer = config['optimizer']
    model.compile(loss=loss_function, optimizer=optimizer)


    estimator = ks.estimator.model_to_estimator(keras_model=model, 
                                                model_dir=config['model_path'] + config['model_version'])

    estimator.train(input_fn=train_dataset_feed, steps=steps)

    return estimator

def test(estimator, x_test, y_test, config):
    test_dataset_feed = input_feed_generator(x_test, y_test, 
                                             epochs=1, batch_size=1, shuffle=False)
    steps = len(x_test)

    evaluation_result = estimator.evaluate(input_fn=test_dataset_feed, steps=steps)
    print('Fianl evaluation result: {}'.format(evaluation_result))

학습 국면과 평가 국면을 코딩한다.

Do train and evaluate!

estimator = train(x_train, y_train, base_config)
test(estimator, x_test, y_test, base_config)

base_config 설정에 따라 학습하고 평가한다.

Final evaluation result: {'loss': 1.4226116, 'global_step': 68675}

Model: "sequential"
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 1)                 4         
Total params: 4
Trainable params: 4
Non-trainable params: 0
estimator = train(x_train, y_train, config_hidden_1)
test(estimator, x_test, y_test, config_hidden_1)

config_hidden_1 설정에 따라 학습하고 평가한다.

Final evaluation result: {'loss': 1.4228917, 'global_step': 26800}

Model: "sequential_1"
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 11)                44        
dense_2 (Dense)              (None, 1)                 12        
Total params: 56
Trainable params: 56
Non-trainable params: 0
estimator = train(x_train, y_train, config_hidden_2)
test(estimator, x_test, y_test, config_hidden_2)

config_hidden_2 설정에 따라 학습하고 평가한다.

Final evaluation result: {'loss': 0.017187782, 'global_step': 18425}

Model: "sequential_2"
Layer (type)                 Output Shape              Param #   
dense_3 (Dense)              (None, 33)                132       
dense_4 (Dense)              (None, 11)                374       
dense_5 (Dense)              (None, 1)                 12        
Total params: 518
Trainable params: 518
Non-trainable params: 0
estimator = train(x_train, y_train, config_hidden_3)
test(estimator, x_test, y_test, config_hidden_3)

config_hidden_3 설정에 따라 학습하고 평가한다.

Final evaluation result: {'loss': 0.00090525486, 'global_step': 16750}

Model: "sequential_3"
Layer (type)                 Output Shape              Param #   
dense_6 (Dense)              (None, 99)                396       
dense_7 (Dense)              (None, 33)                3300      
dense_8 (Dense)              (None, 11)                374       
dense_9 (Dense)              (None, 1)                 12        
Total params: 4,082
Trainable params: 4,082
Non-trainable params: 0
estimator = train(x_train, y_train, config_hidden_4)
test(estimator, x_test, y_test, config_hidden_4)

config_hidden_4 설정에 따라 학습하고 평가한다.

Final evaluation result: {'loss': 0.0003716136, 'global_step': 16750}

Model: "sequential_4"
Layer (type)                 Output Shape              Param #   
dense_10 (Dense)             (None, 297)               1188      
dense_11 (Dense)             (None, 99)                29502     
dense_12 (Dense)             (None, 33)                3300      
dense_13 (Dense)             (None, 11)                374       
dense_14 (Dense)             (None, 1)                 12        
Total params: 34,376
Trainable params: 34,376
Non-trainable params: 0
