RNN의 이해

머신러닝

RNN의 이해

content0474 2024. 10. 21. 12:00

Recurrent Neural Network , 순환신경망

시퀀스 데이터를 처리하는데 특화된 인공신경망으로 ,이전 시점의 정보를 은닉층에 가지고 있다가 다음 출력을 생성한다.

즉 데이터 입력 시 입력데이터와 이전시점의 은닉상태를 모두 사용하여 현재 상태를 계산할 수 있다.

전체코드(강의자료에 있는것을 약간 수정함)

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt

# Sine 파형 데이터 생성
def create_sine_wave_data(seq_length, num_samples):
    X = []
    y = []
    for _ in range(num_samples):
        start = np.random.rand()
        x = np.linspace(start, start + 2 * np.pi, seq_length)
        X.append(np.sin(x))
        y.append(np.sin(x + 0.1))
    return np.array(X), np.array(y)

seq_length = 50
num_samples = 1000
X, y = create_sine_wave_data(seq_length, num_samples)

# 데이터셋을 PyTorch 텐서로 변환
X = torch.tensor(X, dtype=torch.float32).unsqueeze(-1)
y = torch.tensor(y, dtype=torch.float32).unsqueeze(-1)

# 모델 정의
class SimpleRNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleRNN, self).__init__()
        self.hidden_size = hidden_size
        self.rnn = nn.RNN(input_size, hidden_size, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        h0 = torch.zeros(1, x.size(0), self.hidden_size).to(x.device)
        out, _ = self.rnn(x, h0)
        out = self.fc(out[:, -1, :])  # 마지막 시간 단계의 출력
        return out

input_size = 1
hidden_size = 32
output_size = 1

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = SimpleRNN(input_size, hidden_size, output_size).to(device)

X, y = X.to(device), y.to(device)

# 손실 함수와 최적화 알고리즘 정의
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)

# 모델 학습
num_epochs = 100
for epoch in range(num_epochs):
    model.train()
    outputs = model(X)
    optimizer.zero_grad()
    loss = criterion(outputs, y.squeeze(-1))  # 출력 차원을 맞춰줌
    loss.backward()
    optimizer.step()

    if (epoch + 1) % 10 == 0:
        print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')

print('Finished Training')

# 모델 평가
model.eval()
with torch.no_grad():
    predicted = model(X).cpu().numpy()  # GPU에서 CPU로 변환

# 시각화
plt.figure(figsize=(10, 5))
plt.xlim(0, len(y))  # X축 범위를 데이터 크기에 맞춰 조정
plt.ylim(-1, 1)  # Y축 범위를 특정 값으로 제한
plt.plot(y.cpu().numpy().flatten(), label='True')  # GPU에서 CPU로 변환 및 flatten
plt.plot(predicted.flatten(), label='Predicted')
plt.legend()
plt.show()

이것은 사인파형을 예측하는 RNN 모델이다.

import와 사인함수 만드는 부분은 생략하고 모델정의부터 보도록 하겠다.

ANN,CNN과 마찬가지로 클래스를 정의하고 상속받고 init함수를 쓰고 있다.

def __init__(self, input_size, hidden_size, output_size):

RNN의 이해-2 (0)	2024.10.23
딥러닝 모델들 (0)	2024.10.22
CNN의 이해 (0)	2024.10.18
ANN의 이해 (1)	2024.10.17
간단한 수학 통계 지식(1) (5)	2024.10.16

2025. 06
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

RNN의 이해

'머신러닝' 카테고리의 다른 글

'머신러닝'의 다른글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역