高周波エンジニアのためのAI・機械学習入門(GPU編30)Keras3(バックエンドはJax)を使ってRNNの一種LSTM(=長短期記憶)で21次のLCバンドパスフィルタ(L,Cのパラメータ42個)のSパラメータの値から素子の値(L、C)を推定する。
DNN, CNNと来て今回はRNNの一種、LSTM。
コードはこんな感じで。
import os
os.environ["KERAS_BACKEND"] = "jax"
import keras
import jax
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from jax import config
config.update("jax_enable_x64", False)
plt.rcParams['font.family'] = 'Noto Sans CJK JP'
data_label = np.load("21stagefilter.npz")
data = data_label["data"]
label = data_label["label"]
x_train, x_test, y_train, y_test = train_test_split(data, label, test_size=0.3, random_state=0)
scaler_y = StandardScaler()
y_train_f = scaler_y.fit_transform(y_train)
ord = 21
hidden_dim = 200
inputs = keras.Input(shape=(200, 5))
x = keras.layers.LSTM(100, return_sequences=True)(inputs)
x = keras.layers.LSTM(100)(x)
outputs = keras.layers.Dense(ord * 2)(x)
model = keras.Model(inputs=inputs, outputs=outputs)
model.compile(loss = 'mean_squared_error' ,optimizer=keras.optimizers.Adam())
batch_size = 128
epochs = 500
keras.utils.set_random_seed(1)
history = model.fit(
x_train,
y_train_f,
batch_size=batch_size,
epochs=epochs,
validation_split=0.15,
)
y_pred_f = model.predict(x_test)
y_pred = scaler_y.inverse_transform(y_pred_f)
metric = keras.metrics.R2Score()
metric.update_state(y_test, y_pred)
result = metric.result()
print(result)
error = np.abs((y_test - y_pred)/y_test*100)
print(error.mean(axis=0))
|
結果はこちら。
まずまずだがCNNの5倍くらい時間かかる上にCNNのほうが精度がいい。この例ではあまりよくなさそう。
次はTransformerをやってみよう。



















最近のコメント