Keras 预处理交易数据
Keras preprocessing trading data
我在预处理来自 .csv 的交易数据以使其适合 sgd 模型神经网络时遇到问题 input/output。
我已经使用 pandas 库导入了数据,但也许有更好的方法?
我需要设置列名,里面的数据需要是double类型,并且转换成tf.data.Dataset.
我有 2 个数据集:testingdata.csv 和 trainingdata.csv
每个都有 4 列:开盘价、最大值、最小值、收盘价
'Open' 列是预测值 Y,而 'max'、'min' 和 'close' 是 X 输入。
inside my .csv file
我也不知道 keras 中的 'metric' 是什么以及我应该在这里使用什么指标
所以我的问题是:最好的方法是什么以及如何去做。
谢谢
使用 pd.read_csv 是导入 .csv
个文件的好方法
import pandas as pd
df= pd.read_csv('data.csv')
但您需要将列名称更改为自定义名称,这样您才能这样做:
df = pd.read_csv('data.csv',
header=None,
names=["open", "max","min","close"],
encoding='utf-16')
你可以在dataframe中看到导入的.csv
文件头:
df.head(5)
如果您想从 Pandas dataframe
转换为 TensorFlow Dataset
:
import tensorflow as tf
target = df.pop('Open')
dataset = tf.data.Dataset.from_tensor_slices((df.values, target.values))
我在预处理来自 .csv 的交易数据以使其适合 sgd 模型神经网络时遇到问题 input/output。
我已经使用 pandas 库导入了数据,但也许有更好的方法?
我需要设置列名,里面的数据需要是double类型,并且转换成tf.data.Dataset.
我有 2 个数据集:testingdata.csv 和 trainingdata.csv
每个都有 4 列:开盘价、最大值、最小值、收盘价
'Open' 列是预测值 Y,而 'max'、'min' 和 'close' 是 X 输入。
inside my .csv file
我也不知道 keras 中的 'metric' 是什么以及我应该在这里使用什么指标
所以我的问题是:最好的方法是什么以及如何去做。
谢谢
使用 pd.read_csv 是导入 .csv
个文件的好方法
import pandas as pd
df= pd.read_csv('data.csv')
但您需要将列名称更改为自定义名称,这样您才能这样做:
df = pd.read_csv('data.csv',
header=None,
names=["open", "max","min","close"],
encoding='utf-16')
你可以在dataframe中看到导入的.csv
文件头:
df.head(5)
如果您想从 Pandas dataframe
转换为 TensorFlow Dataset
:
import tensorflow as tf
target = df.pop('Open')
dataset = tf.data.Dataset.from_tensor_slices((df.values, target.values))