如何训练 tensorflow.js 医疗数据
How to train tensorflow.js on medical data
我正在用 tfjs 和一些(假的)医疗数据(乳腺癌)做一个 POC 脚本。数据如下所示:
[206, 293, 140, 126, 117, 27, 35, 152, 239, 79] 结果 (ys) 为 [1],其中 1 为恶性,0 为良性。
脚本似乎可以训练,但 accuracy/loss 永远不会改变,无论数据如何,我都会得到相同的结果。我已经验证了 data/format。脚本如下:
const transformedData = _.shuffle(data).map(util.transformRow);
// Define the model.
const model = tf.sequential();
// Set up the network layers
model.add(tf.layers.dense({units: 10, activation: 'relu', inputShape: [10]}));
model.add(tf.layers.dense({units: 150, activation: 'relu'}));
model.add(tf.layers.dense({units: 250, activation: 'relu'}));
model.add(tf.layers.dense({units: 250, activation: 'relu'}));
model.add(tf.layers.dense({units: 250, activation: 'relu'}));
model.add(tf.layers.dense({units: 1, activation: 'softmax', outputShape: [1]}));
// Define the optimizer
const optimizer = tf.train.adam(LEARNING_RATE);
// Init the model
model.compile({
optimizer: optimizer,
loss: 'meanSquaredError',
metrics: ['accuracy'],
});
const ys = transformedData.map(d => [d.ys]);
const xs = transformedData.map(d => d.xs);
let xTrain = tf.tensor2d(xs.slice(0,500), [xs.slice(0,500).length, 10]); // [[123,234,345...], [...]...]
let yTrain = tf.tensor2d(ys.slice(0,500), [ys.slice(0,500).length, 1]); // [[1], [0]...]
console.log('ready to start training model');
const history = await model.fit(xTrain, yTrain, {
epochs: EPOCHS,
validationData: [xTrain, yTrain],
})
明确地说,我现在不关心超级准确的结果或优化,我只希望脚本能够实际训练模型。
两期:
由于您处于二元分类设置中,因此您应该使用loss: 'binaryCrossentropy'
(MSE用于回归问题)。
在这样的设置下,输出层的softmax
激活没有任何意义;将其更改为 sigmoid
.
此外,您没有分享您 LEARNING_RATE
的实际价值;尝试完全删除参数 - 已知 Adam 通常(非常)好地使用其默认学习率。
我正在用 tfjs 和一些(假的)医疗数据(乳腺癌)做一个 POC 脚本。数据如下所示:
[206, 293, 140, 126, 117, 27, 35, 152, 239, 79] 结果 (ys) 为 [1],其中 1 为恶性,0 为良性。
脚本似乎可以训练,但 accuracy/loss 永远不会改变,无论数据如何,我都会得到相同的结果。我已经验证了 data/format。脚本如下:
const transformedData = _.shuffle(data).map(util.transformRow);
// Define the model.
const model = tf.sequential();
// Set up the network layers
model.add(tf.layers.dense({units: 10, activation: 'relu', inputShape: [10]}));
model.add(tf.layers.dense({units: 150, activation: 'relu'}));
model.add(tf.layers.dense({units: 250, activation: 'relu'}));
model.add(tf.layers.dense({units: 250, activation: 'relu'}));
model.add(tf.layers.dense({units: 250, activation: 'relu'}));
model.add(tf.layers.dense({units: 1, activation: 'softmax', outputShape: [1]}));
// Define the optimizer
const optimizer = tf.train.adam(LEARNING_RATE);
// Init the model
model.compile({
optimizer: optimizer,
loss: 'meanSquaredError',
metrics: ['accuracy'],
});
const ys = transformedData.map(d => [d.ys]);
const xs = transformedData.map(d => d.xs);
let xTrain = tf.tensor2d(xs.slice(0,500), [xs.slice(0,500).length, 10]); // [[123,234,345...], [...]...]
let yTrain = tf.tensor2d(ys.slice(0,500), [ys.slice(0,500).length, 1]); // [[1], [0]...]
console.log('ready to start training model');
const history = await model.fit(xTrain, yTrain, {
epochs: EPOCHS,
validationData: [xTrain, yTrain],
})
明确地说,我现在不关心超级准确的结果或优化,我只希望脚本能够实际训练模型。
两期:
由于您处于二元分类设置中,因此您应该使用
loss: 'binaryCrossentropy'
(MSE用于回归问题)。在这样的设置下,输出层的
softmax
激活没有任何意义;将其更改为sigmoid
.
此外,您没有分享您 LEARNING_RATE
的实际价值;尝试完全删除参数 - 已知 Adam 通常(非常)好地使用其默认学习率。