从 ICD9 代码预测 RxNorm 代码的卷积网络是否有意义?

Do convolutional networks to predict RxNorm codes from ICD9 codes make sense?

公司要求我专门使用卷积神经网络根据给定的诊断(ICD9 代码)预测开出的药物类型(RxNorm 代码)。我将得到医生开出的一百万张处方。每个处方都独立于下一个。

例如:110, 670, 890, BB2344 前 3 项是 ICD9 代码,最后一项是输出,即 RxNorm 代码。有一百万个。

老实说,这个任务对我来说似乎很荒谬。我不知道如何构建输入。

诊断没有固有顺序,也没有时间戳。

一个诊断可能会增加另一个诊断的可能性;但有很多例子表明它们只是独立的。

ICD9 编码系统具有层次结构,因此代码 110 和 120(均感染)比代码 110 和 890(感染和伤口)的相关性更密切。

基本上,我的输入 "image" 应该是什么样的?或者 CNN 对于这个问题根本没有意义?

谢谢!

CNN 需要输入的空间(或时间)相关性。这里没有这样的东西,所以简短的回答是不,没有意义。一般来说,考虑到数据的简单程度,我实际上希望一些基本的线性模型(在一个热编码数据上)/甚至基本的规则归纳能够很好地工作。

"cnn-like" 结构的唯一可能用途是通过图 CNN 来利用图的性质。由于输入中的层次结构可以被认为是 "spatial" 相关性。