架构设计以在给定输入症状的情况下找到最相关的症状

Architecture design to find the most relevant symptoms given an input symptom

我的目标是建立一个症状推荐系统

我的 excel 中有 3 列数据。

  1. 患者编号
  2. 症状
  3. 疾病检测

对于每个患者 id,存在一种或多种导致疾病检测的症状。我的目标是根据输入症状找到最相关的症状。

鉴于数据有限,我无法想出办法来制定计划。我的一个想法是将数据转换为一个矩阵,其中所有症状作为列,疾病作为行。对于每种疾病,如果有症状标记 1,否则为所有其他症状标记 0。这种方法行得通吗?关于如何设计这个系统的任何想法

您可以使用 scikit 学习库构建一个预测模型,其中分类器由症状和疾病标签组成。然后,您可以分析哪些症状对疾病的影响最大。