H2O MOJO(模型对象,优化):将[列]与[域]相关联
H2O MOJO (Model ObJect, Optimized): Associating [columns] with [domains]
我在 Linux 服务器上使用 R v3.3.2 和 H2O V3.10.2.1。
我通过 h2o.download_mojo
将模型保存到 MOJO。这个生成的文件是一个 .zip 文件。在 .zip 文件中有这些文本文件:
model.ini
domains/d000.txt
domains/d001.txt
domains/d002.txt
domains/d003.txt
domains/d004.txt
domains/d005.txt
domains/d006.txt
domains/d007.txt
domains/d008.txt
在 model.ini
文件中有一个部分 [columns]
列出了用于训练我的模型的列:
[columns]
name
address01
address02
city
state
zip
phone number
age
在 model.ini
文件中还有另一个部分 [domains]
列出了文件名,其中包含在训练期间用于最终模型中保留的分类列的数据:
[domains]
1: 71 d000.txt
2: 71 d001.txt
3: 51 d002.txt
4: 3243 d003.txt
5: 3228 d004.txt
6: 2954 d005.txt
7: 2456 d006.txt
9: 616 d007.txt
如何将 [columns]
中列出的列名称与其在 [domains]
中列出的域文件相关联?
例如,第一个域文件 d000.txt
不 包含列出的第一列 name
的数据。事实上,d000.txt
包含第 3 列的数据,address02
。
我怎么知道这个映射:
1: 71 d000.txt --> address02
2: 71 d001.txt --> phone number
3: 51 d002.txt --> column 23
4: 3243 d003.txt --> column 58
下载的 POJO(普通旧 java 对象)包含足够的信息来建立这种关联。我没有找到使用下载的 MOJO 执行此操作的方法。
[domains]
部分中的第四列之类的东西会有所帮助:
[domains]
1: 71 d000.txt "address02"
2: 71 d001.txt "phone number"
3: 51 d002.txt "column 23"
4: 3243 d003.txt "column 58"
感谢您的帮助!
[域] 对其所属的列有一个从 0 开始的索引。在下面的示例中,“7:”指的是 CAPSULE 列:它在 d000.txt 文件中列出了一个 2 因子域。
[columns]
AGE
RACE
DPROS
DCAPS
PSA
VOL
GLEASON
CAPSULE
[domains]
7: 2 d000.txt
我在 Linux 服务器上使用 R v3.3.2 和 H2O V3.10.2.1。
我通过 h2o.download_mojo
将模型保存到 MOJO。这个生成的文件是一个 .zip 文件。在 .zip 文件中有这些文本文件:
model.ini
domains/d000.txt
domains/d001.txt
domains/d002.txt
domains/d003.txt
domains/d004.txt
domains/d005.txt
domains/d006.txt
domains/d007.txt
domains/d008.txt
在 model.ini
文件中有一个部分 [columns]
列出了用于训练我的模型的列:
[columns]
name
address01
address02
city
state
zip
phone number
age
在 model.ini
文件中还有另一个部分 [domains]
列出了文件名,其中包含在训练期间用于最终模型中保留的分类列的数据:
[domains]
1: 71 d000.txt
2: 71 d001.txt
3: 51 d002.txt
4: 3243 d003.txt
5: 3228 d004.txt
6: 2954 d005.txt
7: 2456 d006.txt
9: 616 d007.txt
如何将 [columns]
中列出的列名称与其在 [domains]
中列出的域文件相关联?
例如,第一个域文件 d000.txt
不 包含列出的第一列 name
的数据。事实上,d000.txt
包含第 3 列的数据,address02
。
我怎么知道这个映射:
1: 71 d000.txt --> address02
2: 71 d001.txt --> phone number
3: 51 d002.txt --> column 23
4: 3243 d003.txt --> column 58
下载的 POJO(普通旧 java 对象)包含足够的信息来建立这种关联。我没有找到使用下载的 MOJO 执行此操作的方法。
[domains]
部分中的第四列之类的东西会有所帮助:
[domains]
1: 71 d000.txt "address02"
2: 71 d001.txt "phone number"
3: 51 d002.txt "column 23"
4: 3243 d003.txt "column 58"
感谢您的帮助!
[域] 对其所属的列有一个从 0 开始的索引。在下面的示例中,“7:”指的是 CAPSULE 列:它在 d000.txt 文件中列出了一个 2 因子域。
[columns]
AGE
RACE
DPROS
DCAPS
PSA
VOL
GLEASON
CAPSULE
[domains]
7: 2 d000.txt