使用 Python 将英语单词转换为数字向量

English words to a vector of numbers using Python

我有一个 CSV 格式的数据库,其中包含数百人的身份(名字、姓氏、性别、phone 号码、邮政编码)。我打算隐藏名字和姓氏以保持身份。在 Python 中有没有办法输入一个单词并将其转换为数字向量?或者,这应该使用机器学习技术来完成吗?我有 Python.

的基本知识

随附数据库的片段。

您可以将输入文本发送到哈希函数:

import hashlib

with open('data.csv', 'r') as csv_file:
    lines = csv_file.readlines()
    for line in lines:
        hash_object = hashlib.sha256(line.encode())
        print(int(hash_object.hexdigest(), 16))