如果我们使用 Hadoop 处理大数据,数据存储在哪里,因为 hadoop 数据库 HBase 存储结构化数据,而大数据是非结构化的

Where data goes to store if we uses Hadoop to handle bigdata because hadoop database HBase stores Structured data whereas big data is unstructured

Hadoop 用于处理大数据,hadoop 使用 HBase 作为其数据库,但 BigData 可能 80% 是非结构化数据,HBase 仅存储结构化数据。

非结构化数据存储在哪里?或者有什么hadoop的工具可以将非结构化数据转换成结构化格式?

"Big data"并不意味着任何结构的存在,但大多数数据集都是半结构化的,否则很难一致地解析。

HBase 位于 HDFS 之上。而Hbase可以存储二进制blob,因此它的数据可以用来存储非结构化数据。

HDFS 可以存储任何类型的数据。它没有关于文件内容的元数据

您通常使用 Hive (MetaStore) 来应用 HDFS 数据集的结构