3.hadoop中的序列化

来源:互联网 发布:teamview linux命令行 编辑:程序博客网 时间:2024/06/05 02:25
序列化的三种主要途径
作为一种序列化格式:一个对象序列化以后,它的编码可以被存储到磁盘上,供以后反序列化使用
作为一种通信数据格式:序列化结果可以从一个正在运行的虚拟机,通过网络被传递到另一个虚拟机上
作为一种拷贝、克隆机制:将对象序列化到内存的缓冲区中,然后通过反序列化,可以得到一个对已存对象进行深拷贝的新对象

序列化机制
java
实现Serializable接口,立即获得java提供的序列化功能
好处和优点:
不适合大规模数据之处:
hadoop
java的序列化机制虽然强大,却不符合下面的这些要求

Hadoop Writable机制
该机制紧凑、快速(但不容易扩展到java以外的语言)
包含三个重要的接口WritableComparable、RawComparator、WritableComparator

Hadoop序列化框架
Hadoop提供了一个简单的序列化框架API。用于集成各种序列化实现,该框架由Serialization实现




0 0
原创粉丝点击