厉害了!Word云存储

来源:互联网 发布:纵向科研经费知乎 编辑:程序博客网 时间:2024/04/29 14:56

这是一篇看完之后对云存储的认识有醍醐灌顶之效的干货,请耐心看完

标准的云存储是?— 谷歌是第一家推出云存储的公司, 现在市场上云存储的产品,架构本质上是一样的。— 都是通过存储虚拟化技术,采用分布式文件系统,将N台不同设备里的所有硬盘,映射为统一的文件系统,以文件的方式由外部进行访问。— 如果只是纯粹将多个设备进行统一管理,然后构筑一个流媒体的N+0的模式,拉取前端码流,没有分布式文件系统,那么就不算是标准的云存储。— 大华云存储采用分布式文件系统架构,同一路IPC视频、图片可以分散写到不同的存储节点,每个存储节点只存放每份文件的部分数据,从而实现高稳定、高性能,符合业界主流设计。
云存储最重要的是什么?数据可靠性。 因此云存储的设备数量要远多于传统存储阵列,在一定的故障概率下,设备越多,出现故障的设备数量就会越高,因此需要高可靠的软件设计。— 很多互联网厂商都是通过数据多副本来解决可靠性, 每份数据都同时复制多份。 如果硬盘或者设备节点故障,可通过其他硬盘或者设备节点上的数据进行恢复。 但是会导致空间的有效利用率很低。— IT厂商则通过纠删码技术,计算出数据校验码,并分片存储在不同设备的不同硬盘上,保证了设备或者硬盘的故障不会导致数据丢失。即解决了数据可靠性问题,也解决了空间利用率问题。主流的做法可以支持最大4台设备节点同时损坏数据不丢失。— 如果只是通过本地RAID保护硬盘的故障,是无法保证多硬盘故障以及设备节点的故障,可靠性很低。 — 大华云存储采用纠删码技术,支持最大4个节点或者96块硬盘同时损坏但数据却不会丢失,读、写业务都不中断。
云存储的未来价值是什么?是大数据分析。 那么云存储必须提供高性能支撑大数据进行数据分析。— 主流的大数据分析软件如hadoop, 通过并发任务,每个任务读取相应小段数据,进行分析,然后再汇总分析结果。 这种框架就要求分析软件能以文件的方式访问存储以及存储系统具备高性能。— 如果只是在存储的基础上增加了一个监控管理平台,并且不是文件方式,而是内部通过RAID5来管理,那么下载速度由于RAID性能限制,远远小于存储节点性能,不具备高性能的视频下载能力— 大华云存储采用分布式文件系统设计, 每个通道某段时间的录像即一个文件,因此分析软件可轻松获取文件数据。 同时通过带宽聚合能力,最小系统便可提供高达1GB/s的性能。同时大华云存储采用对象存储,存放在存储节点内的数据可以同时共享给多个应用,非常适合大数据分析使用。
云存储需要考虑数据共享因为除了视频录像以外,还可能有文档、图片等其他应用的存储需求。— 云存储的设计理念是,通过统一的存储管理,划分不同的虚拟存储空间给不同的应用。而无需为个别应用,单独建设存储系统。— 大华云存储支持前段摄像机的视频、图片存储,支持文档存储,支持第三方应用存储各类型数据。
存储系统要扩容是常事,云存储在设备扩容上追求极致简单— 主流云存储均实现了通过将文件、卷管理融为一体,无需建RAID、逻辑卷等繁琐操作。系统扩容1分钟完成,即扩即用。— 大华云存储采用类似谷歌的操作模式,单设备上线1分钟完成,无需建RAID、卷等。
硬盘坏了怎么办? 云存储系统中最多的设备便是硬盘,但硬盘很容易出故障。那么硬盘故障后,恢复越快,越好。越慢则面临数据丢失风险就越高。— 采用纠删码技术,进行数据恢复,恢复速度可到2TB/小时。而传统的RAID5最大只允许1块硬盘故障,即使加上热备盘也只允许2块盘故障,同时3TB硬盘的恢复需要30小时以上才能恢复完毕,而且存在数据丢失的风险。— 大华云存储采用纠删码+分布式文件系统,同时允许高达192块盘故障(4个48盘位节点故障),恢复速度更是远远高于传统RAID,且随设备数量越多,速度越快。如果采用万兆网络,则可以更快。 
硬盘避免及时维护,对于大规模系统尤其重要— 大型系统,每天可能会有几块甚至10几块硬盘损坏。那么如果每次都需要及时更换维修,那么对于维护人员的工作压力很大。— 谷歌等云存储采用系统全局热备,数据自动恢复等技术,保证硬盘损坏后,可达到一定量的时候再统一更换维修。— 如果采用传统RAID技术,当硬盘损坏后,需立马更换,否则会加重同RAID组其他盘的负荷,从而导致整个RAID组瘫痪,面临很大的数据丢失风险。— 大华云存储可在硬盘损坏量达到一定量后,比如上百块,再统一集中更换,减少运维压力,保障数据的安全性。 这是一篇干货,欢迎各位留言讨论

0 0