Compressed Sparse Column format(CSC)

来源:互联网 发布:阿里云备案客服电话 编辑:程序博客网 时间:2024/06/16 03:47

CSR(Compressed Sparse Row format)和CSC(Compressed Spare Column format)都是一种稀疏矩阵的存储格式。这里分别给出实例:

假设有如下矩阵:

1360004000007100258110000012(A)

1 csr

存储为:
    AA: 1 2 3 4 5 6 7 8 9 10 11 12
    JR: 1 4 1 2 4 1 3 4 5 3 4 5
    AA: 1 3 6 10 12 13

AA: 按行顺序存储各个非零元素
JR: 记录对应元素所在的列的列号
JC: 记录每行第一个元素在AA中的位置

2 csc

AA: 按列顺序存储各个非零元素
JR: 记录对应元素所在的行的行号
JC: 记录每列第一个元素在AA中的位置

3 Spark 中的CSC

9.00.00.00.08.06.0(B)

在 Spark中的CSC表示为:
Array(0, 1, 3) :每一列非零元素的个数,分别为 1-03-1
Array(0, 2, 1) :非零元素所对应的行号
Array(9, 6, 8) :非零元素

0 1
原创粉丝点击