CSV文件读取

来源:互联网 发布:无法编译java 编辑:程序博客网 时间:2024/05/18 02:46
1.如果csv文件字段中有特殊字符,整个字段应该用双引号包起来。特殊字符有三种,逗号[,] 回车换行[\r\n]和处于字段开头的双引号["]
例如:字段   a,b,c(b,c 文本中包含逗号),d       
            就应该变成a,"b,c",d
            有回车换行的也是一样  
2.如果 csv字段中有特殊字符,并且字段中含有双引号,则字段中的双引号应该写两次 
    例如:字段  a,b,c"aa d
             就应该变成a,"b,c""aa",d
 有了这两个规范,把读取方法重新修改一下就完了,也不复杂
修改后的 csv 读取
public static string[][] read_csv(string text)
{
    if (text == null)
        return null;
    var text_array = new List<string[]>();
    var line = new List<string>();
    var field = new StringBuilder();
    //是否在双引号内
    bool  in_quata = false;
    //字段是否开始
    bool   field_start = true;
    for (int i = 0; i < text.Length; i++)
    {
        char ch = text[i];
        if (in_quata)
        {
            //如果已经处于双引号范围内
            if (ch == '\"')
            {
                //如果是两个引号,则当成一个普通的引号处理
                if (i < text.Length - 1 && text[i + 1] == '\"')
                {
                    field.Append('\"');
                    i++;
                }
                else
                    //否则退出引号范围
                    in_quata = false;
            }
            else //双引号范围内的任何字符(除了双引号)都当成普通字符
            {
                field.Append(ch);
            }
        }
        else
        {
            switch (ch)
            {
                case ',': //新的字段开始
                    line.Add(field.ToString());
                    field.Remove(0, field.Length);
                    field_start = true;
                    break;
                case '\"'://引号的处理
                    if (field_start)
                        in_quata = true;
                    else
                        field.Append(ch);
                    break;
                case '\r': //新的记录行开始
                    if (field.Length > 0 || field_start)
                    {
                        line.Add(field.ToString());
                        field.Remove(0, field.Length);
                    }
                    text_array.Add(line.ToArray());
                    line.Clear();
                    field_start = true;
                    //在 window 环境下,\r\n通常是成对出现,所以要跳过
                    if (i < text.Length - 1 && text[i + 1] == '\n')
                        i++;
                    break;
                default:
                    field_start = false;
                    field.Append(ch);
                    break;
            }
        }
    }
    //文件结束
    if (field.Length > 0 || field_start)
        line.Add(field.ToString());
    if (line.Count > 0)
        text_array.Add(line.ToArray());
    return text_array.ToArray();
}
原创粉丝点击