CSV文件读取
来源:互联网 发布:无法编译java 编辑:程序博客网 时间:2024/05/18 02:46
1.如果csv文件字段中有特殊字符,整个字段应该用双引号包起来。特殊字符有三种,逗号[,] 回车换行[\r\n]和处于字段开头的双引号["]
例如:字段 a,b,c(b,c 文本中包含逗号),d
就应该变成a,"b,c",d
有回车换行的也是一样
2.如果 csv字段中有特殊字符,并且字段中含有双引号,则字段中的双引号应该写两次
例如:字段 a,b,c"aa d
就应该变成a,"b,c""aa",d
有了这两个规范,把读取方法重新修改一下就完了,也不复杂
修改后的 csv 读取
public static string[][] read_csv(string text)
{
if (text == null)
return null;
var text_array = new List<string[]>();
var line = new List<string>();
var field = new StringBuilder();
//是否在双引号内
bool in_quata = false;
//字段是否开始
bool field_start = true;
for (int i = 0; i < text.Length; i++)
{
char ch = text[i];
if (in_quata)
{
//如果已经处于双引号范围内
if (ch == '\"')
{
//如果是两个引号,则当成一个普通的引号处理
if (i < text.Length - 1 && text[i + 1] == '\"')
{
field.Append('\"');
i++;
}
else
//否则退出引号范围
in_quata = false;
}
else //双引号范围内的任何字符(除了双引号)都当成普通字符
{
field.Append(ch);
}
}
else
{
switch (ch)
{
case ',': //新的字段开始
line.Add(field.ToString());
field.Remove(0, field.Length);
field_start = true;
break;
case '\"'://引号的处理
if (field_start)
in_quata = true;
else
field.Append(ch);
break;
case '\r': //新的记录行开始
if (field.Length > 0 || field_start)
{
line.Add(field.ToString());
field.Remove(0, field.Length);
}
text_array.Add(line.ToArray());
line.Clear();
field_start = true;
//在 window 环境下,\r\n通常是成对出现,所以要跳过
if (i < text.Length - 1 && text[i + 1] == '\n')
i++;
break;
default:
field_start = false;
field.Append(ch);
break;
}
}
}
//文件结束
if (field.Length > 0 || field_start)
line.Add(field.ToString());
if (line.Count > 0)
text_array.Add(line.ToArray());
return text_array.ToArray();
}
例如:字段 a,b,c(b,c 文本中包含逗号),d
就应该变成a,"b,c",d
有回车换行的也是一样
2.如果 csv字段中有特殊字符,并且字段中含有双引号,则字段中的双引号应该写两次
例如:字段 a,b,c"aa d
就应该变成a,"b,c""aa",d
有了这两个规范,把读取方法重新修改一下就完了,也不复杂
修改后的 csv 读取
public static string[][] read_csv(string text)
{
if (text == null)
return null;
var text_array = new List<string[]>();
var line = new List<string>();
var field = new StringBuilder();
//是否在双引号内
bool in_quata = false;
//字段是否开始
bool field_start = true;
for (int i = 0; i < text.Length; i++)
{
char ch = text[i];
if (in_quata)
{
//如果已经处于双引号范围内
if (ch == '\"')
{
//如果是两个引号,则当成一个普通的引号处理
if (i < text.Length - 1 && text[i + 1] == '\"')
{
field.Append('\"');
i++;
}
else
//否则退出引号范围
in_quata = false;
}
else //双引号范围内的任何字符(除了双引号)都当成普通字符
{
field.Append(ch);
}
}
else
{
switch (ch)
{
case ',': //新的字段开始
line.Add(field.ToString());
field.Remove(0, field.Length);
field_start = true;
break;
case '\"'://引号的处理
if (field_start)
in_quata = true;
else
field.Append(ch);
break;
case '\r': //新的记录行开始
if (field.Length > 0 || field_start)
{
line.Add(field.ToString());
field.Remove(0, field.Length);
}
text_array.Add(line.ToArray());
line.Clear();
field_start = true;
//在 window 环境下,\r\n通常是成对出现,所以要跳过
if (i < text.Length - 1 && text[i + 1] == '\n')
i++;
break;
default:
field_start = false;
field.Append(ch);
break;
}
}
}
//文件结束
if (field.Length > 0 || field_start)
line.Add(field.ToString());
if (line.Count > 0)
text_array.Add(line.ToArray());
return text_array.ToArray();
}
- 如何读取csv文件
- CSV文件直接读取
- C#读取CSV文件
- java读取CSV文件
- ajax 读取 .csv 文件
- Java读取CSV文件
- Java 读取 CSV 文件
- 读取.csv文件数据
- csv文件读取
- 读取/输出 CSV文件
- java读取csv文件
- c#读取csv文件
- php读取csv文件
- Python-读取csv文件
- DataTable 读取CSV文件
- c++ 读取csv文件
- CSV文件读取
- python读取CSV文件
- Hadoop及Hbase集群搭建
- 输出完数
- ack.vim——vim 整个工程全局查找插件
- 高姿态女人提供伤感日志_遗忘过去.残缺的忆
- IE7下浮动(float)层不能实现环绕的问题
- CSV文件读取
- 时光悄悄流逝,光阴不再使你我天真
- 编程1
- 从50个数里面取9个不重复的随机数
- UTF-8 和 GBK 的 NSString 相互转化的方法
- Oracle中BLOB字段存储4GB以下视频数据的方法
- NGINX 开启PATHINFO
- UIVIEW圆角设置
- codeforces 241 A