Cuyahoga代码的研究之一:Cuyahoga.Corel项目
来源:互联网 发布:学软件好就业吗 编辑:程序博客网 时间:2024/06/05 19:58
Text.Css里定义了一个用于文本处理的类,它只有一个静态方法TruncateText(string FullText,int numberofCharacters)源代码如下:
public static string TruncateText(string fullText, int numberOfCharacters) { string text; if (fullText.Length > numberOfCharacters) { int spacePos = fullText.IndexOf(" ", numberOfCharacters); if (spacePos > -1) { text = fullText.Substring(0, spacePos) + ""; } else { text = fullText; } } else { text = fullText; } Regex regexStripHTML = new Regex("<[^>]+>",RegexOptions.IgnoreCase|RegexOptions.Compiled); text = regexStripHTML.Replace(text, " "); return text; }
这个静态方法接收两个参数,第一个是要处理的字符串(这个字符串可能是HTML格式的),第二个是要保留多少个字符,处理的过程如下:1.先判断长度是否大于要保留的字符个数,不大于,则执行第三步2.如果要处理的字符串长度大于要保留的字符数,从要保留的字符数索引位置开始,查找下一个空格位,然后取出从第一个字符到这个空格位的字符3.使用正则表达式将字符串中的HTML标记剔除掉这里有两个小小的技巧:第一个 int spacepost=fulltext.indexOf(" ",numberOfCharacters)这就取出了从某位置往后的第一个空格,这样做的目的是为了断词,例如,要取得25个字符,但是从第23个字符开始出现了一个单词"programe",现在的问题是,如果你硬取前25个,则会拆掉programe这个词,这里的方法很灵活,把位置延缓到单词的结尾,这样就取得完整些第二个就是正则表达式"<[^>]+>"这个表达式代表了所有标记,中间的^>意思是除了>以外的所有字符,而且后面的+就限制了<>间必定有一个字符,经过正则表达式的替换,就把取出的字符串中的HTML标记再次剔除了上面的方法是不错,但是,我觉得不够完美,对于一般性的非段落带格式的HTML文本,他可以处理的很好,因为HTML标记不见了,等于是去除带格式文本的格式,但是,如果是一段带有文本以外标记(如IMG,Button)的字符串,那取出的结果就不尽人意了这种场景用的非常多,相信许多开发新闻系统的朋友都遇到过,因为我们需要生成新闻的摘要内容不过,我所建议的方法是,对于摘要性质的内容,最灵活也是最具有扩展性的方法是增加一个摘要栏目和字段,让采编人员可以自由的来录入摘要内容,这样的好处是两方面:一是,摘要内容更准确,二是摘要内容的字数更容易控制,更灵活)
- Cuyahoga代码的研究之一:Cuyahoga.Corel项目
- cuyahoga 页面框架 (cuyahoga 项目兴趣小组)
- Cuyahoga的框架图
- 对Cuyahoga的学习
- Cuyahoga研究三:用户配置数据的处理
- Cuyahoga的动态模型分析
- Cuyahoga研究1: "Hello World" 模版开发
- Cuyahoga研究之----数据库表结构
- 开源项目Cuyahoga (兴趣小组 詹鑫昌)
- Cuyahoga研究之二:利用MD5CryptoServiceProvider返回字符串的MD5 Hash值
- Cuyahoga用户注册功能的实现
- 开发环境配置 (cuyahoga)
- Cuyahoga内容管理精髓
- 如何在Cuyahoga中新增一个简单的功能模块
- Cuyahoga - A .NET Website Framework
- Cuyahoga's DatabaseDiagram and ClassDiagram
- 开源CMS框架Cuyahoga介绍
- 技术沙龙.:主题为《代码解析Castle(IOC)应用实例 -开源CMS 系统Cuyahoga》
- 软件工程知识
- 安装 KB939373 补丁,导致iis 无法启动
- info update
- BOOT.INI文件参数介绍
- 使用removable disk在Linux和Solaris之间传递&gt;4G文件
- Cuyahoga代码的研究之一:Cuyahoga.Corel项目
- Moblin综述
- 类的初始化顺序
- 知识管理工具 UU Point 使用后感觉
- 简单介绍VC++6.0下如何使用压缩库ZLIB
- 搭建一个家庭娱乐中心的初步设想
- jspsmart下载文件出现getOutputStream() has already been called for this response的解决
- Cuyahoga研究之二:利用MD5CryptoServiceProvider返回字符串的MD5 Hash值
- 左侧Tab切换页面实现