有关非自然语言

来源:互联网 发布:汉诺塔递归java代码 编辑:程序博客网 时间:2024/05/02 04:39

文本编辑器-〉编译器-〉程序

 

如何处理不规范文本。

 

使用xml进行文本数据入库,出现有人用"<<"去代替“《”的情况。类似问题曾出不禁,没完没了,无乃只好打“01入库”的主意。没想到后来出了一大串问题后竟然返回到起点的换字法上面去了-_-!

 

文本写来是让“人”读的,这些东西从键盘变成机器码然后变成一堆像素显示在屏幕上。人的容错力和模式识别能力确实非同小可,“...”"..""....""......""... ..."都能被人识别成省略号,甚至有时候,句号被写成“..”都不影响人的阅读。

计算机怎么才能也做到这一点?真的存在没有标准参照的学习模式?回忆基础教育时候的情形,怎么感觉有点做小学老师的味道= =?

 

 

原创粉丝点击