筛选(中文)文本文件中的相关汉字,及转成数组等

来源:互联网 发布:js卫生间防水质量通病 编辑:程序博客网 时间:2024/05/20 11:33

#这段代码用于筛选 (中文)文本文件中的相关汉字

require 'jcode'  #utf-8 的汉字兼容

$KCODE='u'

ARGV[0]="e:\\BuMenTXL20120314utf8.txt"

fil1e=File.open(ARGV[0]).readlines

ni=0
fil1e.each do |elem|
    if (   (elem.include?('当代中国') || elem.include?('当代') || elem.include?('当代所') )   )&& (   ! (elem.include?('文献中心') ) && (   ! (elem.include?('语言所') )  ) && (   ! (elem.include?('民族文学所') )  ) && (   ! (elem.include?('马研院') )  ) && (   ! (elem.include?('经济所') )  ) && (   ! (elem.include?('文学所') )  )   ) then
      ni=ni+1
      print ni
      print "\t",", -"
      puts elem

    end

end


#

#字符串转数组
i="phpruby".split('p')
i.each do |v|
  print v   , '---'              ,"\n"
end

#数组转字符串
sz=['php','ruby','python']
puts sz.join("@")


原创粉丝点击