实验楼Linux基础入门(新版)- 数据提取
来源:互联网 发布:淘宝网注册支付宝 编辑:程序博客网 时间:2024/04/29 05:35
介绍
小明在做数据分析的时候需要提取文件中关于数字的部分,同时还要提取用户的邮箱部分,但是有的行不是数组也不是邮箱,现在需要你在data2这个文件中帮助他用正则表达式匹配出数字部分和邮箱部分。在这里下载
wget http://labfile.oss.aliyuncs.com/courses/1/data2
将下载的data2保存在/home/shiyanlou/data2
目标
- 在文件data中匹配数字开头的行,结果写入/home/shiyanlou/num文件
- 在文件data中匹配出正确格式的邮箱,结果写入一个名为/home/shiyanlou/mail的文件
提示
- 邮件的格式
- 注意符号.的处理
方案
1.创建num mail
$ touch num mail
2.匹配开头为数字的的部分
$ cat data2 | grep -E '^[0-9]+' > num
3.匹配邮箱格式
$ cat data2 | grep -E '^[[:alnum:]]+@[[:alnum:]]+.com' > mail
阅读全文
0 0
- 实验楼Linux基础入门(新版)- 数据提取
- 实验楼Linux基础入门(新版)- 备份日志
- 实验楼Linux基础入门(新版)- 历史命令
- Linux基础入门(七) --学习笔记-数据提取
- 数据挖掘基础入门实验
- 数据提取(2):pandas库入门
- Mondrian入门 提取数据
- opencv 提取感兴趣区域 (新版方法)
- 实验楼 Linux 基础入门 用户及文件权限管理 作业笔记
- linux实训-数据提取
- 【Linux】实验楼笔记1-linux基础
- CCNA(新版)-ipv6地址配置实验
- linux驱动入门实验
- 实验记录-linux基础
- Linux入门基础(1)
- Linux入门基础(2)
- Linux基础入门(二)
- Linux入门基础(1)
- vue热点新闻轮动
- 教您如何解决oracle分页查询数据重复问题
- 操作系统——存储管理:分区、分页、分段、请求式分页和虚拟内存
- 熟能生巧vector
- H.264码流格式
- 实验楼Linux基础入门(新版)- 数据提取
- 设计模式--享元模式
- 操作系统——存储管理:分区、分页、分段、请求式分页和虚拟内存
- gdb工具的使用
- RMQ
- [简单逻辑学]逻辑学的基本原理——灰色地带及人为灰色地带
- 《UNIX环境高级编程》笔记1--errno是否是线程安全的?
- 【leaflet】 leaflet移除地图上所有marker(layers)
- PHP进阶(第七弹:数据库操作)