其实对于爱情,越单纯越幸福。
sed是一种流编辑器,它能够完美配合正则表达式使用,功能非同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。
文件截取
从2012-02-09到2012-09-10的所有数据行, 日志文件以yyyy-MM-dd的日期格式开头
|
|
从文件中导出包含指定内容的行
|
|
从日志中截取指定时间的内容,如提取12:00-13:00的内容
|
|
提取svn日志
找出svn提交历史中的message信息
|
|
日志分析
以下API网管的部分日志数据,URL请求需要经过身份验证才可以被API网管转发,每个请求都需要经过流速控制,下面我们分析9:00-11:00的用户的请求类别、数量以及请求频率是否存在异常:
|
|
1.按时间段裁剪日志
分析以上日志不难发现,每行都以固定的时间格式开头:2017-07-17 10:29:59.969
|
|
2.筛选出包含用户Id和请求url的行记录
经过流速控制的请求,都会输出指定的日志,因此我们可以从中筛选出用户信息和请求信息。
|
|
|
|
筛选后的日志:
|
|
3.替换多余信息
|
|
替换后
|
|
4.统计
统计每个用户的请求信息
|
|
统计用户数量
|
|
统计
统计请求量最大的URL
|
|
统计url调用次数
|
|
合并多个API日志文件的请求次数
|
|