不定行日志分析思路？

This topic created in 2538 days ago, the information mentioned may be changed or developed.

如题，完整的日志是多行记录中的信息合并成的一个有效的日志，而且多行记录还有时间差，有什么办法进行分析？或者这个分析的术语叫啥哈？

12 replies • 2019-07-23 10:49:41 +08:00

ruin2016

Jul 22, 2019

按时间戳查询，或者关键字..
xxx, yyy 是时间戳
awk '$1>xxxxxx' && '$1 < yyyyy' yourfile

widewing

Jul 23, 2019 via Android

如果你说 stack trace 那种，就匹配第一行；如果你说的不同线程或什么的打印到一个文件那种，找线程 id 或别的什么；如果是业务相关的，可以记录 tracking id

limuyan44

Jul 23, 2019 via Android

你需要 es

autogen

Jul 23, 2019

日志分析一律用 awk，贼简单

hustlike

Jul 23, 2019 via Android

了解下阿里云日志服务，日志可以用 sql 分析。

yuycchn

Jul 23, 2019

@ruin2016
@autogen
一天上亿条哈，所有 awk 估计有点悬乎

yuycchn

Jul 23, 2019

@limuyan44 es 使用姿势是什么样的?把多行直接放到 es，然后查询直接用 es 查吗？

yuycchn

Jul 23, 2019

@widewing 业务或者日志上，如果对这些数据进行分析，如果从多行的信息中提取出一个或多个值进行汇总，这种场景有合适的数据软件吗

www5070504

Jul 23, 2019

日志一般不都是线程安全的么应该不会出现错行现象吧 logstash 有匹配多行的插件

rrfeng

Jul 23, 2019

没办法，你只能自己洗一遍洗成结构化的数据再去处理。
ES 可以，但一天上亿需要的集群不小了。
或者直接丢 hive，但是也要预处理，比 ES 预处理简单，但是分析起来麻烦。

justfly

Jul 23, 2019

自己写个程序匹配日志起始的特征不就好了，用不了多少代码

sparkssssssss

Jul 23, 2019

@yuycchn 上亿,肯定是集群才能产生的数量级,所以在日志收集的时候做下处理.目前大部分日志收集都支持多行按规则合并的