yuycchn
V2EX  ›  数据库

不定行日志分析思路?

  •  
  •   yuycchn · Jul 22, 2019 · 2699 views
    This topic created in 2491 days ago, the information mentioned may be changed or developed.

    如题,完整的日志是多行记录中的信息合并成的一个有效的日志,而且多行记录还有时间差,有什么办法进行分析?或者这个分析的术语叫啥哈?

    12 replies    2019-07-23 10:49:41 +08:00
    ruin2016
        1
    ruin2016  
       Jul 22, 2019
    按时间戳查询,或者关键字..
    xxx, yyy 是时间戳
    awk '$1>xxxxxx' && '$1 < yyyyy' yourfile
    widewing
        2
    widewing  
       Jul 23, 2019 via Android
    如果你说 stack trace 那种,就匹配第一行;如果你说的不同线程或什么的打印到一个文件那种,找线程 id 或别的什么;如果是业务相关的,可以记录 tracking id
    limuyan44
        3
    limuyan44  
       Jul 23, 2019 via Android
    你需要 es
    autogen
        4
    autogen  
       Jul 23, 2019
    日志分析一律用 awk,贼简单
    hustlike
        5
    hustlike  
       Jul 23, 2019 via Android
    了解下阿里云日志服务,日志可以用 sql 分析。
    yuycchn
        6
    yuycchn  
    OP
       Jul 23, 2019
    @ruin2016
    @autogen
    一天上亿条哈,所有 awk 估计有点悬乎
    yuycchn
        7
    yuycchn  
    OP
       Jul 23, 2019
    @limuyan44 es 使用姿势是什么样的?把多行直接放到 es,然后查询直接用 es 查吗?
    yuycchn
        8
    yuycchn  
    OP
       Jul 23, 2019
    @widewing 业务或者日志上,如果对这些数据进行分析,如果从多行的信息中提取出一个或多个值进行汇总,这种场景有合适的数据软件吗
    www5070504
        9
    www5070504  
       Jul 23, 2019
    日志一般不都是线程安全的么 应该不会出现错行现象吧 logstash 有匹配多行的插件
    rrfeng
        10
    rrfeng  
       Jul 23, 2019
    没办法,你只能自己洗一遍洗成结构化的数据再去处理。
    ES 可以,但一天上亿需要的集群不小了。
    或者直接丢 hive,但是也要预处理,比 ES 预处理简单,但是分析起来麻烦。
    justfly
        11
    justfly  
       Jul 23, 2019
    自己写个程序匹配日志起始的特征不就好了,用不了多少代码
    sparkssssssss
        12
    sparkssssssss  
       Jul 23, 2019
    @yuycchn 上亿,肯定是集群才能产生的数量级,所以在日志收集的时候做下处理.目前大部分日志收集都支持多行按规则合并的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3114 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 11:17 · PVG 19:17 · LAX 04:17 · JFK 07:17
    ♥ Do have faith in what you're doing.