lcqtdwj
V2EX  ›  问与答

信息抽取?如何在相似(格式不同,但结构相似)文档中抽取想要的数据?

  •  
  •   lcqtdwj · Jul 30, 2015 · 2087 views
    This topic created in 3942 days ago, the information mentioned may be changed or developed.
    其实我不知道这个问题到底属于哪个领域。我有很多相似的文档,页面,比如简历。格式各不相同,但是简历大体逻辑组成是一样的,都有姓名,联系方式,工作经历等。如何能自动化抽出需要的信息?业界有成熟的技术吗?如果没有学术界属于哪方面问题?
    1 replies    2015-07-30 10:02:46 +08:00
    xunyu
        1
    xunyu  
       Jul 30, 2015
    information extraction,google它
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   891 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 20:51 · PVG 04:51 · LAX 13:51 · JFK 16:51
    ♥ Do have faith in what you're doing.