• 请不要在回答技术问题时复制粘贴 AI 生成的内容
anonymoustian
V2EX  ›  程序员

百度指数、微信指数、微博指数等等这样的系统后端是如何存储数据的?

  •  
  •   anonymoustian · Feb 1, 2018 · 2651 views
    This topic created in 3021 days ago, the information mentioned may be changed or developed.

    用过百度指数、微信指数朋友们应该都了解,输入一个关键词或者热词,它就会返回这个词在过去的一段时间的流量情况。

    我想实现类似的一个系统,但是不知道从何入手。 现在的问题就是不清楚这种系统后台是用什么数据库存的,因为每天都有“新词”产生,而且要一直记录每天或者每小时的每个词的 count,数据会越来越多。

    所以想请教一下朋友们,有实现过类似功能的老铁能指导下 数据库应该选用什么方案,表和库结构或者一些字段该如何设计吗?

    谢谢了!

    4 replies    2018-02-02 17:19:05 +08:00
    anonymoustian
        1
    anonymoustian  
    OP
       Feb 1, 2018
    对于新词,它之前时间的数据肯定是空的; 而且这些词的量级大概在 2 亿左右,老铁们有什么建议吗?
    willchen
        2
    willchen  
       Feb 1, 2018
    试试时序型数据库吧
    anonymoustian
        3
    anonymoustian  
    OP
       Feb 1, 2018
    @willchen 你好 我尝试过时序型数据库 influxdb,如果有两亿个词的话,就要有 两亿种 series, 这个真的没问题吗?或者您有用过什么好用的数据库?
    anonymoustian
        4
    anonymoustian  
    OP
       Feb 2, 2018
    这么多人收藏。。。没人回答一个么。。。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5271 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 03:59 · PVG 11:59 · LAX 20:59 · JFK 23:59
    ♥ Do have faith in what you're doing.