目前在做数据平台方面的工作,发现对大公司而言,方案其实都很固定了
但对于小团队来说,有什么好的解决方案?
早期主要是用来解决 BI,数据查询需求,可支持或不支持基于数据的机器学习项目
- 最好基于开源、免费
- HDFS, Spark, 系统资源最好能有厂商维护, 因为这些其实运维成本都不小
目前能想到的
- Google Analytics/Mixpanel 埋点 + 业务数据库备份用 Metabase/Superset 查看
但不知道好的 ETL 工具用啥,莫非用 airflow? MySQL 库是否就足够了?