大数据系列文章,数据人收藏!

    科技2025-03-05  21

    该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。

    该系列文章主要包括大数据平台、数据仓库、数据挖掘等。

    系列文章都是基于实战总结的干货,下面列出文章链接,建议收藏,方便查看。

    【大数据平台】

    从0到1搭建大数据平台之数据采集系统

    从0到1搭建大数据平台之调度系统

    从0到1搭建大数据平台之计算存储系统

    从0到1搭建自助分析平台

    从0到1搭建大数据平台

    基于Ambari的大数据平台搭建

    基于CDH(Cloudera Distribution Hadoop)的大数据平台搭建

    一文入门流处理开发

    浅谈数据中台

    数据中台设计方法论

    收藏|如何做一个好的大数据平台架构

    大数据集群迁移的那一夜是怎么过的|回忆录

    收藏|Flink比Spark好在哪?

    【数据仓库】

    数据分析师应该了解的数据仓库(1)

    数据分析师应该了解的数据仓库(2)

    数据分析师应该了解的数据仓库(3)

    数据分析师应该了解的数据湖

    一文了解数据湖引擎

    数据湖vs数据仓库vs数据集市

    一分钟讲解数据仓库元数据

    谈谈ETL中的数据质量

    你是分析师,还是“提数机”?

    Hive改表结构的两个坑|避坑指南

    【数据挖掘】

    数据挖掘从入门到放弃(一):线性回归和逻辑回归

    数据挖掘从入门到放弃(二):决策树

    数据挖掘从入门到放弃(三):朴素贝叶斯

    数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法

    数据挖掘从入门到放弃(五)seaborn 的数据可视化

    数据挖掘从入门到放弃(六):K-means 聚类

    数据挖掘从入门到放弃(七):TensorFlow和keras实现线性回归LinearRegression

    数据分析为什么火了

    如何入门数据分析?

    用户行为分析之数据采集

    用户行为分之数据处理

    【kafka实战】

    Kafka实战宝典:如何跨机房传输数据

    kafka实战宝典:手动修改消费偏移量的两种方式

    Kafka实战宝典:监控利器kafka-eagle

    Kafka实战宝典:一文带解决Kafka常见故障处理

    Kafka实战宝典:Kafka的控制器controller详解

    【杂谈】

    如何参与一个Apache开源项目

    聊聊数据库

    关于数据库,程序员应该了解的那些事

    推荐一款可视化+NoteBook工具

    在郑州,你该买哪里的房子?

    「数据社」已开通了微信交流群,扫描以下二维码备注加群即可申请加入。

    关注公众号,可以免费获取更多大数据实战资料。

    Processed: 0.027, SQL: 8