基于MapReduce编程模型的内连接算法设计与实现

    科技2024-05-14  90

    title: 基于MapReduce编程模型的内连接算法设计与实现 date: 2020-10-07 12:14:16 tags: [MapReduce,内连接,Hadoop] categories: [Hadoop] copyright: true comments: false description: 基于MapReduce编程模型的内连接算法设计与实现 top: true photos: - "/images/Title-photos/photos.png"

    摘 要

            信息技术和互联网的发展使得每天都会产生海量的数据,这些数据具有结构复杂、数据量大的特性。连接操作是大数据中常用的且耗时的操作。Map Reduce编程模型的提出,使得大数据处理有了基本的思路。本文通过Map Reduce编程模型设计算法实现内连接操作,并通过TPC-H基准程序生成的数据集,进行算法的正确性检验和算法的性能测试。实验结果表明,本文所设计算法是正确可行的,并且在Map Reduce编程模型下其处理大量数据时有明显的优势。

    关键词:MapReduce;Hadoop;内连接;HDFS;TPC-H

    摘要

    目录

    正文

    Processed: 0.012, SQL: 8