Thanks to visit codestin.com
Credit goes to github.com

Skip to content
Change the repository type filter

All

    Repositories list

    • DataX

      Public
      DataX是阿里云DataWorks数据集成的开源版本。
      Java
      5.6k000Updated Dec 29, 2024Dec 29, 2024
    • hudi

      Public
      Upserts, Deletes And Incremental Processing on Big Data.
      Java
      2.4k000Updated Dec 28, 2024Dec 28, 2024
    • Apache Spark Tutorial.《跟老卫学Apache Spark》
      8000Updated Nov 11, 2024Nov 11, 2024
    • kyuubi

      Public
      Apache Kyuubi is a distributed and multi-tenant gateway to provide serverless SQL on data warehouses and lakehouses.
      Scala
      971000Updated Sep 7, 2023Sep 7, 2023
    • amoro

      Public
      Amoro is a Lakehouse management system built on open data lake formats.
      Java
      360000Updated Sep 7, 2023Sep 7, 2023
    • havenask

      Public
      C++
      327000Updated Jun 29, 2023Jun 29, 2023
    • doris

      Public
      Apache Doris is an easy-to-use, high performance and unified analytics database.
      Java
      3.6k000Updated May 5, 2023May 5, 2023
    • drill

      Public
      Apache Drill is a distributed MPP query layer for self describing data
      Java
      988000Updated Apr 29, 2023Apr 29, 2023
    • FiboModel

      Public
      数据建模平台
      Python
      5000Updated Aug 19, 2022Aug 19, 2022
    • xap

      Public
      Distributed, highly-scalable, In Memory Data Grid
      Java
      45000Updated Aug 14, 2022Aug 14, 2022
    • jun_bigdata大数据平台服务框架。实现了Kafka实时数据过滤、清洗、转换、消费,实现了Spark SQL对Redis、MongoDB等非关系型数据库的数据的读写;集成了规则引擎,可基于规则引擎实现客户标签、画像等相关功能。输出各类大屏展示看板DashBoard等
      JavaScript
      18000Updated Jul 21, 2022Jul 21, 2022
    • FiboTracking,帮助用户解决传统数据分析中数据割裂、用户身份难以识别统一、数据众多却难以利用的问题,通过ID-MAPPING技术,为用户打通数据孤岛,构建客户360度全景画像,提供事件分析、留存分析、漏斗分析等功能,深度赋能营销部门进行高效决策。
      Java
      8000Updated Jul 15, 2022Jul 15, 2022
    • 轻量级 graphql 查询计算引擎,为 graphql 查询提供字段加工、列表过滤排序、简单控制流和依赖数据编排的能力。A lightweight graphql calculation engine, which is used to alter execution behavior of query.
      Java
      17000Updated Apr 28, 2022Apr 28, 2022
    • IKAnalyzer多分词配置、在线词典管理和热重载
      JavaScript
      3000Updated Apr 18, 2022Apr 18, 2022
    • Java
      4000Updated Apr 7, 2022Apr 7, 2022
    • Quicksql

      Public
      A Flexible, Fast, Federated(3F) SQL Analysis Middleware for Multiple Data Sources
      Java
      578000Updated Feb 10, 2022Feb 10, 2022
    • 非科班转行大数据开发
      Java
      118000Updated Jan 27, 2022Jan 27, 2022
    • XSQL

      Public
      Unified SQL Analytics Engine Based on SparkSQL
      Scala
      58000Updated Jan 21, 2022Jan 21, 2022
    • dataease

      Public
      人人可用的开源数据可视化分析工具。
      Java
      3.9k000Updated Dec 31, 2021Dec 31, 2021
    • 定期更新Hadoop生态圈中常用大数据组件文档 重心依次为: Flink Solr Sparksql ES Scala Kafka Hbase/phoenix Redis Kerberos (项目包含hadoop思维导图 印象笔记 Scala版本简单demo 常用工具类 去敏后的train code 持续更新!!!)
      Java
      255000Updated Dec 30, 2021Dec 30, 2021
    • stream-ql

      Public
      用 SQL 来描述 Stream API。可用 SQL 来实现数据处理逻辑,支持实时数据处理,支持聚合,分组,自定义函数等功能。让数据处理更简单。
      Java
      4000Updated Dec 14, 2021Dec 14, 2021
    • 将不同平台的用户行为轨迹,清洗后存储es,涉及到mysql->kafka->flink->hbase->es
      Scala
      2000Updated Aug 9, 2021Aug 9, 2021
    • Java
      2000Updated Apr 5, 2021Apr 5, 2021
    • Kafka+Flink+MySQL+ES demo
      Java
      3000Updated Aug 31, 2020Aug 31, 2020
    • Shell
      3000Updated Aug 26, 2020Aug 26, 2020
    • Tests suits mainly for Flink SQL connectors, such as Kafka to MySQL, Kafka to ES.
      Java
      1000Updated May 29, 2020May 29, 2020
    • ido

      Public
      大数据相关技术学习整理,诸如:HBase、Spark、Flink、Kafka、Druid、Hive、ES、Kudu、Mongo 等。
      2000Updated May 28, 2020May 28, 2020
    • flink实时处理kafka传来的数据通过连接池技术写入hbase
      Java
      55000Updated Jan 22, 2019Jan 22, 2019
    • 专门为kettle这款优秀的ETL工具开发的web端管理工具。
      JavaScript
      375000Updated Jul 18, 2018Jul 18, 2018
    • mumu-hbase项目是一个初步了解和学习hbase的demo项目,通过这个项目了解到hbase列数据库是由表、列族、列限定符、时间戳、列值组成的半结构化、疏散列的数据库,用户可以动态的添加列,可以使一个表达到亿行百万列,而不影响查询能力,这是由于hmast + hregionserver + memstore + blockcache 架构支撑的。同时通过mumu-hbase项目了解到hbase的基本使用方法,包括表、列族、列、过滤器、协处理器等功能。hbase不仅支持原生hbase API调用,还支持REST、AVRO、THRIFT等第三方客户端调用。
      Java
      6000Updated Oct 9, 2017Oct 9, 2017