Codestin Search App

木酱

|

弹性计算数据可视化 API

|

博文

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

~ DataV 后台21日晚上线，现在暂时还不能用哦 ~ DataV 增加了一个新的数据代理协议，旨在提供更安全的数据查询。它将 SQL 查询字符串和数据库 id 加密后传到这个应用，而后这个应用连接数据库将查询后的结果返回到 DataV 的页面中。根据新的协议，我做了一个示例应用在githu

47699 141 197

来自：数据可视化DataV 版块

封神

|

分布式计算 Hadoop 分布式数据库

|

博文

阿里封神谈hadoop生态学习之路

在大数据时代，要想个性化实现业务的需求，还是得操纵各类的大数据软件，如：hadoop、hive、spark等。笔者（阿里封神）混迹Hadoop圈子多年，经历了云梯1、ODPS等项目，目前base在E-Mapreduce。在这，笔者尽可能梳理下hadoop的学习之路。

51081 14 52

来自：开源大数据平台 E-MapReduce 版块

傲海

|

机器学习/深度学习算法对象存储

|

博文

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

伴随着今日阿里云机器学习PAI在云栖大会的重磅发布，快来感受下人工智能的魅力。一、背景随着互联网的发展，产生了大量的图片以及语音数据，如何对这部分非结构化数据行之有效的利用起来，一直是困扰数据挖掘工程师的一到难题。

50936 65 137

来自：人工智能平台PAI 版块

隐林

|

存储分布式计算监控

|

博文

大数据环境下该如何优雅地设计数据分层

发个牢骚，搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司，都需要对数据仓库有一定的重视，而不是谈一句自己是搞大数据的就很厉害了。数据仓库更多代表的是一种对数据的管理和使用的方式，它是一整套包括了etl、调度、建模在内的完整的理论体系。

41343 9 10

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 算法安全

|

博文

ODPS（Open Data Processing Service），原是阿里云从 09年开始自研的大规模批量计算引擎，2016 年更名为MaxCompute。2022云栖大会上，阿里云ODPS全新升级为一体化大数据平台，存储、调度、元数据一体化融合，从 Processing 升级为 Platform，即 Open Data Platform and Service。提供了离线计算、实时交互式分析、机器学习等可扩展的智能计算引擎，满足用户多元化数据计算需求。

78876 133 139

来自：大数据计算 MaxCompute 版块

工程师甲

|

弹性计算关系型数据库 MySQL

|

博文

【技术实验】mysql准实时同步数据到Elasticsearch

Elasticsearch作为大数据场景下搜索和分析的引擎，广泛应用于实时数据分析等场景。本文作者梳理了从MySQL准实时同步数据到Elasticsearch的实操步骤，帮助开发者理解和快速上手。

25033 154 160

来自：检索分析服务 Elasticsearch版版块

付空

|

消息中间件存储供应链

|

博文

数据仓库介绍与实时数仓案例

1.数据仓库简介数据仓库是一个面向主题的（Subject Oriented）、集成的（Integrate）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策。

45680 238 254

来自：实时计算 Flink 版块

尼不要逗了

|

分布式计算算法大数据

|

博文

分布式快照算法: Chandy-Lamport

Spark 的 Structured Streaming 的 Continuous Processing Mode 的容错处理使用了分布式快照（Distributed Snapshot）算法 Chandy-Lamport 算法，那么分布式快照算法可以用来解决什么问题呢？

25994 71 72

来自：开源大数据平台 E-MapReduce 版块

李寻弥-27988

|

数据可视化

|

博文

DataV接入ECharts图表库可视化利器强强联手

两个扛把子级产品的结合，而且文末有彩蛋。

25832 100 104

来自：数据可视化DataV 版块

隐林

|

分布式计算 MaxCompute

|

博文

MaxCompute执行作业慢的原因排查

大家在平时开发过程中经常遇到作业（SQL、MR等）执行慢的原因，今天带大家一起学习自排查方法。 1、wait wait ，job querying 遇到这个提示，就是资源出现了排队，如果你是后付费用户，那就是整个后付费的共享池已经没有富余的资源了，要等前一个作业处理完。

26989 5 7

来自：大数据计算 MaxCompute 版块

隐林

|

分布式计算大数据 BI

|

博文

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

目前阿里云大数据产品已经免费向全部用户开放了多种公用数据集。开放的数据类别包括：股票价格数据，房产信息，影视及其票房数据。

27033 5 12

来自：大数据计算 MaxCompute 版块

晋恒

|

分布式计算 MaxCompute 存储

|

博文

吴刚专访--大数据和 MaxCompute 技术和故事

2019大数据技术公开课第一季《技术人生专访》来袭，本季将带领开发者们探讨大数据技术，分享不同国家的工作体验。本文整理自阿里巴巴计算平台事业部高级技术专家吴刚的专访，将为大家介绍Apache ORC开源项目、主流的开源列存格式ORC和Parquet的区别以及MaxCompute选择ORC的原因。

20339 4 4

来自：大数据计算 MaxCompute 版块

隐林

|

博文

优酷背后的大数据秘密

大家好，我是门德亮，现在在优酷数据中台做数据相关的事情。很荣幸，我正好见证了优酷从没有MaxCompute到有的这样一个历程，因为刚刚好我就是入职优酷差不多5年的时间，我们正好是在快到5年的时候，去做了从Hadoop到MaxCompute的这样一个升级。

23365 4 4

来自：大数据计算 MaxCompute 版块

yunqi_share

|

云栖大会

|

博文

2017杭州云栖大会FAQ（持续更新中）

2017杭州云栖大会将于10月11-14日在杭州云栖小镇举办，作为全球最具影响力的科技展会之一，今年的云栖大会规模更大，内容也更丰富。为了帮助大家解决报名、参会中的一些问题，小编专门整理了下大会相关的FAQ，供大家参考。

19432 129 164

来自：大数据计算 MaxCompute 版块

场景研读

|

SQL 分布式计算大数据

|

博文

Python+大数据计算平台，PyODPS架构手把手教你搭建

在2016年10月的云栖社区在线培训上，来自阿里云大数据事业部的秦续业分享了《双剑合壁——Python和大数据计算平台的结合实战》。他主要介绍了数据分析和机器学习的方法、DataFrame整体架构以及基础API、前端、后端、机器学习的具体实现方法。

18760 4 5

来自：大数据计算 MaxCompute 版块

傲海

|

机器学习/深度学习 TensorFlow 算法框架/工具

|

博文

【玩转数据系列十五】机器学习PAI为你自动写歌词，妈妈再也不用担心我的freestyle了（提供数据、代码）

背景最近互联网上出现一个热词就是“freestyle”，源于一个比拼rap的综艺节目。在节目中需要大量考验选手的freestyle能力，freestyle指的是rapper即兴的根据一段主题讲一串rap。

21311 5 18

来自：人工智能平台PAI 版块

阿里云实时计算Flink

|

人工智能算法框架/工具流计算

|

博文

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

在这次访谈中，贾扬清向我们透露了他加入阿里的原因，并对他目前在阿里主要负责的工作做了详细说明，他不仅回顾了过去 6 年 AI 框架领域发生的变化，也分享了自己对于 AI 领域现状的观察和对未来发展的思考。结合自己的经验，贾扬清也给出了一些针对 AI 方向选择和个人职业发展的建议，对于 AI 从业者来

18340 2 10

来自：实时计算 Flink 版块

傲海

|

机器学习/深度学习自然语言处理算法

|

博文

【玩转数据系列六】文本分析算法实现新闻自动分类

新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式，消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标，完全由机器智能化实现。

20187 1 3

来自：人工智能平台PAI 版块

阿里云实时计算Flink

|

SQL API 双11

|

博文

实时计算 Flink SQL 核心功能解密

Flink SQL 是于2017年7月开始面向集团开放流计算服务的。虽然是一个非常年轻的产品，但是到双11期间已经支撑了数千个作业，在双11期间，Blink 作业的处理峰值达到了5+亿每秒，而其中仅 Flink SQL 作业的处理总峰值就达到了3亿/秒。

20214 1 3

来自：实时计算 Flink 版块

隐林

|

分布式计算 MaxCompute BI

|

博文

【转载】时隔一年多，我又用起了 Superset

去年 6 月份在流利说提离职后，leader 问我为什么要走。我说，流利说有很健全的数据处理基础设施，但这不是所有的公司都会有的条件，所以我想看看在一个基建不全的创业公司我是否也可以像现在一样做的好。

18312 82 83

来自：大数据计算 MaxCompute 版块

隐林

|

存储分布式计算搜索推荐

|

博文

干货：解码OneData，阿里的数仓之路。

据IDC报告，预计到2020年全球数据总量将超过40ZB(相当于4万亿GB)，这一数据量是2013年的10倍。正在“爆炸式”增长的数据的潜在巨大价值正在被发掘，它有可能成为商业世界的“新能源”，变革我们的生产，影响我们生活。当我们面对如此庞大的数据之时，如果我们不能有序、有结构的进行分类组织

22291 2 4

来自：大数据计算 MaxCompute 版块

米尔。。。

|

Web App开发数据可视化

|

博文

如何轮播 DataV 大屏

如何轮播 DataV 大屏当你使用 DataV 制作了足够多的大屏时，一定会冒出一个需求：轮流播放大屏页面，不要怕，一分钟就可以搞定安装 Chrome 插件 TabCarousel 首先安装神器插件 TabCarousel 使用安装完成之后，地址栏右侧会出现这么个小图标。

19797 154 164

来自：数据可视化DataV 版块

隐林

|

弹性计算分布式计算 Hadoop

|

博文

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

想用阿里云数加·大数据计算服务（MaxCompute），但是现在数据还在hadoop上，怎么办？别烦恼，跟着我们走，来一次MaxCompute零基础数据迁移之旅～Let’s Go！

17526 0 0

来自：大数据计算 MaxCompute 版块

薛明2

|

SQL 分布式计算大数据

|

博文

使用 MaxCompute Studio 开发大数据应用

MaxCompute（原ODPS）是阿里云自主研发的分布式大数据处理平台。MaxCompute Studio 为开发者提供了良好的开发体验，本文将展开进行介绍。

15853 0 2

来自：大数据计算 MaxCompute 版块

冶善

|

分布式计算关系型数据库大数据

|

博文

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

本文用到的阿里云数加－大数据计算服务MaxCompute产品地址：https://www.aliyun.com/product/odps 简介 Kettle是一款开源的ETL工具，纯java实现，可以运行于Windows, Unix, Linux上运行，提供图形化的操作界面，可以通过拖拽控件的方式，方便地定义数据传输的拓扑。

21315 3 21

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 分布式计算资源调度

|

博文

MaxCompute常见错误汇总（更新ing）

从今天开始，小编会为大家陆续解读MaxCompute常见问题，帮助大家快速上手MaxCompute，玩转大数据计算平台。

24812 8 9

来自：大数据计算 MaxCompute 版块

jaredguo

|

搜索推荐 API 开发者

|

博文

OpenSearch：轻松构建大数据搜索服务

随着互联网数据规模的爆炸式增长，如何从海量的历史、实时数据中快速获取有用信息，变得越来越具有挑战性。搜索是获取信息最高效的途径之一，因此也是各类网站、应用的基础标配功能。开发者想在自己的产品中实现搜索功能一般都是基于某个开源搜索系统(如ElasticSearch、Solr、Sphinx

17800 3 5

来自：智能搜索推荐版块

隐林

|

算法搜索推荐大数据

|

博文

品《阿里巴巴大数据实践-大数据之路》一书(下)

今天继续谈阿里的这本书，包括数据服务平台、数据挖掘平台、数据建模、数据管理及数据应用，希望于你有启示。 1、数据服务平台数据服务平台可以叫数据开放平台，数据部门产出海量数据，如何能方便高效地开放出去，是我们一直要解决的难题，在没有数据服务的年代，阿里的数据开放的方式简单、粗暴，一般是直接将数据导出给对方，我想，现在大多公司的开放应该也是如此吧，虽然PaaS喊了这么多年，但真正成就的又有几个？即使如阿里，在数据开放这个方向上的探索和实践，至今也有7个年头了，任何关于数据开放毕其功于一役的做法都将失败，任何一次数据开放的改进都是伴随着对于业务理解的深入而成长起来的。

16274 2 3

来自：大数据计算 MaxCompute 版块

上单

|

存储分布式计算监控

|

博文

大数据阿里云产品的简单介绍理解

很多人问，大数据是什么。一个时尚的技术名词，一个互联网时代的标志。给人高端大气上档次的感觉，很多公司不说自己有大数据都不好意思跟别人谈业务。那我就谈谈我的一些看法来结合阿里云的数加大数据产品比较粗俗的介绍下大数据到底是什么。

16048 2 3

来自：大数据计算 MaxCompute 版块

开源大数据EMR

|

对象存储存储分布式计算

|

博文

JindoFS: 云上大数据的高性能数据湖存储方案

JindoFS 是EMR打造的高性能大数据存储服务，可以为不同的计算引擎提供不同的存储服务，可以根据应用的场景来选择不同的存储模式。在2019杭州云栖大会大数据生态专场，阿里巴巴计算平台事业部EMR团队技术专家殳鑫鑫和Intel大数据团队软件开发经理徐铖共同向大家分享了云上大数据的高性能数据湖存储方案JindoFS的产生背景、架构以及与Intel DCPM的性能评测。

17283 58 58

来自：开源大数据平台 E-MapReduce 版块

晋恒

|

机器学习/深度学习分布式计算大数据

|

博文

互联网下半场的角逐，玩转轻资产的大数据服务 | 阿里云栖开发者沙龙大数据专场（北京站）干货集锦

MaxCompute（原ODPS）是一项大数据计算服务，它能提供快速、完全托管的PB级数据仓库解决方案，使您可以经济并高效的分析处理海量数据。欢迎加入钉钉交流群11782920。

13869 0 0

来自：大数据计算 MaxCompute 版块

曾xiaoyi

|

算法搜索推荐前端开发

|

博文

搜索双链路实时计算体系@双11实战

该文章来自阿里巴巴技术协会（ATA）精选集 0. 前言何为双链路实时计算体系？微观实时计算链路 a) 最细粒度商品/店铺/用户数据的实时 b) 底层模型的实时宏观实时计算链路相比微观实时，宏观实时的对象粒度更粗，更上层 a) 以实时效果为目标，基于bandit learning的实

16430 2 3

来自：智能搜索推荐版块

傲海

|

机器学习/深度学习 SQL 分布式计算

|

博文

【玩转数据系列一】人口普查统计案例

玩转数据系列文章通过简单地案例搭建，介绍如何通过阿里云机器学习平台进行数据挖掘。

17577 3 3

来自：人工智能平台PAI 版块

晋恒

|

安全数据中心分布式计算

|

博文

如何有效降低大数据平台安全风险

在2019杭州云栖大会大数据企业级服务专场，由阿里云智能计算平台事业部资深技术专家李雪峰带来以“如何有效降低大数据平台安全风险”为题的演讲。本文首先概括了企业在大数据上云过程中会产生的安全顾虑。接着，在大数据平台中要处理的安全风险中，对数据中心物理安全与网络安全、大数据平台系统安全以及数据应用安全三部分做了详细的介绍。最后，描述了阿里云飞天大数据平台的安全体系。

14245 2 2

来自：大数据计算 MaxCompute 版块

开源大数据EMR

|

分布式计算大数据 Spark

|

博文

Spark in action on Kubernetes - Playground搭建与架构浅析

前言Spark是非常流行的大数据处理引擎，数据科学家们使用Spark以及相关生态的大数据套件完成了大量又丰富场景的数据分析与挖掘。Spark目前已经逐渐成为了业界在数据处理领域的行业标准。但是Spark本身的设计更偏向使用静态的资源管理，虽然Spark也支持了类似Yarn等动态的资源管理器，但是这些资源管理并不是面向动态的云基础设施而设计的，在速度、成本、效率等领域缺乏解决方案。

13598 1 1

来自：开源大数据平台 E-MapReduce 版块

身行

|

分布式计算大数据 MaxCompute

|

博文

【逐云】阿里“水电煤”背后的人物故事

《逐云》第三期，我们拍了阿里巴巴通用计算平台负责人关涛，记录了他的学生时代，以及为什么从美回国来到阿里巴巴做通用计算平台，以及他对未来的展望。

13620 0 0

来自：大数据计算 MaxCompute 版块

开源大数据EMR

|

对象存储存储分布式计算

|

博文

JindoFS解析 - 云上大数据高性能数据湖存储方案

JindoFS 是云原生的文件系统，可以提供OSS 超大容量以及本地磁盘的性能

16176 0 1

来自：开源大数据平台 E-MapReduce 版块

墨青

|

机器学习/深度学习自然语言处理算法

|

博文

DL应用：query生成和query推荐

引言　　在机器翻译、图片描述、语义蕴涵、语音识别和文本摘要中，序列到序列的问题已经有太多大牛研究了，也取得了很多突破。谷歌的Attention is all you need[1],舍弃并超越了主流的rnn与cnn序列建模框架，刷出了新的state of the art,这种大胆创新的精神值得我们学习。

16446 3 3

来自：智能搜索推荐版块

傲海

|

机器学习/深度学习人工智能算法

|

博文

阿里巴巴机器学习系列课程

亲爱的同学们，福利来临！随着机器学习领域的发展越来越火，阿里云机器学习PAI为广大机器学习爱好的学生提供免费的一站式算法平台，该平台提供上百种算法，并且兼容TensorFlow、Caffe、MXNET等深度学习框架，学生们还可以免费使用M40 GPU卡，这么好的福利到哪里去领呢？点击开通机器学习PAI：https://data.

16297 6 14

来自：人工智能平台PAI 版块

阿里云实时计算Flink

|

分布式计算数据处理 API

|

博文

流计算精品翻译: The Dataflow Model

我们提出了Dataflow模型，并详细地阐述了它的语义，设计的核心原则，以及在实践开发过程中对模型的检验。

20321 1 2

来自：实时计算 Flink 版块

隐林

|

SQL 分布式计算算法

|

博文

MaxCompute SQL原理解析及性能调优

分享内容介绍了ODPS SQL的基于mapreduce是如何实现的及一些使用小技巧，回顾了mapreduce各个阶段可能产生的问题及相应的处理方法，同时介绍了一些应对数据倾斜的处理方法，最后介绍了一些关于数据集构造、特征选择的技巧帮助减少资源利用。

12797 0 0

来自：大数据计算 MaxCompute 版块

梅熙

|

SQL 分布式计算网络安全

|

博文

如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

目前Aliyun E-MapReduce支持了zeppelin和hue，在Aliyun E-MapReduce集群上可以很方便的使用zeppelin和hue。本文将详细介绍如何在Aliyun E-MapReduce玩转Zeppelin和Hue！

14063 23 27

来自：开源大数据平台 E-MapReduce 版块

隐林

|

分布式计算大数据 Hadoop

|

博文

比自建 Hadoop 还便宜！云栖大会揭秘阿里云数加 MaxCompute

DT时代，越来越多的企业应用数据步入云端。 Hadoop是当下流行的大数据并行计算体系，横向扩展、生态圈成熟等一直是它的主要特点。阿里云数加MaxCompute (原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。

12512 0 0

来自：大数据计算 MaxCompute 版块

阿里云实时计算Flink

|

流计算 Apache 人工智能

|

博文

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

8 月最后一天，由 Apache Kafka 与 Apache Flink 联合举办的 Meetup 深圳站圆满落幕，现场站无虚席，来自 Confluent 、中国农业银行、虎牙直播、数见科技以及阿里巴巴的五位技术专家带来了丰富精彩的分享，全场干货满满！

14615 0 0

来自：实时计算 Flink 版块

计算爱好者

|

SQL 分布式计算大数据

|

博文

HIVE MapJoin异常问题处理总结

HIVE被很广泛的使用，使用过程中也会遇到各种千奇百怪的问题。这里就遇到的MapJoin Local 内存不足的问题进行讨论，从问题描述、mapjion原理以及产生该问题的原因，解决方案做一下介绍，最后对该问题进行了进一步的思考，希望对解决该类问题的朋友有所帮助。

16001 1 1

来自：开源大数据平台 E-MapReduce 版块

傲海

|

机器学习/深度学习算法搜索推荐

|

博文

【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

机器学习算法基于信用卡消费记录做信用评分背景如果你是做互联网金融的，那么一定听说过评分卡。评分卡是信用风险评估领域常用的建模方法，评分卡并不简单对应于某一种机器学习算法，而是一种通用的建模框架，将原始数据通过分箱后进行特征工程变换，继而应用于线性模型进行建模的一种方法。

15690 1 3

来自：人工智能平台PAI 版块

清淞

|

机器学习/深度学习自然语言处理算法

|

博文

阿士比亚：搜索团队智能内容生成实践

本文主要介绍阿里巴巴-搜索事业部算法团队上半年在智能内容生成方向工作的一些实践和思考。

16921 2 5

来自：智能搜索推荐版块

傲海

|

算法机器学习/深度学习数据处理

|

博文

【玩转数据系列三】利用图算法实现金融行业风控

本文将针对阿里云平台上图算法模块来进行实验。图算法一般被用来解决关系网状的业务场景。与常规的结构化数据不同，图算法需要把数据整理成首尾相连的关系图谱。图算法更多的是考虑边和点的概念。阿里云机器学习平台上提供了丰富的图算法组件，包括K-Core、最大联通子图、标签传播聚类等。

14620 3 8

来自：人工智能平台PAI 版块

kilowu

|

SQL 存储分布式计算

|

博文

MaxCompute上如何处理非结构化数据

0. 前言 MaxCompute作为阿里云大数据平台的核心计算组件，拥有强大的计算能力，能够调度大量的节点做并行计算，同时对分布式计算中的failover，重试等均有一套行之有效的处理管理机制。而MaxCompute SQL能在简明的语义上实现各种数据处理逻辑，在集团内外更是广为应用，在其上实现

13571 0 3

来自：大数据计算 MaxCompute 版块

阿里云实时计算Flink

|

SQL 流计算

|

博文

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

TopN 是统计报表和大屏非常常见的功能，主要用来实时计算排行榜。流式的 TopN 不同于批处理的 TopN，它的特点是持续的在内存中按照某个统计指标（如出现次数）计算 TopN 排行榜，然后当排行榜发生变化时，发出更新后的排行榜。

18730 1 7

来自：实时计算 Flink 版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

阿里封神谈hadoop生态学习之路

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

大数据环境下该如何优雅地设计数据分层

odps是什么?

【技术实验】mysql准实时同步数据到Elasticsearch

数据仓库介绍与实时数仓案例

分布式快照算法: Chandy-Lamport

DataV接入ECharts图表库 可视化利器强强联手

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

优酷背后的大数据秘密

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【玩转数据系列十五】机器学习PAI为你自动写歌词，妈妈再也不用担心我的freestyle了（提供数据、代码）

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

【玩转数据系列六】文本分析算法实现新闻自动分类

实时计算 Flink SQL 核心功能解密

【转载】时隔一年多，我又用起了 Superset

干货：解码OneData，阿里的数仓之路。

如何轮播 DataV 大屏

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

使用 MaxCompute Studio 开发大数据应用

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

MaxCompute常见错误汇总（更新ing）

OpenSearch：轻松构建大数据搜索服务

品《阿里巴巴大数据实践-大数据之路》一书(下)

大数据阿里云产品的简单介绍理解

JindoFS: 云上大数据的高性能数据湖存储方案

互联网下半场的角逐，玩转轻资产的大数据服务 | 阿里云栖开发者沙龙大数据专场（北京站）干货集锦

搜索双链路实时计算体系@双11实战

【玩转数据系列一】人口普查统计案例

如何有效降低大数据平台安全风险

Spark in action on Kubernetes - Playground搭建与架构浅析

【逐云】阿里“水电煤”背后的人物故事

JindoFS解析 - 云上大数据高性能数据湖存储方案

DL应用：query生成和query推荐

阿里巴巴机器学习系列课程

流计算精品翻译: The Dataflow Model

MaxCompute SQL原理解析及性能调优

如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

比自建 Hadoop 还便宜！云栖大会揭秘阿里云数加 MaxCompute

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

HIVE MapJoin异常问题处理总结

【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

阿士比亚：搜索团队智能内容生成实践

【玩转数据系列三】利用图算法实现金融行业风控

MaxCompute上如何处理非结构化数据

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

大数据与机器学习

活跃用户

相关产品

DataV接入ECharts图表库可视化利器强强联手