DMS Airflow:企业级数据工作流编排平台的专业实践
DMS Airflow 是基于 Apache Airflow 构建的企业级数据工作流编排平台,通过深度集成阿里云 DMS(Data Management Service)系统的各项能力,为数据团队提供了强大的工作流调度、监控和管理能力。本文将从 Airflow 的高级编排能力、DMS 集成的特殊能力,以及 DMS Airflow 的使用示例三个方面,全面介绍 DMS Airflow 的技术架构与实践应用。
基于云数据库 RDS Supabase 服务一站式构建 AI 应用
云数据库 RDS PostgreSQL 全托管 Supabase 服务,为客户提供了 AI 应用开发的新范式。本次分享将重点介绍 RDS Supabase 核心能力和适用场景,以及相较于开源版 Supabase 和社区版PostgreSQL,RDS Supabase 具备的增强能力,并通过实战演练,带大家了解如何基于RDS Supabase 开发一个简易 Agentic RAG 应用。点此提交咨询申请试用:https://page.aliyun.com/form/act987005680/index.htm
基于PolarDB-PG一站式AI Agent长记忆方案
本文介绍了基于PolarDB-PG的AI Agent长记忆方案,结合Mem0框架,提供向量与图数据库一站式支持,解决LLM跨会话、跨应用“失忆”问题。方案具备跨会话记忆、个性化服务、高效检索等能力,适用于各类AI应用场景。
AI时代,数据库如何为大模型注入生命力?
要真正打造有价值、有生产力的AI应用,一个关键环节常被低估——那就是数据库。 在AI时代,数据库究竟如何为大模型注入生命力? 视频转载自量子位B站
【Java架构师体系课 | MySQL篇】④ 索引失效问题总结
本文详解MySQL索引使用规范,涵盖全值匹配、最左前缀法则、避免索引列操作、覆盖索引、不等条件与通配符对索引的影响等十二大要点,结合EXPLAIN分析SQL执行计划,提升查询性能。
Mysql如何往表中插入10万条测试数据
创建存储过程批量插入10万条测试数据。示例中先建员工表,再通过循环调用存储过程高效生成大量记录,适用于性能测试或数据初始化场景。
【Java架构师体系课 | MySQL篇】③ Explain执行计划详解
Explain用于分析SQL执行计划,通过模拟优化器行为揭示查询性能瓶颈。它展示索引使用、扫描行数等信息,帮助优化查询语句,提升数据库效率。
【赵渝强老师】OceanBase的连接与路由管理
ODP(OceanBase Database Proxy)是OceanBase数据库专用的连接路由组件,负责将客户端SQL请求智能路由至最佳OBServer节点,具备高性能转发、高可用、易运维等特性,支持读写分离与多副本负载均衡,是分布式数据库访问的核心代理服务。
从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
基于 Apache Doris 替换了早期架构中 Kylin、Druid、Clickhouse、Elasticsearch、HBase 等引擎,统一了实时分析架构,并广泛应用于广告系统、日志平台和会员报表分析等典型场景,导入性能提升 3~30 倍,机器成本整体降低 55%、部分场景下高达 85%,每年节省数百万成本,综合效能提升 3~7 倍等显著收益,本文将详尽介绍基于 Doris 架构升级及在这些场景中的应用实践。
专为 Apache Doris 打造的可视化数据管理工具 SelectDB Studio
SelectDB Studio 提供 Desktop & Server 双版本,专注于为用户提供高效、便捷的可视化操作体验,帮助数据开发者、DBA 低门槛、高效率地对 Apache Doris 及其兼容数据库中的数据进行可视化开发和管理。
什么是脏读、幻读、不可重复读?Mysql的隔离级别是什么?
脏读、不可重复读和幻读是数据库事务并发操作中的三种异常现象。脏读指读取到未提交的临时数据;不可重复读指同一事务内两次读取结果不一致,因数据被其他事务修改;幻读则是范围查询中出现新增记录,导致行数变化。SQL-92标准定义了四种隔离级别:未提交读(RU)、提交读(RC)、可重复读(RR)和串行化(Serializable),依次增强对这些异常的防控能力,平衡数据一致性与系统并发性能。
CMP7(类Cloudera CDP 7 404版华为Kunpeng)用开源软件Label Studio做数据标注
Cloudera CMP 7 不直接提供数据标注功能,但可集成开源工具如 Label Studio、Doccano、LabelU 和 CVAT 实现多模态数据标注。推荐通过 CML 在私有云或公有云环境部署这些工具,结合 HDFS/S3 数据湖存储,构建端到端 AI/ML 标注与训练闭环,支持预标注、多人协作与企业级集成。
【Java架构师体系课 | MySQL篇】② 深入理解MySQL索引底层数据结构与算法
InnoDB索引为何采用B+树?本文由浅入深解析二叉树、红黑树、B树的缺陷,详解B+树的结构优势:非叶子节点不存数据、叶子节点有序且双向链接,支持高效范围查询与磁盘预读,三层即可存储两千多万数据,极大提升查询性能。
代码示例说明如何通过线程池实现有返回值的多线程编程
通过Callable和Future结合线程池,实现有返回值的多线程编程。Callable定义带返回值的任务,submit提交后返回Future对象,调用get()可获取结果并处理异常。支持单任务与多任务并发,适用于数据并行计算等场景,提升执行效率。
钉钉ONE选用阿里云PolarDB数据库,实现百亿级数据的高效向量检索
阿里云瑶池PolarDB PostgreSQL版作为钉钉ONE的底层数据库,凭借分布式架构与向量检索能力,支撑百亿级数据、高并发与AI智能推荐,助力钉钉实现“事找人”的办公新范式。
Oracle 数据库查询:单表查询
想知道Oracle是如何一步步处理你的查询请求吗?关键在于理解它背后“看不见的”执行顺序。它会先从FROM和WHERE锁定数据,再用GROUP BY分组,最后才排序。搞懂这个流程,再掌握用ROWNUM实现分页的技巧,就能更自如地从数据库里拿到你想要的数据了。
Oracle 数据库数据操作:精通 INSERT, UPDATE, DELETE
在Oracle里,增加数据用INSERT,修改用UPDATE,删除则用DELETE。进行修改和删除时,建议总是带上WHERE条件来指定范围,这样可以确保操作的准确性
【Java架构师体系课 | MySQL篇】① 全面理解MySQL架构设计
本文详解MySQL一条SQL查询与更新语句的执行流程,涵盖连接器、分析器、优化器、执行器及存储引擎层协作机制,并深入解析redo log与binlog日志如何通过两阶段提交保障数据一致性与恢复能力。
构建实时多模知识库助力企业 Agent “持续在线”
本次分享将深入解析阿里云DTS + ADB PG 构建企业级知识库的技术方案。探讨如何通过 DTS One Channel For AI 和 ADB 的 GraphRAG 能力来简化数据链路管理,实现知识的深度挖掘与应用。最后通过示例演示,展示如何快速整合并解析复杂财报数据,提升企业决策效率。了解更多精彩搜索钉钉群号79690034672入群与技术专家交流!
Rocky Linux PostgreSQL 18 llvm+uring源码安装
PostgreSQL 18正式版发布,新增异步I/O、UUIDv7等功能。本文记录在Rocky Linux 9上从依赖安装、LLVM编译、io_uring配置到PostgreSQL 18源码编译的完整过程,涵盖关键步骤与命令,助你顺利构建最新版本数据库环境。
Java基础阶段的常见错误和解决方案的文章
本文精选Java基础常见错误与解决方案的优质文章,涵盖环境配置、语法基础、面向对象、异常处理、集合IO等核心知识点,结合典型错误代码与原理分析,助力新手避坑提效,适合系统学习与实战参考。
【赵渝强老师】Redis数据的迁移
Redis提供move、dump+restore和migrate三种方式实现数据迁移。move用于库内迁移,dump+restore跨实例传输,migrate则原子性地完成键的迁移与删除,支持多键批量操作,提升效率。
WebStorm 2025.1 最新版本发布安装+激活+中文设置全流程教程
WebStorm 2025.1 是 JetBrains 推出的专业前端 IDE,全面支持 JS/TS 及主流框架,智能补全、重构与调试能力升级,新增 AI 辅助编码、性能分析工具,大幅提升开发效率与代码质量。
视频也能“验真”?高维数据获边缘隐藏防篡改专利,为每帧内容穿上“隐形防护服”(第2期)
合肥高维数据获“视频防篡改水印”专利,创新性将水印嵌入边缘像素,利用人眼视觉特性与感知哈希算法,实现隐蔽、鲁棒的内容保护,为司法取证、新闻媒体、在线教育等提供真伪验证,构筑可信视频生态防线。
AI 在数据库操作中的各类应用场景、方案与实践指南
本文系统梳理AI在数据库操作中的8大核心场景,涵盖智能查询生成、性能优化、数据质量监控与自动化报表等,结合SQL实例与最佳实践,展现AI如何赋能数据库开发,提升效率与洞察力。
基于 DMS Dify+Notebook+Airflow 实现 Agent 的一站式开发
本文提出“DMS Dify + Notebook + Airflow”三位一体架构,解决 Dify 在代码执行与定时调度上的局限。通过 Notebook 扩展 Python 环境,Airflow实现任务调度,构建可扩展、可运维的企业级智能 Agent 系统,提升大模型应用的工程化能力。
筑牢业务+数据双安全:阿里云PolarDB与用友BIP超级版共建数智升级解决方案
阿里云PolarDB+用友BIP超级版正在定义中国企业的数智化新标准。这不是一次简单的“替换”或“迁移”,而是一场关于数据实时性、架构弹性与生态开放性的系统性升级。打破了传统商业软件的封闭环境,可以互相印证,共同发展,也能拥有实时财务关账能力,敏捷供应链响应,数据驱动的智能运营。
用代码示例说明如何通过线程池实现Java多线程编程
Java线程池通过复用线程提升多线程效率,减少资源开销。本文详解ExecutorService、ThreadPoolExecutor等核心API,结合Runnable与Callable任务示例,演示线程池创建、任务提交、结果获取及关闭流程,并强调自定义线程池的必要性与最佳实践。
基于Qoder + RDS Supabase 构建 Vibe Coding 项目
VibeCoding是AI驱动的编程新范式,开发者通过自然语言描述需求,由AI完成全栈开发。结合Qoder与 RDS Supabase MCP Server,可填补前后端断层,实现高效全栈应用生成,显著降低开发门槛,提升非专业者的开发效率。点此了解更多 RDS Supabase 相关内容
StarRocks 4.0:基于 Apache Iceberg 的 Catalog 中心化访问控制
StarRocks 4.0 已正式发布!这一版本带来了多项关键升级。接下来,我们将以每周一篇的节奏,逐一解析 4.0 的核心新特性。 在多引擎协同访问同一数据湖的场景下,如何实现安全、统一且可审计的权限管理,是 Lakehouse 架构演进中的一项关键挑战。StarRocks 4.0 联合 Apache Iceberg,借助 REST Catalog 的统一治理能力与 JWT 身份认证、临时凭证机制(Vended Credential),为多引擎湖仓架构提供了一种全新的安全访问方式。
redis数据导出和导入最佳实践
redis的导出和导入,有可视化工具,也有命令行工具,这里,我们当然是要选可视化工具,命令行工具安装也麻烦,使用也麻烦,直接pass掉。 这里我是推荐使用yunedit-redis来做导出和导入,其一是因为它的导出和导入非常类型,可以导出整库、还可以导出单个db,还可以只导出几个key、甚至可以使用它的自定义导出功能根据正侧表达式导出符合规则的key的数据
Everything(文件搜索工具)安装教程!电脑端最强文件搜索神器
Everything是一款毫秒级响应的轻量级文件搜索工具,直接读取NTFS文件系统MFT,无需建库索引,安装包仅1.7MB,资源占用极低。输入关键词即可瞬间定位电脑中的文件与文件夹,支持快速筛选与浏览,大幅提升文件查找效率。
告别 Hadoop,拥抱 StarRocks!政采云数据平台升级之路
政采云平台作为政府采购数字化的创新典范,集监管、交易、服务于一体,经过近九年的发展,已成为行业内服务范围最广、用户数量最多、交易最活跃、监管产品最丰富的跨区域、跨层级、跨领域的一体化采购云服务平台,日均处理海量高并发数据。Hadoop 作为早期构建大规模数据平台的基石,为政采云平台打开了低成本处理海量非结构化、半结构化数据的可能。然而,伴随业务激增、复杂分析需求及严苛的时效要求,曾经“功臣”的局限性和沉重包袱日益凸显,逐渐成为数据价值释放的“枷锁”。
数据资产运营:从资源到资本的价值跃迁之路
在数字经济时代,数据已成为关键生产要素。本文提出“数据资产运营框架”,涵盖价值路径、战略体系与基础支撑,推动数据从资源到资本的跃迁,助力企业实现数字化转型与价值创新。
破解数据治理困局:从“甩锅大战”到协同作战
企业数字化转型中,数据治理常陷入业务、IT与数据团队相互推诿的“三国杀”。根源并非技术问题,而是责任不清、机制缺失与协作文化错位。需构建“三层架构”、明确RACI责任矩阵,推动业务主导、技术支撑、数据协同的共治体系,通过规则三件套、双语专员、问题日志等工具落地,实现从“甩锅”到“共建”的转变。
体育直播比分网搭建需要注意哪些问题?一篇干货总结新手少走弯路!
体育直播比分网站看似前景广阔,实则技术、数据、合规坑点多。需重视实时性架构、稳定数据源、用户体验与差异化内容,并规避版权风险。建议从MVP起步,验证模式后再深耕,四步并行方能长远发展。
数据空间:数字经济时代的“新基建”与信任生态
数据空间不仅是技术架构的革新,更是一场关于信任机制、协作模式与价值分配的深刻变革。它既是技术平台,也是信任生态,更是国家战略基础设施。 未来,随着人工智能、物联网、边缘计算等技术的发展,数据的规模与复杂性将持续增长。唯有构建安全、可信、高效的数据流通网络,才能释放数据的“倍增效应”,驱动经济社会的全面智能化转型。
数据库
数据库领域前沿技术分享与交流