Thanks to visit codestin.com
Credit goes to github.com

Skip to content
View jsnorman's full-sized avatar

Block or report jsnorman

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Showing results

DataTunnel 是一个基于spark引擎的超高性能的分布式数据集成软件,支持海量数据的同步。基于spark extensions 扩展的DSL语法,结合的Spark SQL,更加便捷融入数仓 ETLT 过程中,简单易用。

Java 34 22 Updated Oct 27, 2025

This is a repository of public data sources for Recommender Systems (RS).

Python 1,085 154 Updated Sep 5, 2024

Source code for the X Recommendation Algorithm

Scala 67,644 12,608 Updated Sep 8, 2025

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

Python 35,789 10,823 Updated Oct 19, 2025

基于 antlr4 的多种数据库SQL解析器,获取SQL中元数据,可用于数据平台产品中的多个场景:ddl语句提取元数据、sql 权限校验、表级血缘、sql语法校验等场景。支持spark、flink、gauss、starrocks、Oracle、MYSQL、Postgresql,sqlserver,、db2等

ANTLR 379 138 Updated Sep 21, 2025

REST job server for Apache Spark

JavaScript 44 14 Updated May 23, 2025

A Lighting Pytorch Framework for Recommendation System, Easy-to-use and Easy-to-extend.

Python 83 14 Updated Jun 4, 2022

🛴 PyTorch Implementation of classic Recommender System Models.

Python 15 5 Updated Jun 4, 2022

《Machine Learning Systems: Design and Implementation》- Chinese Version

TeX 4,671 475 Updated Apr 13, 2024

Papers on Computational Advertising

Python 4,355 1,195 Updated Feb 9, 2021

机器学习方法习题解答,在线阅读地址:https://datawhalechina.github.io/statistical-learning-method-solutions-manual

Jupyter Notebook 1,954 243 Updated Sep 9, 2025

《机器学习》(西瓜书)代码实战

Jupyter Notebook 908 185 Updated May 7, 2025

Datawhale成员整理的面经,内容包括机器学习,CV,NLP,推荐,开发等,欢迎大家star

3,263 481 Updated Aug 27, 2025

Ip2region is a offline IP location library with accuracy rate of 99.9% and 0.0x millseconds searching performance. DB file is ONLY a few megabytes with all IP address stored. binding for Java,PHP,C…

C# 95 8 Updated Jul 1, 2022

The world's fastest open query engine for sub-second analytics both on and off the data lakehouse. With the flexibility to support nearly any scenario, StarRocks provides best-in-class performance …

Java 10,807 2,170 Updated Oct 28, 2025

A Deep Learning Recommender System

Python 2,666 864 Updated Jun 2, 2024

推荐、广告工业界经典以及最前沿的论文、资料集合/ Must-read Papers on Recommendation System and CTR Prediction

1,018 219 Updated Jan 20, 2024

主要是我是日常看过的不错的文章的资源汇总,方便自己也分享给大家。有些我看过的,就会做简单的解读,没看过的,就先罗列一下,然后之后看了把解读更新上;涉及到搜索/推荐/自然语言处理。

1,765 330 Updated Jun 3, 2021

MovieLens based recommender system.使用MovieLens数据集训练的电影推荐系统。

Jupyter Notebook 1,302 478 Updated Mar 31, 2019

如果有人让你推荐 Python 技术书,请让他看这个列表

1,342 359 Updated Jan 2, 2020

计算广告/推荐系统/机器学习(Machine Learning)/点击率(CTR)/转化率(CVR)预估/点击率预估

2,059 442 Updated Dec 17, 2019

AI Roadmap:机器学习(Machine Learning)、深度学习(Deep Learning)、对抗神经网络(GAN),图神经网络(GNN),NLP,大数据相关的发展路书(roadmap), 并附海量源码(python,pytorch)带大家消化基本知识点,突破面试,完成从新手到合格工程师的跨越,其中深度学习相关论文附有tensorflow caffe官方源码,应用部分含推荐算法…

2,922 613 Updated Jan 20, 2025

🚁🚀基于Flink实现的商品实时推荐系统。flink统计商品热度,放入redis缓存,分析日志信息,将画像标签和实时记录放入Hbase。在用户发起推荐请求后,根据用户画像重排序热度榜,并结合协同过滤和标签两个推荐模块为新生成的榜单的每一个产品添加关联产品,最后返回新的用户列表。

Java 4,435 1,482 Updated Feb 4, 2024

搜索所有中文NLP数据集,附常用英文NLP数据集

Python 4,378 628 Updated Nov 21, 2022

各种脚本 -- 关于 虾米 xiami.com, 百度网盘 pan.baidu.com, 115网盘 115.com, 网易音乐 music.163.com, 百度音乐 music.baidu.com, 360网盘/云盘 yunpan.cn, 视频解析 flvxz.com, bt torrent ↔ magnet, ed2k 搜索, tumblr 图片下载, unzip

Python 5,081 1,177 Updated Oct 25, 2022

🔥 🎉newbee-mall是一套电商系统,包括基础版本(Spring Boot+Thymeleaf)、前后端分离版本(Spring Boot+Vue 3+Element-Plus+Vue-Router 4+Pinia+Vant 4) 、秒杀版本、Go语言版本、微服务版本(Spring Cloud Alibaba+Nacos+Sentinel+Seata+Spring Cloud Gatew…

Java 11,430 2,738 Updated Oct 27, 2025

中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…

Python 76,866 15,043 Updated May 10, 2024

"结巴"中文分词的C++版本

C++ 2,790 720 Updated Jul 26, 2025

⭐⭐⭐⭐秒杀系统设计与实现.互联网工程师进阶与分析🙋🐓

Java 26,545 6,636 Updated Apr 18, 2025

mall项目是一套电商系统,包括前台商城系统及后台管理系统,基于Spring Boot+MyBatis实现,采用Docker容器化部署。 前台商城系统包含首页门户、商品推荐、商品搜索、商品展示、购物车、订单流程、会员中心、客户服务、帮助中心等模块。 后台管理系统包含商品管理、订单管理、会员管理、促销管理、运营管理、内容管理、统计报表、财务管理、权限管理、设置等模块。

Java 81,967 29,519 Updated Oct 17, 2025
Next