-
异常检测(Anti-Fraud: Anomaly Detection)
相对于有清晰定义的有监督分类问题我,反欺诈的数据集通常没有标签,区分噪声(noise)和异常(anomaly)… 阅读更多
-
常见反欺诈算法(Anti-Fraud Concepts and Algos)
最近看到关于常见的反欺诈算法讨论,其中一些要点摘录如下: 关系网络(图模型):关系网络挖掘的方法包括社区挖掘(… 阅读更多
-
用户画像(User Profile)实例:天猫回购客户预测(Repeated Buyers in Tmall)
介绍: 通过长期的用户行为数据判断用户回购,从而提高市场营销的效率。 数据:天池数据集。半年左右用户行为,包括… 阅读更多
-
评估指标(Evaluation Metrics): ROC, AUC, KS
在逻辑回归、随机森林、GBDT、XGBoost中, 模型训练完成之后每个样本都会得到两个概率值,一个是样本为正… 阅读更多
-
用户画像(User profiling)
用户画像,是指用户信息的标签化,从不同的维度比如消费者的基本信息、消费习惯、社会关系、生活习惯、网络轨迹等抽取… 阅读更多
-
机器学习算法(Models):GBDT+LR
用Tree Models加线性模型的建模方法来自于Facebook在2013年发表的关于广告点击率模型的研究。… 阅读更多
-
用户价值模型(Customer Lifetime Value):RFM
RFM是用来评价用户的一个模型框架,分别指R-Recency,F-Frequency,M-Monetary v… 阅读更多
-
机器学习算法(Models):Wide & Deep
Deep model,wide model,optimization methods, FTRL, Adagr… 阅读更多
-
机器学习算法(Models) – Tree-Based Family
keywords:决策树,梯度提升树,Decision Tree,AdaBoost, GBDT,XGBoost… 阅读更多
-
Understanding regularization: 三个角度理解正则化的作用
正则项的作用,可以从几个角度去解释: 优化角度 偏差方差 Bayes先验解释,把正则当成先验 正则化的问题 我… 阅读更多