0% found this document useful (0 votes)

5 views25 pages

Chapter 1

The document introduces fraud detection, outlining various types of fraud and the challenges associated with detecting it. It discusses methods used by companies, including rules-based systems and machine learning algorithms, and emphasizes the importance of data resampling techniques like SMOTE for improving detection rates. The document also previews upcoming chapters on supervised and unsupervised learning in fraud detection.

Uploaded by

ayesil.ie

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views25 pages

Chapter 1

Uploaded by

ayesil.ie

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 25

Introduction to fraud

detection
FRAUD DETECTION IN PYTHON

Charlotte Werger
Data Scientist
Meet your instructor

Hi my name is Charlotte and I am a Data Scientist

FRAUD DETECTION IN PYTHON

What is fraud?
Examples of fraud: insurance fraud, credit card fraud, identify theft, money laundering, tax
evasion, product warranty, healthcare fraud

Fraud is

uncommon

concealed

changing over time

organized

FRAUD DETECTION IN PYTHON

Fraud detection is challenging

FRAUD DETECTION IN PYTHON

Fraud detection is challenging

FRAUD DETECTION IN PYTHON

Fraud detection is challenging

FRAUD DETECTION IN PYTHON

Fraud detection is challenging

FRAUD DETECTION IN PYTHON

How companies deal with fraud
Fraud analytics teams:

1. Often use rules based systems, based on manually set thresholds and experience

2. Check the news

3. Receive external lists of fraudulent accounts and names

4. Sometimes use machine learning algorithms to detect fraud or suspicious behavior

FRAUD DETECTION IN PYTHON

Let's have a look at some data
df=pd.read_csv('creditcard_data.csv')

df.head()

V1 V2 ... Amount Class

0 -0.078306 0.025427 ... 1.77 0
1 0.000531 0.019911 ... 30.90 0
2 0.015375 -0.038491 ... 23.57 0
3 0.137096 -0.249694 ... 13.99 0
4 -0.014937 0.005771 ... 1.29 0

df.shape

(5050, 30)

FRAUD DETECTION IN PYTHON

Let's practice!
FRAUD DETECTION IN PYTHON
Increasing
successful
detections using
data resampling
FRAUD DETECTION IN PYTHON

Charlotte Werger
Data Scientist
Undersampling

FRAUD DETECTION IN PYTHON

Oversampling

FRAUD DETECTION IN PYTHON

Oversampling in Python
from imblearn.over_sampling import RandomOverSampler
method = RandomOverSampler()
X_resampled, y_resampled = method.fit_resample(X, y)
compare_plots(X_resampled, y_resampled, X, y)

FRAUD DETECTION IN PYTHON

Synthetic Minority Oversampling Technique (SMOTE)

1 https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

FRAUD DETECTION IN PYTHON

Which resampling method to use?
Random Under Sampling (RUS): throw away data, computationally efficient
Random Over Sampling (ROS): straightforward and simple, but training your model on many
duplicates

Synthetic Minority Oversampling Technique (SMOTE): more sophisticated and realistic

dataset, but you are training on "fake" data

FRAUD DETECTION IN PYTHON

When to use resampling methods
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
# Define resampling method and split into train and test
method = SMOTE()
X_train, X_test, y_train, y_test = train_test_split(X, y,
train_size=0.8, random_state=0)
# Apply resampling to the training data only
X_resampled, y_resampled = method.fit_resample(X_train, y_train)
# Continue fitting the model and obtain predictions
model = LogisticRegression()
model.fit(X_resampled, y_resampled)
# Get your performance metrics
predicted = model.predict(X_test)
print (classification_report(y_test, predicted))

FRAUD DETECTION IN PYTHON

Let's practice!
FRAUD DETECTION IN PYTHON
Fraud detection
algorithms in action
FRAUD DETECTION IN PYTHON

Charlotte Werger
Data Scientist
Traditional fraud detection with rules based systems

FRAUD DETECTION IN PYTHON

Drawbacks of using rules based systems
Rules based systems have their limitations:

1. Fixed thresholds per rule to determine fraud

2. Limited to yes/no outcomes

3. Fail to capture interaction between features

FRAUD DETECTION IN PYTHON

Why use machine learning for fraud detection?
1. Machine learning models adapt to the
data, and thus can change over time

2. Uses all the data combined rather than a

threshold per feature

3. Can give a score, rather than a yes/no

4. Will typically have a better performance

and can be combined with rules

FRAUD DETECTION IN PYTHON

Refresher on machine learning models
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn import metrics
# Step 1: split your features and labels into train and test data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# Step 2: Define which model you want to use
model = LinearRegression()
# Step 3: Fit the model to your training data
model.fit(X_train, y_train)
# Step 4: Obtain model predictions from your test data
y_predicted = model.predict(X_test)
# Step 5: Compare y_test to predictions and obtain performance metrics
print (metrics.r2_score(y_test, y_predicted))

0.821206237313

FRAUD DETECTION IN PYTHON

What you'll be doing in the upcoming chapters
Chapter 2. Supervised learning: train a
model using existing fraud labels

Chapter 3. Unsupervised learning: use your

data to determine what is 'suspicious'
behavior without labels

Chapter 4. Fraud detection using text data:

Learn how to augment your fraud detection
models with text mining and topic modeling

FRAUD DETECTION IN PYTHON

Let's practice!
FRAUD DETECTION IN PYTHON

Credit Card Fraud Detection (Data Analyst)
No ratings yet
Credit Card Fraud Detection (Data Analyst)
22 pages
SH - Fall of Troy Semi Fiction PDF
No ratings yet
SH - Fall of Troy Semi Fiction PDF
11 pages
Credit Card Fraud Detection Methods
100% (1)
Credit Card Fraud Detection Methods
20 pages
C# Chapter 8
No ratings yet
C# Chapter 8
34 pages
Project
91% (11)
Project
20 pages
Bom Chiller Cu 1720 01 02 (1951 U 806 A&b) Acds 040 Augqv
No ratings yet
Bom Chiller Cu 1720 01 02 (1951 U 806 A&b) Acds 040 Augqv
2 pages
LC-3 System Calls & TRAP Guide
No ratings yet
LC-3 System Calls & TRAP Guide
32 pages
Maintaining Training Facilities
No ratings yet
Maintaining Training Facilities
97 pages
PG Accomodation Building Construction: An Internship Report
No ratings yet
PG Accomodation Building Construction: An Internship Report
35 pages
I. Models Arrius 1A Arrius 2B1 Arrius 2B1A Arrius 2F Arrius 2K1 Arrius 2B2 Arrius 1A1
50% (2)
I. Models Arrius 1A Arrius 2B1 Arrius 2B1A Arrius 2F Arrius 2K1 Arrius 2B2 Arrius 1A1
11 pages
Aws Kms Best Practices PDF
No ratings yet
Aws Kms Best Practices PDF
24 pages
7MWTW1500AQ0
No ratings yet
7MWTW1500AQ0
8 pages
MUET
No ratings yet
MUET
1 page
Thermoacoustic Fridge Design
No ratings yet
Thermoacoustic Fridge Design
4 pages
Lecture Ch4 Performance
No ratings yet
Lecture Ch4 Performance
25 pages
Innopolis University Robotics Problems
No ratings yet
Innopolis University Robotics Problems
4 pages
Fraud Detection Course: Python Techniques
No ratings yet
Fraud Detection Course: Python Techniques
25 pages
Fraud Detection with Python Techniques
No ratings yet
Fraud Detection with Python Techniques
30 pages
Dutch Fintech Map 2022: Ecosystem Insights
No ratings yet
Dutch Fintech Map 2022: Ecosystem Insights
16 pages
Technical Service Bulletin: Group
No ratings yet
Technical Service Bulletin: Group
9 pages
How To Test A Power Supply Unit - Corsair
No ratings yet
How To Test A Power Supply Unit - Corsair
1 page
Example-Self Safety Inspection Checklist - QA
100% (1)
Example-Self Safety Inspection Checklist - QA
3 pages
Fraud Detection in Python Chapter3
No ratings yet
Fraud Detection in Python Chapter3
33 pages
Poster
No ratings yet
Poster
2 pages
SingerValve 106 PR UL Fire Valve Sheet Product Pages
No ratings yet
SingerValve 106 PR UL Fire Valve Sheet Product Pages
2 pages
Fraud Detection in Python Chapter4
No ratings yet
Fraud Detection in Python Chapter4
33 pages
Websys
No ratings yet
Websys
1 page
Avid - PT201 2021 - Ch10 Advanced Mixing and Finishing Techniques
No ratings yet
Avid - PT201 2021 - Ch10 Advanced Mixing and Finishing Techniques
30 pages
Quiz 2
No ratings yet
Quiz 2
4 pages
Presentation Matrix COSEC For End Users
No ratings yet
Presentation Matrix COSEC For End Users
147 pages
Linux Kernel Module Basics
No ratings yet
Linux Kernel Module Basics
35 pages
An Efficient Index For Contact Tracing Query in A Large Spatio - Temporal DB
No ratings yet
An Efficient Index For Contact Tracing Query in A Large Spatio - Temporal DB
22 pages
Module 3.4 Classification Models, Case Study
No ratings yet
Module 3.4 Classification Models, Case Study
12 pages
Credit Card Fraud Detection
No ratings yet
Credit Card Fraud Detection
72 pages
Industrial Oriented Mini Project - Summer Internship On
No ratings yet
Industrial Oriented Mini Project - Summer Internship On
14 pages
DBNex Deep Belief Network and Explainable AI Based Financial Fraud Detection
No ratings yet
DBNex Deep Belief Network and Explainable AI Based Financial Fraud Detection
10 pages
Fraud Detection with ML Algorithms
No ratings yet
Fraud Detection with ML Algorithms
3 pages
Boq1 Replacing Ac at Central Pharmacy Fo
No ratings yet
Boq1 Replacing Ac at Central Pharmacy Fo
11 pages
Fraud Detection with Machine Learning
No ratings yet
Fraud Detection with Machine Learning
33 pages
Presentation 1
No ratings yet
Presentation 1
22 pages
Fractal Previous Year Coding Questions Super Dream
No ratings yet
Fractal Previous Year Coding Questions Super Dream
2 pages
Fraud Detection for ML Engineers
No ratings yet
Fraud Detection for ML Engineers
15 pages
Fraud Detection for IT Students
No ratings yet
Fraud Detection for IT Students
26 pages
Credit Card Fraud Detection
No ratings yet
Credit Card Fraud Detection
10 pages
Deep Learning for Fraud Detection
No ratings yet
Deep Learning for Fraud Detection
5 pages
Presentation Credit Card
No ratings yet
Presentation Credit Card
25 pages
Python for Machine Learning & Fraud Detection
No ratings yet
Python for Machine Learning & Fraud Detection
21 pages
Disaster
No ratings yet
Disaster
20 pages
Fraud Detection On Bankism Data
No ratings yet
Fraud Detection On Bankism Data
25 pages
04 1a-Checkpoint1
No ratings yet
04 1a-Checkpoint1
6 pages
ITR Presentation (FINAL)
No ratings yet
ITR Presentation (FINAL)
14 pages
Credit Card Fraud Detection
No ratings yet
Credit Card Fraud Detection
25 pages
Credit Card Fraud 1.4% Positive Class
No ratings yet
Credit Card Fraud 1.4% Positive Class
17 pages
Credit Card Fraud Detection
No ratings yet
Credit Card Fraud Detection
34 pages
Ada Boost Optimizes Wave Energy Arrays
No ratings yet
Ada Boost Optimizes Wave Energy Arrays
6 pages
Enhancing Fraud Detection Systems Against Adversarial Attacks Using Machine Learning
No ratings yet
Enhancing Fraud Detection Systems Against Adversarial Attacks Using Machine Learning
11 pages
Fraud Detection in Financial Transactions
No ratings yet
Fraud Detection in Financial Transactions
2 pages
Credit Card PPT'
No ratings yet
Credit Card PPT'
12 pages
Proactive Fraud Defense
No ratings yet
Proactive Fraud Defense
1 page
Proactive Fraud Defense Machine Learnings Evolvin
No ratings yet
Proactive Fraud Defense Machine Learnings Evolvin
10 pages
Ba 1176 en (Delta) Ab增量式 (Stca900110) )
No ratings yet
Ba 1176 en (Delta) Ab增量式 (Stca900110) )
91 pages
IEEE Conference Template
No ratings yet
IEEE Conference Template
3 pages
Fraud Transaction Detection
No ratings yet
Fraud Transaction Detection
1 page
B17 Discrete Report
No ratings yet
B17 Discrete Report
16 pages
Report
No ratings yet
Report
14 pages
Case Study Front Page
No ratings yet
Case Study Front Page
11 pages
Advancements in Fraud Detection Systems Using Machine Learning
No ratings yet
Advancements in Fraud Detection Systems Using Machine Learning
3 pages
Hall 4
No ratings yet
Hall 4
1 page
Banking Fraud Detection Outline
No ratings yet
Banking Fraud Detection Outline
6 pages
Financial Fraud Detection
No ratings yet
Financial Fraud Detection
11 pages
PPT Dự án cuối kỳ nhóm 8
No ratings yet
PPT Dự án cuối kỳ nhóm 8
38 pages
Credit Card Fraud Detection Using Machine Learning
No ratings yet
Credit Card Fraud Detection Using Machine Learning
6 pages
ML for Online Payment Fraud Detection
No ratings yet
ML for Online Payment Fraud Detection
8 pages
Synopsis Format For IT, HW and AI Workshop
No ratings yet
Synopsis Format For IT, HW and AI Workshop
16 pages
Final Synopsis Fraud Detection
No ratings yet
Final Synopsis Fraud Detection
15 pages
06 BBMD
No ratings yet
06 BBMD
7 pages
Irjet V10i12130
No ratings yet
Irjet V10i12130
5 pages
DBNex Deep Belief Network and Explainable AI Based Financial Fraud Detection
No ratings yet
DBNex Deep Belief Network and Explainable AI Based Financial Fraud Detection
10 pages
Phase 3
No ratings yet
Phase 3
19 pages
ANN, KNN & Decision Tree
No ratings yet
ANN, KNN & Decision Tree
13 pages
Major Project Report
No ratings yet
Major Project Report
11 pages
Fraud Detection in Digital Payment Systems
No ratings yet
Fraud Detection in Digital Payment Systems
3 pages
Chapter 4
No ratings yet
Chapter 4
34 pages
EP4130 Project
No ratings yet
EP4130 Project
17 pages
Chapter 3
No ratings yet
Chapter 3
33 pages
Fraud Detection Using Machine Learning
No ratings yet
Fraud Detection Using Machine Learning
6 pages
Ads Phase4
No ratings yet
Ads Phase4
5 pages

Chapter 1

Uploaded by

Chapter 1

Uploaded by

Introduction to fraud

Hi my name is Charlotte and I am a Data Scientist

FRAUD DETECTION IN PYTHON

changing over time

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

2. Check the news

4. Sometimes use machine learning algorithms to detect fraud or suspicious behavior

FRAUD DETECTION IN PYTHON

V1 V2 ... Amount Class

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

Synthetic Minority Oversampling Technique (SMOTE): more sophisticated and realistic

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

1. Fixed thresholds per rule to determine fraud

2. Limited to yes/no outcomes

FRAUD DETECTION IN PYTHON

2. Uses all the data combined rather than a

3. Can give a score, rather than a yes/no

4. Will typically have a better performance

FRAUD DETECTION IN PYTHON

FRAUD DETECTION IN PYTHON

Chapter 3. Unsupervised learning: use your

Chapter 4. Fraud detection using text data:

FRAUD DETECTION IN PYTHON

You might also like