0% found this document useful (0 votes)

10 views3 pages

Interview Preparation Notes

The document outlines interview preparation notes covering key topics in regression, model evaluation, feature engineering, time series forecasting, project context, sampling, A/B testing, Python programming, SQL, probability, and NLP concepts. It includes questions and explanations related to each topic, such as model assumptions, evaluation metrics, feature selection techniques, and deep learning architectures. This comprehensive guide serves as a resource for candidates preparing for technical interviews in data science and analytics.

Uploaded by

bhushanshinde0608

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views3 pages

Interview Preparation Notes

Uploaded by

bhushanshinde0608

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Interview Preparation Notes

Regression and Model Assumptions

1. What are the key assumptions of a linear regression model?

2. What is homoscedasticity, and how is it different from heteroscedasticity?

3. What is multicollinearity, and how can it affect model performance?

4. What is the difference between bias and variance?

5. What are overfitting and underfitting? How can they be avoided?

Model Evaluation & Metrics

1. What is R score and what does it indicate?

2. Why is adjusted R used, and how is it different from R?

3. What are precision, recall, F1-score, and how do we control the tradeoff between them?

4. What metrics are used in regression problems (e.g., RMSE, MAE, MAPE)?

5. Why did you use MAPE for time series forecasting instead of R?

Feature Engineering & Selection

1. What is feature engineering?

2. How do you select relevant features for a model?

3. What is VIF (Variance Inflation Factor), and how is it used for detecting multicollinearity?

4. Can VIF be applied to categorical variables?

5. What is SHAP and LIME? How do they help in model interpretation?

Time Series Forecasting

1. What are the components of a time series (trend, seasonality, residual, etc.)?

2. What is the difference between seasonality and cyclicity?

3. What is ARIMA? Explain its components (p, d, q).

4. How do we decide the AR and MA order using ACF and PACF plots?

5. How are ACF and PACF calculated and interpreted?

6. How is stationarity tested in time series data?

7. How do you handle missing values in time series data?

8. How are outliers treated in time series forecasting?

9. What is forecast moderation and disaggregation?

Interview Preparation Notes

10. What is Triple Exponential Smoothing (TES), and how do you tune its parameters?

11. What is Auto_TES and why didn't you use newer models?

Project & Business Context Questions

1. Explain segmentation and its role in forecasting.

2. What is ABC classification, and how is it applied?

3. How do you handle outlier correction in your data pipeline?

4. What KPIs would you track for transaction success/failure?

5. What was the size of the dataset you worked with?

6. Explain your project in detail.

Sampling & Hypothesis Testing

1. What are different types of sampling techniques?

2. If you want to compare a product's sales trend against others, which sampling approach would you use?

3. How do you test if a new model is better than an existing one using hypothesis testing?

4. How do you generate a representative sample for model comparison?

5. What are common significance levels (e.g., 0.01, 0.05, 0.10) and how do you choose one?

A/B Testing & Experimentation

1. If a model (v1) is already deployed and a new model (v2) is developed, how do you compare them using A/B testing

without accuracy metrics?

Python Programming

1. How to apply a discount to specific values in a dictionary?

2. How do you calculate a cumulative sum manually (without using built-in functions)?

3. What does np.zeros(2) return?

4. What happens if a Python function doesn't include a return statement?

5. How do break and continue work in loops?

6. What is the difference between lists and arrays?

7. What is list comprehension in Python?

8. What is left-skewed vs right-skewed data?

Interview Preparation Notes

Python Coding Tasks

1. Write a function to find the longest substring with at most K distinct characters.

2. Write a function to find the longest common prefix in a list like ["flower", "flow", "flight"] -> 'fl'

3. Fix the logic in a function to compute running balance in a DataFrame with credit/debit values.

4. Extract valid email addresses from a list of text strings using a heuristic (e.g., @ in the middle).

5. Calculate a 7-day rolling average of sales using rolling(window=7, min_periods=1).

SQL & Databases

1. What is the difference between WHERE and HAVING clauses in SQL?

2. What is the difference between ALTER and UPDATE statements?

3. SQL query: Given three tables, write a query to find customers who bought "widget_A" at least once.

4. How would you write a query to select students scoring more than 60%?

Probability & Statistics

1. What is the probability of getting at least two consecutive 3s when rolling a die three times?

2. Why don't we normalize data before detecting outliers?

NLP & Deep Learning Concepts

1. What is a Variational Autoencoder (VAE)?

2. What are GPT and BERT architectures? When should each be used?

3. What is an agent in AI systems?

4. What is self-attention and multi-head attention in transformers? Why are they important?

State Variables For Engineers - DeRusso, Paul M - (Paul Madden) Roy, Rob J - , Author Close, - 1965 - New York, Wiley - 9780471203803 - Anna's Archive
No ratings yet
State Variables For Engineers - DeRusso, Paul M - (Paul Madden) Roy, Rob J - , Author Close, - 1965 - New York, Wiley - 9780471203803 - Anna's Archive
632 pages
Company Wise Data Science Interview Questions
100% (2)
Company Wise Data Science Interview Questions
39 pages
Data Science Training in Naresh I Technologies
100% (3)
Data Science Training in Naresh I Technologies
18 pages
120 Data Science Interview Questions
No ratings yet
120 Data Science Interview Questions
19 pages
Operations Research: Integer Programming
No ratings yet
Operations Research: Integer Programming
42 pages
Model Risk Forrest
No ratings yet
Model Risk Forrest
15 pages
The Partial Differential Equation For The Blasius Equation
No ratings yet
The Partial Differential Equation For The Blasius Equation
11 pages
Introduction To Data Science - Lin and Li
No ratings yet
Introduction To Data Science - Lin and Li
403 pages
Introduction To CFD Basics Rajesh Bhaskaran
No ratings yet
Introduction To CFD Basics Rajesh Bhaskaran
17 pages
Aspiring Data Scientist Profile
No ratings yet
Aspiring Data Scientist Profile
13 pages
DSP
No ratings yet
DSP
95 pages
Classical Dynamics & Thermodynamics
No ratings yet
Classical Dynamics & Thermodynamics
30 pages
Internship Report Data Science
100% (1)
Internship Report Data Science
58 pages
Pushdown Automata Pdas: Fall 2006 Costas Busch - RPI 1
No ratings yet
Pushdown Automata Pdas: Fall 2006 Costas Busch - RPI 1
79 pages
What Are The Differences Between Supervised and Unsupervised Learning?
No ratings yet
What Are The Differences Between Supervised and Unsupervised Learning?
21 pages
Solving Simultaneous Equations
No ratings yet
Solving Simultaneous Equations
3 pages
DsNaIT v2.0
No ratings yet
DsNaIT v2.0
43 pages
Data Stream Sampling Techniques
No ratings yet
Data Stream Sampling Techniques
3 pages
Introduction To Data Science: Hui Lin and Ming Li
No ratings yet
Introduction To Data Science: Hui Lin and Ming Li
403 pages
Data Science Full Stack Roadmap
No ratings yet
Data Science Full Stack Roadmap
25 pages
Sistemas de Control: Lazo Abierto y Cerrado
No ratings yet
Sistemas de Control: Lazo Abierto y Cerrado
3 pages
Unit6 Part3 General Procedure
No ratings yet
Unit6 Part3 General Procedure
19 pages
Week5 Modified
No ratings yet
Week5 Modified
25 pages
Data Science Interview Questions
No ratings yet
Data Science Interview Questions
50 pages
1.descriptive Statistics and Probability Distributions:: Datascience Course Content
No ratings yet
1.descriptive Statistics and Probability Distributions:: Datascience Course Content
10 pages
AI 101: Demystifying Artificial Intelligence
No ratings yet
AI 101: Demystifying Artificial Intelligence
34 pages
Data Science
100% (1)
Data Science
7 pages
Data Science Course for Programmers
No ratings yet
Data Science Course for Programmers
18 pages
Richard Khoury, Douglas Wilhelm Harder (Auth.) - Numerical Methods and Modelling For Engineering-Springer International Publishing (2016)
No ratings yet
Richard Khoury, Douglas Wilhelm Harder (Auth.) - Numerical Methods and Modelling For Engineering-Springer International Publishing (2016)
343 pages
120 Interview Questions
83% (12)
120 Interview Questions
19 pages
Ivy - Data Science and Data Visualization Certification Course
100% (1)
Ivy - Data Science and Data Visualization Certification Course
10 pages
Data Prep and Cleaning For Machine Learning
No ratings yet
Data Prep and Cleaning For Machine Learning
22 pages
Data Science Interview Prep Guide
No ratings yet
Data Science Interview Prep Guide
25 pages
Interview Questions Companie
No ratings yet
Interview Questions Companie
72 pages
DATA SCIENCE iNTERVIEW QUESTION
No ratings yet
DATA SCIENCE iNTERVIEW QUESTION
42 pages
Machine Learning Wiki Overview
No ratings yet
Machine Learning Wiki Overview
2 pages
ML Questions
No ratings yet
ML Questions
56 pages
Analytics 02011 Learning Path - Curriculum (6632)
No ratings yet
Analytics 02011 Learning Path - Curriculum (6632)
22 pages
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
No ratings yet
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
10 pages
CV Lecture 4
No ratings yet
CV Lecture 4
52 pages
Support Vector Machine
100% (1)
Support Vector Machine
40 pages
Data Scientist Interview Prep Guide
No ratings yet
Data Scientist Interview Prep Guide
7 pages
DSA Chapter 7 - Graphs
No ratings yet
DSA Chapter 7 - Graphs
71 pages
Crack Data Science Interview 1731300339
No ratings yet
Crack Data Science Interview 1731300339
132 pages
Common DS Interview Questions and Answers - 1
No ratings yet
Common DS Interview Questions and Answers - 1
4 pages
Machine Learning Based Data Driven Diagnostics & Prognostics Framework For Aircraft Predictive Maintenance
No ratings yet
Machine Learning Based Data Driven Diagnostics & Prognostics Framework For Aircraft Predictive Maintenance
15 pages
R22 ML Syllabus
No ratings yet
R22 ML Syllabus
2 pages
Da 1733591326
No ratings yet
Da 1733591326
132 pages
Dataanalyticswithpython Interview Que
No ratings yet
Dataanalyticswithpython Interview Que
5 pages
Capstone Project
No ratings yet
Capstone Project
9 pages
Big Data Imp Notes of Big Dats
No ratings yet
Big Data Imp Notes of Big Dats
17 pages
Basic Data Science Interview Questions
No ratings yet
Basic Data Science Interview Questions
18 pages
ML SIG - Day 1
No ratings yet
ML SIG - Day 1
55 pages
Diffusion Models: A Comprehensive Survey of Methods and Applications
No ratings yet
Diffusion Models: A Comprehensive Survey of Methods and Applications
54 pages
STMOL Lecture 1
No ratings yet
STMOL Lecture 1
54 pages
Ads Imp Qna 2025 15 04 06 06 35
No ratings yet
Ads Imp Qna 2025 15 04 06 06 35
33 pages
Week 4 - Intro To ML
No ratings yet
Week 4 - Intro To ML
37 pages
Data Analyst Role Tasks Skills
No ratings yet
Data Analyst Role Tasks Skills
21 pages
Data Science Checklist
No ratings yet
Data Science Checklist
22 pages
Ids Unit1
No ratings yet
Ids Unit1
3 pages
Orchidea Configuration Guide
No ratings yet
Orchidea Configuration Guide
4 pages
Lab Assignment 9
No ratings yet
Lab Assignment 9
3 pages
Untitled Document
No ratings yet
Untitled Document
8 pages
Mock Interview Topics and Questions
No ratings yet
Mock Interview Topics and Questions
4 pages
(FINAL) Data Science Interview ChatGPT Cheat Sheet
No ratings yet
(FINAL) Data Science Interview ChatGPT Cheat Sheet
1 page
Data Mining Question Bank 3,4,5
No ratings yet
Data Mining Question Bank 3,4,5
7 pages
اطلاعاتی در مورد روشهای عددی در جبرخطی
No ratings yet
اطلاعاتی در مورد روشهای عددی در جبرخطی
5 pages
VFC 4
No ratings yet
VFC 4
3 pages
ss2 3rd Term Exam
No ratings yet
ss2 3rd Term Exam
4 pages
Data Science
No ratings yet
Data Science
10 pages
Data Science
No ratings yet
Data Science
14 pages
120 Interview Questions
No ratings yet
120 Interview Questions
19 pages
A Study On Speech Emotion Recognition Based On MFCC and KNN Models
No ratings yet
A Study On Speech Emotion Recognition Based On MFCC and KNN Models
4 pages
Organization of Data Using Graphs
No ratings yet
Organization of Data Using Graphs
1 page
Exam Preparation Notes
No ratings yet
Exam Preparation Notes
31 pages
SAS Python R Full Book
No ratings yet
SAS Python R Full Book
539 pages
Data Science Tool Box Important Viva Question
No ratings yet
Data Science Tool Box Important Viva Question
14 pages
Mohammad Jari Resume
No ratings yet
Mohammad Jari Resume
1 page
Capstone Project
No ratings yet
Capstone Project
6 pages
PG DataMiningR Practicals
No ratings yet
PG DataMiningR Practicals
2 pages
Dev - Ia-Ii - Key
No ratings yet
Dev - Ia-Ii - Key
32 pages
Data Analytics (2 Marks)
No ratings yet
Data Analytics (2 Marks)
2 pages

Interview Preparation Notes

Uploaded by

Interview Preparation Notes

Uploaded by

Interview Preparation Notes

Regression and Model Assumptions

1. What are the key assumptions of a linear regression model?

2. What is homoscedasticity, and how is it different from heteroscedasticity?

3. What is multicollinearity, and how can it affect model performance?

4. What is the difference between bias and variance?

5. What are overfitting and underfitting? How can they be avoided?

Model Evaluation & Metrics

1. What is R score and what does it indicate?

2. Why is adjusted R used, and how is it different from R?

Feature Engineering & Selection

1. What is feature engineering?

2. How do you select relevant features for a model?

4. Can VIF be applied to categorical variables?

5. What is SHAP and LIME? How do they help in model interpretation?

Time Series Forecasting

2. What is the difference between seasonality and cyclicity?

3. What is ARIMA? Explain its components (p, d, q).

5. How are ACF and PACF calculated and interpreted?

6. How is stationarity tested in time series data?

7. How do you handle missing values in time series data?

8. How are outliers treated in time series forecasting?

9. What is forecast moderation and disaggregation?

Project & Business Context Questions

1. Explain segmentation and its role in forecasting.

2. What is ABC classification, and how is it applied?

3. How do you handle outlier correction in your data pipeline?

4. What KPIs would you track for transaction success/failure?

5. What was the size of the dataset you worked with?

6. Explain your project in detail.

Sampling & Hypothesis Testing

1. What are different types of sampling techniques?

4. How do you generate a representative sample for model comparison?

A/B Testing & Experimentation

without accuracy metrics?

1. How to apply a discount to specific values in a dictionary?

3. What does np.zeros(2) return?

4. What happens if a Python function doesn't include a return statement?

5. How do break and continue work in loops?

6. What is the difference between lists and arrays?

7. What is list comprehension in Python?

8. What is left-skewed vs right-skewed data?

Python Coding Tasks

5. Calculate a 7-day rolling average of sales using rolling(window=7, min_periods=1).

SQL & Databases

1. What is the difference between WHERE and HAVING clauses in SQL?

2. What is the difference between ALTER and UPDATE statements?

Probability & Statistics

2. Why don't we normalize data before detecting outliers?

NLP & Deep Learning Concepts

1. What is a Variational Autoencoder (VAE)?

3. What is an agent in AI systems?

You might also like