0% found this document useful (0 votes)

21 views5 pages

Google Collab

Belajar Pyrhon with google collab

Uploaded by

Muhammad Hasan Wahyudi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views5 pages

Google Collab

Belajar Pyrhon with google collab

Uploaded by

Muhammad Hasan Wahyudi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

### 1.

Membuka Google Colab

- Buka Google Colab di browser Anda.

- Klik tombol New Notebook untuk membuat notebook baru.

### 2. Instalasi Paket yang Diperlukan

Di sel pertama, instal paket yang diperlukan dengan menjalankan perintah berikut:

```python

!pip install scrapy

!pip install pandas

!pip install scikit-learn

!pip install nltk

```

### 3. Scraping Data dari Shopee

Di sel kedua, tambahkan kode untuk scraping data dari Shopee:

```python

import scrapy

from scrapy.crawler import CrawlerProcess

import pandas as pd

class ShopeeLaptopSpider(scrapy.Spider):

name = "shopee_laptops"

start_urls = ['https://shopee.co.id/search?keyword=laptop']
def parse(self, response):

for product in response.css('div.shopee-search-item-result__item'):

yield {

'name': product.css('div._1NoI8_::text').get(),

'price': product.css('span._341bF0::text').get(),

'rating': product.css('div._3Oj5_n span::text').get(),

'reviews': product.css('div._3Oj5_n::text').get(),

process = CrawlerProcess(settings={

'FEED_FORMAT': 'csv',

'FEED_URI': 'shopee_laptops.csv',

})

process.crawl(ShopeeLaptopSpider)

process.start()

```

Jalankan sel ini untuk memulai proses scraping dan menyimpan data ke file `shopee_laptops.csv`.

### 4. Membaca Data dan Melakukan Preprocessing

Di sel ketiga, tambahkan kode untuk membaca dan melakukan preprocessing data:

```python

import re

from nltk.corpus import stopwords

from nltk.stem import PorterStemmer

from sklearn.preprocessing import MinMaxScaler

from scipy import stats

# Membaca data

df = pd.read_csv('shopee_laptops.csv')

df.dropna(inplace=True)

# Preprocessing harga

df['price'] = df['price'].str.replace('Rp', '').str.replace('.', '').astype(int)

# Preprocessing rating

df['rating'] = df['rating'].astype(float)

# Preprocessing ulasan

df['reviews'] = df['reviews'].str.replace(' ulasan', '').astype(int)

# Mengisi nilai kosong

df['name'].fillna('Unknown', inplace=True)

# Normalisasi harga

scaler = MinMaxScaler()

df['price'] = scaler.fit_transform(df[['price']])

# Menghapus outlier
df = df[(np.abs(stats.zscore(df['price'])) < 3)]

# Preprocessing teks

stop = stopwords.words('english')

stemmer = PorterStemmer()

df['name'] = df['name'].apply(lambda x: re.sub('[^a-zA-Z]', ' ', x))

df['name'] = df['name'].str.lower()

df['name'] = df['name'].apply(lambda x: ' '.join([word for word in x.split() if word not in stop]))

df['name'] = df['name'].apply(lambda x: ' '.join([stemmer.stem(word) for word in x.split()]))

# Feature engineering

df['price_per_review'] = df['price'] / (df['reviews'] + 1)

```

Jalankan sel ini untuk melakukan preprocessing data.

### 5. Membuat Model Naive Bayes

Di sel keempat, tambahkan kode untuk membuat dan melatih model Naive Bayes:

```python

from sklearn.model_selection import train_test_split

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.naive_bayes import MultinomialNB

from sklearn.metrics import accuracy_score

X = df['name']
y = df['rating']

vectorizer = CountVectorizer()

X = vectorizer.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = MultinomialNB()

model.fit(X_train, y_train)

y_pred = model.predict(X_test)

print(f'Accuracy: {accuracy_score(y_test, y_pred)}')

```

Jalankan sel ini untuk membuat model, melatihnya, dan mengevaluasi akurasinya.

Dengan mengikuti langkah-langkah di atas, Anda dapat mengimplementasikan kode untuk scraping data
dari Shopee dan membuat model rekomendasi laptop menggunakan metode Naive Bayes di Google
Colab. Jika ada pertanyaan lebih lanjut atau butuh bantuan tambahan, jangan ragu untuk bertanya! 😊

Walmart Factory List
100% (2)
Walmart Factory List
5 pages
Force FX-8CS Service Manual - en
83% (6)
Force FX-8CS Service Manual - en
282 pages
Distance Learning Courses DLEN
No ratings yet
Distance Learning Courses DLEN
35 pages
Teaching Vocabulary To Advanced Students
100% (1)
Teaching Vocabulary To Advanced Students
26 pages
Web Scraping Assignment Ebay
No ratings yet
Web Scraping Assignment Ebay
6 pages
B - 2 CIE Web Scraping
No ratings yet
B - 2 CIE Web Scraping
8 pages
Web Scrapping Project Phase 4 1679950739
No ratings yet
Web Scrapping Project Phase 4 1679950739
12 pages
Step 2
No ratings yet
Step 2
2 pages
Dropdownlistscraping
No ratings yet
Dropdownlistscraping
7 pages
6
No ratings yet
6
3 pages
3.1 Reselling - Code
No ratings yet
3.1 Reselling - Code
2 pages
Demo
No ratings yet
Demo
2 pages
Pagination and Into 2 Tables
No ratings yet
Pagination and Into 2 Tables
3 pages
Rate Analogy
No ratings yet
Rate Analogy
9 pages
Act 115 1
No ratings yet
Act 115 1
22 pages
Main 115
No ratings yet
Main 115
22 pages
Vnprod
No ratings yet
Vnprod
33 pages
Tugas Project 02 Perancangan Eksperimen Dan Analisa Data SEMESTER GANJIL 2024/2025
No ratings yet
Tugas Project 02 Perancangan Eksperimen Dan Analisa Data SEMESTER GANJIL 2024/2025
19 pages
Lab 2 - Data Preparation
No ratings yet
Lab 2 - Data Preparation
3 pages
Step 3
No ratings yet
Step 3
2 pages
Beginner Guide To Web Scraping of Data
No ratings yet
Beginner Guide To Web Scraping of Data
14 pages
Carbrand: Name Description Brand Images Brand Logo Carmodel: Name Description Variants Body Type Model Images Year Carvariant: All The Specs Prix
No ratings yet
Carbrand: Name Description Brand Images Brand Logo Carmodel: Name Description Variants Body Type Model Images Year Carvariant: All The Specs Prix
5 pages
Pembersihan Data Script
No ratings yet
Pembersihan Data Script
2 pages
Final 057
No ratings yet
Final 057
8 pages
ML
No ratings yet
ML
10 pages
Web Scraping
No ratings yet
Web Scraping
11 pages
Emag Scraper
No ratings yet
Emag Scraper
1 page
Extract Google Play Reviews with Selenium
No ratings yet
Extract Google Play Reviews with Selenium
2 pages
IP Class 12 Worksheet-02
No ratings yet
IP Class 12 Worksheet-02
3 pages
Mobstore
No ratings yet
Mobstore
5 pages
UI21CS29 Lab2
No ratings yet
UI21CS29 Lab2
11 pages
Python Scrapping Task
No ratings yet
Python Scrapping Task
2 pages
Web Scrapping
No ratings yet
Web Scrapping
9 pages
AIML Manual Lab-For Students
No ratings yet
AIML Manual Lab-For Students
45 pages
Walmart 2
No ratings yet
Walmart 2
2 pages
87 1
No ratings yet
87 1
10 pages
IP Project File
No ratings yet
IP Project File
25 pages
2 - 11 - To Extract Data
No ratings yet
2 - 11 - To Extract Data
1 page
Pickles Script Untested With Instructions
No ratings yet
Pickles Script Untested With Instructions
14 pages
Directory Structure
No ratings yet
Directory Structure
10 pages
111 Final
No ratings yet
111 Final
12 pages
CODING & OUTPUT Bike Data Analysis
No ratings yet
CODING & OUTPUT Bike Data Analysis
25 pages
Import Pandas As PD
No ratings yet
Import Pandas As PD
7 pages
Sesi 3 - LSP - Kel. 13.9
No ratings yet
Sesi 3 - LSP - Kel. 13.9
32 pages
Ads Lab Manual
No ratings yet
Ads Lab Manual
63 pages
Performance Task
No ratings yet
Performance Task
5 pages
Web Scraping
No ratings yet
Web Scraping
2 pages
How To Scrape Product Data From Amazon - A Complete Guide - Oxylabs
No ratings yet
How To Scrape Product Data From Amazon - A Complete Guide - Oxylabs
19 pages
Real Estate Scraper
No ratings yet
Real Estate Scraper
23 pages
Populate SQLite Database
No ratings yet
Populate SQLite Database
3 pages
Main Code
No ratings yet
Main Code
10 pages
PRJCT Report
No ratings yet
PRJCT Report
22 pages
Aa
No ratings yet
Aa
4 pages
Electricity Price Forecasting Project Code
No ratings yet
Electricity Price Forecasting Project Code
5 pages
Zahra Ratu Audia - (17821107) - Praktikum 6
100% (2)
Zahra Ratu Audia - (17821107) - Praktikum 6
10 pages
Laptop Price Analysis
No ratings yet
Laptop Price Analysis
37 pages
84 Store
No ratings yet
84 Store
7 pages
Outputs and Code
No ratings yet
Outputs and Code
14 pages
GoAnywhere System Architecture Guide
No ratings yet
GoAnywhere System Architecture Guide
29 pages
FUN Transmissions: by Bill Brayton
No ratings yet
FUN Transmissions: by Bill Brayton
4 pages
Blog Hubspot Com Marketing Team Structure Diagrams
No ratings yet
Blog Hubspot Com Marketing Team Structure Diagrams
13 pages
SanyaMidha FullStackWebDeveloper Resume
100% (1)
SanyaMidha FullStackWebDeveloper Resume
1 page
IV Cannula
No ratings yet
IV Cannula
17 pages
Relational DB Design Lab Guide
No ratings yet
Relational DB Design Lab Guide
2 pages
Response of Framed Buildings To Excavation-Induced Movements
No ratings yet
Response of Framed Buildings To Excavation-Induced Movements
19 pages
Circles The Final Steps (MCQ'S) Ws
No ratings yet
Circles The Final Steps (MCQ'S) Ws
9 pages
Class 12 Physics Electricity Experiment
No ratings yet
Class 12 Physics Electricity Experiment
18 pages
Os Lec 4 Process
No ratings yet
Os Lec 4 Process
7 pages
Anticipation Guide-Phonics and Word Recognition
No ratings yet
Anticipation Guide-Phonics and Word Recognition
5 pages
Comprehensive Guide to GA Crossover Techniques
No ratings yet
Comprehensive Guide to GA Crossover Techniques
65 pages
Daily Lesson Log of M8Al-Ib-2 (Week 2 Day 3) : Can The Difference of Two Squares Be Applicable To 3 - 12 If No, Why?
No ratings yet
Daily Lesson Log of M8Al-Ib-2 (Week 2 Day 3) : Can The Difference of Two Squares Be Applicable To 3 - 12 If No, Why?
4 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
86 pages
MobiSTOP Ultima 02242 R8 EN PDF
No ratings yet
MobiSTOP Ultima 02242 R8 EN PDF
1 page
Configure Eap Tls Authentication With Is
No ratings yet
Configure Eap Tls Authentication With Is
20 pages
Worksheet - Chapter 11 - Biotechnology - Principles and Processes
No ratings yet
Worksheet - Chapter 11 - Biotechnology - Principles and Processes
3 pages
NTA IGNOU PHD Entrance Exam Syllabus
No ratings yet
NTA IGNOU PHD Entrance Exam Syllabus
85 pages
Boarding Pass: Name Booking Code Ticket No
No ratings yet
Boarding Pass: Name Booking Code Ticket No
1 page
STID1103 SYLLABUS A211 Student
No ratings yet
STID1103 SYLLABUS A211 Student
5 pages
MCB Types
No ratings yet
MCB Types
3 pages
STANDARD OPERATING PROCEDURES Masjid CFS
50% (2)
STANDARD OPERATING PROCEDURES Masjid CFS
2 pages
Pottery Basics
No ratings yet
Pottery Basics
29 pages
Istqb Advanced Level Test Manager Syllabus v5
No ratings yet
Istqb Advanced Level Test Manager Syllabus v5
126 pages
Adcps: Question Paper Cum Answer Sheet
No ratings yet
Adcps: Question Paper Cum Answer Sheet
5 pages
Concrete Prestressing Guide
No ratings yet
Concrete Prestressing Guide
23 pages

Google Collab

Uploaded by

Google Collab

Uploaded by

### 1.

Membuka Google Colab

- Buka Google Colab di browser Anda.

- Klik tombol **New Notebook** untuk membuat notebook baru.

### 2. Instalasi Paket yang Diperlukan

!pip install scrapy

!pip install pandas

!pip install scikit-learn

!pip install nltk

### 3. Scraping Data dari Shopee

Di sel kedua, tambahkan kode untuk scraping data dari Shopee:

from scrapy.crawler import CrawlerProcess

for product in response.css('div.shopee-search-item-result__item'):

'rating': product.css('div._3Oj5_n span::text').get(),

### 4. Membaca Data dan Melakukan Preprocessing

from nltk.corpus import stopwords

from sklearn.preprocessing import MinMaxScaler

from scipy import stats

df['price'] = df['price'].str.replace('Rp', '').str.replace('.', '').astype(int)

df['reviews'] = df['reviews'].str.replace(' ulasan', '').astype(int)

# Mengisi nilai kosong

df['name'] = df['name'].apply(lambda x: re.sub('[^a-zA-Z]', ' ', x))

df['name'] = df['name'].apply(lambda x: ' '.join([stemmer.stem(word) for word in x.split()]))

df['price_per_review'] = df['price'] / (df['reviews'] + 1)

Jalankan sel ini untuk melakukan preprocessing data.

### 5. Membuat Model Naive Bayes

from sklearn.model_selection import train_test_split

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.naive_bayes import MultinomialNB

from sklearn.metrics import accuracy_score

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f'Accuracy: {accuracy_score(y_test, y_pred)}')

You might also like

- Klik tombol New Notebook untuk membuat notebook baru.