- Dataset: Dataset yang digunakan di dalam repository ini adalah dataset yang berasal dari sebuah website rental pakaian online bernama "Rent The Runway". Rent the Runway adalah layanan online yang menyediakan pakaian desainer dan penyewaan aksesoris. Awalnya merupakan murni perusahaan e-commerce, kemudian membuka lokasi ritel di New York City, Chicago, Washington, DC dan Las Vegas. Rent the Runway saat ini menawarkan lebih dari ribuan pakaian dan aksesoris dari lebih dari ratusan mitra desainer, termasuk Badgley Mischka, Vera Wang, Alexis Bittar, dan Calvin Klein.
-
Sumber Data : Kaggle Datasets
-
Purpose : Melakukan Customer Feedback Analysis, Menemukan Insight Yang Dapat Meningkatkan Layanan Perusahaan Terhadap Customer, Serta membangun salah satu solusi yang diajukan.
-
Machine Learning: Content Based Recommendation dan Collaborative Filtering.
Dalam repository ini, terdapat dokumentasi Notebook dan Folder Flask:
Sebelum diproses, data yang akan digunakan telah dimasukkan di dalam database MongoDB
Folder (
Flask-app
): Merupakan folder aplikasi Flask dengan main server bernama (app.py
)
Folder (
Notebook
): Berisi file notebook .ipynb yang memuat step by step proses olah dan analisa data.1. Transform data into numerical: Dokumentasi preprocessing data menjadi data yang dapat diolah secara numerik
2. Sentiment Labelling pada feedback review: Dokumentasi pelabelan sentiment dari data teks review customer. (review_text, review_summary)
3. Analisa Feedback: Dokumentasi analisa customer feedback secara umum berdasarkan Fit Feedback (fit
), Rating Feedback (rating
) dan, sentimen dari Review Feedback (review_text
,review_summary
) .
4. Analisa Feedback - Review Negatif: Dokumentasi eksplorasi feedback review customer. Pengerucutan terhadap sentiment negatif, serta proses inspeksi term yang sering muncul dalam kalimat negatif customer.
5. Analisa Feedback - Rating - user priority: Dokumentasi pengerucutan analisa feedback terhadap user yang paling banyak berdampak
6. Popular Items Recommendation: Dokumentasi rekomendasi item size clothing berdasarkan weighted rating dengan tingkat populer lebih dari sama dengan 0.90 dari persentil frekuensi sewa
7. Content Based Recommendation: Dokumentasi rekomendasi item size clothing berdasarkan data content serta data transaksi untuk content terkait.
8. CFF_KNN_SVDPP: Dokumentasi rekomendasi item size clothing menggunakan collaborative filtering berdasarkan interaksi antar user dalam merating item pakaian.
Data yang tersedia dalam sumber, berupa rekam data feedback transaksi pelanggan dari situs sewa pakaian online "Rent The Runway".
Data di atas berisi 3 macam data yaitu data customer, data produk, dan data feedback dari transaksi.
- Data Customer
user_id
: ID unik dari setiap customerbust_size
: Ukuran bra customerweight
: Berat badan customerheight
: Tinggi badan customerbody type
: Tipe bentuk badan customerage
: Usia customer
- Data Produk
item_id
: ID unik produksize
: Ukuran produkcategory
: Kategori produk
- Data Feedback Transaksi
review_date
: Tanggal Memberikan Reviewreview_text
: Teks ulasan customer terhadap transaksi terkaitreview_summary
: Ringkasan ulasan customer terhadap transaksi terkaitrating
: Feedback berupa angka rating untuk produk terkaitfit
: Feedback customer terhadap ukuran pakaian berupa "fit", "large", atau "small"rented for
: keperluan customer dalam menyewa
Dari overview data yang tersedia ini, muncul beberapa pertanyaan yang akan dijawab penggalian informasi dari data itu sendiri. Berikut beberapa pertanyaan yang dapat diajukan untuk data feedback ini.
Customer Feedback Analysis - sarana memahami sentimen, kebutuhan, dan keinginan customer, untuk membantu perusahaan tetap memberikan produk/layanan yang optimal.
Actionable insight dari hasil analisa feedback customer dapat mengarahkan kita untuk meningkatkan bisnis yang sedang berjalan.
3 sumber untuk mendapatkan actionable insights
- Survey NPS, atau survey lainnya
- Reviews
- Social Media
Ada 3 tipe actionable insight yang dapat diperoleh dari analisa feedback customer :
- Insight > Critical Thinking > Action
- Insight > Validation > Dont Require Action
- Insight > Rethink the Strategy
3 teknik dalam NLP yang paling banyak digunakan untuk Customer Feedback Analysis
- Brand Name Extraction
- Sentiment Identification - Categorize
- Keywords Extraction – Categorize & Finding Root Cause
2 tahap penting dalam feedback analysis adalah tahap categorization, dan Finding root cause. Karena 2 hal ini akan mengarahkan kita untuk memahami, dan merancang action yang solutif bagi perusahaan maupun customer. Salah satu rancangan action yang dibuat dalam projek ini adalah pembuatan "Recommendation System"
Berdasar data, feedback customer cukup baik. 97% memberikan review positif, 73% memberikan feedback “fit”, dan 92% memberikan rating 8-10.
Berdasarkan data, sebesar 51.7% transaksi mendapat feedback sempurna (angka ini tentu bukan angka yang cukup aman). Kemudian, 0.46% (92 transaksi) mendapat feedback sangat buruk. Sedangkan 47.8% sisanya terdiri dari bermacam-macam feedback.
Dari data review negatif customer, kita mendapatkan berbagai term menarik dan insightful. Kita melihat banyak term tentang kesesuaian ukuran pakaian dengan customer seperti
(size, fit, small, little, short, long dst).
Serta ada beberapa term yang merujuk kepada pakaian seperti (material, fabric, look, color, dst) yang mungkin pelanggan merasa tidak nyaman dengan item yang disewa.
Jika perusahaan ingin mengurangi return pakaian dari customer, perlu ditingkatkan/dipikirkan kembali strategi untuk memberikan customer ukuran pakaian yang sesuai.
Sistem rekomendasi item beserta ukuran, dapat membantu perusahaan untuk meningkatkan pelayanan terhadap customer dalam hal pemilihan item pakaian dan ukuran yang tepat dengan keinginan customer.
Secara umum, rekomendasi terbagi ke dalam 2 jenis, yaitu Content Based Filtering dan Collaborative Filtering
. Kedua model ini dicoba untuk membuat sistem rekomendasi di dalam projek ini.
Sistem akan merekomendasikan pakaian beserta ukurannya berdasarkan beberapa informasi metadata. Metadata yang digunakan merupakan metadata yang dekat dengan informasi penyewaan sebelumnya. Seperti rerata feedback rating, skor weighted rating, keperluan sewa,rerata tinggi penyewa, rerata berat badan penyewa, rerata usia penyewa, serta nilai fit.
Ide dasar sistem ini adalah memanfaatkan data item pakaian yang telah menyimpan track record untuk mendekati kebutuhan dari customer. Sistem akan merekomendasikan item-item yang sangat dekat dengan preferensi yang diperlukan oleh customer.
Cosine Similarity Formula
Algoritma Collaborative Filtering terdiri atas 2 tipe. Tipe user (user based), serta tipe item (item based). User-based collaborative filtering menggunakan pola antar user yang mirip (similar) untuk merekomendasikan beberapa produk (jika user A suka produk X, maka user lain yang mirip user A kemungkinan juga suka produk X).
Sedangkan, item-based collaborative filtering lebih fokus kepada item produknya. Contohnya, jika produk X dipilih, biasanya produk Y juga dipilih. Maka jika ada user yang memilih produk X, maka akan direkomendasikan produk Y.
Berikut ini adalah preview App yang dibuat menggunakan Flask untuk menampilkan:
- Input Preferensi User Awal
- Hasil Daftar Rekomendasi Berdasarkan Preferensi
- Hasil Daftar Rekomendasi Berdasarkan Item Rekomendasi
Tampilan awal (http://127.0.0.1:5001/
) menampilkan formulir untuk input preferensi kebutuhan user awal.
Tampilan awal (http://127.0.0.1:5001/senddata
) menampilkan hasil daftar rekomendasi yang tersedia. Terdapat tombol "cari yang mirip ini", merupakan tombol ganti preferensi berdasarkan item terkait.
Juga terdapat tombol "kembali input data", untuk kembali kepada input preferensi user.
Note: Untuk diskusi lebih lanjut apabila ada pertanyaan, kritik, dan saran, berikut kontak email saya : nadia.ningtias20@gmail.com. Terima kasih.