Business Problem: In this project, a machine learning project is desired to be implemented for predicting the prices of houses of different types using a dataset that includes the features and prices of each house.
Dataset Story: This dataset consists of residential houses in Ames, Iowa and contains 79 explanatory variables. The project is part of a competition on Kaggle, and you can access the dataset and the competition page through the link below. Since the dataset is associated with a Kaggle competition, it includes two separate CSV files for training and testing. The test dataset has blank values for house prices, and your task is to predict these values.
Dataset Statistics:
- Total Observations: 38
- Numerical Variables: 43
- Categorical Variables: 43
Project Files:
- Dataset
- Prediction Model Code
- Training and Test Datasets
- Performance Evaluation Report
- Clone this project:
git clone https://github.com/YOUR_USERNAME/Feature-Engineering.git
- Navigate to the project directory:
cd Feature-Engineering
- Install the required dependencies:
pip install -r requirements.txt
- Run the project:
python main.py
- Add the dataset to the "data" folder.
- Run the project files.
- Perform data analysis and feature engineering steps.
- Develop a machine learning model to predict whether individuals have diabetes or not.
- Evaluate the model's performance and analyze the results.
- Fork this project.
- Create a new branch:
git checkout -b feature/NewFeature
- Make your changes and commit them:
git commit -am 'Added a new feature'
- Push your branch to the forked repository:
git push origin feature/NewFeature
- Create a pull request.
İş Problemi: Bu projede, her bir eve ait özelliklerin ve ev fiyatlarının bulunduğu bir veri seti kullanılarak, farklı tipteki evlerin fiyatlarına ilişkin bir makine öğrenmesi projesi gerçekleştirilmek istenmektedir.
Veri Seti Hikayesi: Ames, Iowa'daki konut evlerinden oluşan bu veri seti, toplamda 79 açıklayıcı değişkene sahiptir. Bu proje, Kaggle platformunda bir yarışmanın parçasıdır ve veri setine ve yarışma sayfasına aşağıdaki bağlantı üzerinden erişebilirsiniz. Veri seti, bir Kaggle yarışmasına ait olduğu için eğitim ve test veri setleri olarak iki ayrı CSV dosyası bulunmaktadır. Test veri setinde ev fiyatları boş bırakılmıştır ve bu değerleri tahmin etmeniz beklenmektedir.
Veri Seti İstatistikleri:
- Toplam Gözlem Sayısı: 38
- Sayısal Değişken Sayısı: 43
- Kategorik Değişken Sayısı: 43
Proje Dosyaları:
- Veri Seti
- Tahmin Modeli Kodları
- Eğitim ve Test Veri Setleri
- Performans Değerlendirme Raporu
- Bu projeyi klonlayın:
git clone https://github.com/YOUR_USERNAME/Feature-Engineering.git
- Proje dizinine gidin:
cd Feature-Engineering
- Gerekli bağımlılıkları yükleyin:
pip install -r requirements.txt
- Projeyi çalıştırın:
python main.py
- Veri setini "data" klasörüne ekleyin.
- Proje dosyalarını çalıştırın.
- Veri analizi ve özellik mühendisliği adımlarını gerçekleştirin.
- Makine öğrenmesi modeli geliştirerek, kişilerin diyabet hastası olup olmadığını tahmin edin.
- Modelin performansını değerlendirin ve sonuçları analiz edin.
- Bu projeyi fork edin.
- Yeni bir dal oluşturun:
git checkout -b feature/YeniOzellik
- Değişikliklerinizi yapın ve bunları kaydedin:
git commit -am 'Yeni bir özellik eklendi'
- Dalınızı forked repository'e gönderin:
git push origin feature/YeniOzellik
- Bir pull isteği oluşturun.