clep-resources: A repository from CLEP

Datasets

Datasets currently used in this repo
Number	Dataset	Samples	Controls
#1	ADNI	484	260
Data Availability

Due to the restriction on the access to the ADNI data, we are not at the liberty to share the data. If an individual wishes to replicate the results, they could apply for access the ADNI data at their access portal.
Repository Structure

The repo contains a main folder (Datasets) containing 3 experiments that were carried out using CLEP framework for each dataset.
The data and results for each experiment is available in their respective folders, within each dataset's folder,
Benchmark - Benchmarking experiment to check the performance of CLEP in contrast with the raw data (including robustness analysis),
Kge_Model - Experiment to check the effect of KGE model on the classification, and
Threshold - Experiment to check the effect of threshold applied during the incorporation of patients in the KG.
Each experiment folder contains a data and results folder.
The tree structure looks like as given below,
Datasets/
└── ADNI
    ├── kge_model
    │   ├── data
    │   │   └── ppi-kg.edgelist
    │   └── results
    │       ├── ComplEx
    │       │   ├── config.json
    │       │   ├── cross_validation_results.json
    │       │   ├── embedding.tsv
    │       │   ├── pykeen_results_final
    │       │   │   ├── metadata.json
    │       │   │   └── results.json
    │       │   ├── pykeen_results_optim
    │       │   │   ├── best_pipeline
    │       │   │   │   └── pipeline_config.json
    │       │   │   ├── study.json
    │       │   │   └── trials.tsv
    │       │   ├── test.edgelist
    │       │   ├── train.edgelist
    │       │   └── validation.edgelist
    │       ├── HolE
    │       │   ├── config.json
    │       │   ├── cross_validation_results.json
    │       │   ├── embedding.tsv
    │       │   ├── pykeen_results_final
    │       │   │   ├── metadata.json
    │       │   │   └── results.json
    │       │   ├── pykeen_results_optim
    │       │   │   ├── best_pipeline
    │       │   │   │   └── pipeline_config.json
    │       │   │   ├── study.json
    │       │   │   └── trials.tsv
    │       │   ├── test.edgelist
    │       │   ├── train.edgelist
    │       │   └── validation.edgelist
    │       ├── RotatE
    │       │   ├── config.json
    │       │   ├── cross_validation_results.json
    │       │   ├── embedding.tsv
    │       │   ├── pykeen_results_final
    │       │   │   ├── metadata.json
    │       │   │   └── results.json
    │       │   ├── pykeen_results_optim
    │       │   │   ├── best_pipeline
    │       │   │   │   └── pipeline_config.json
    │       │   │   ├── study.json
    │       │   │   └── trials.tsv
    │       │   ├── test.edgelist
    │       │   ├── train.edgelist
    │       │   └── validation.edgelist
    │       ├── TransE
    │       │   ├── config.json
    │       │   ├── cross_validation_results.json
    │       │   ├── embedding.tsv
    │       │   ├── pykeen_results_final
    │       │   │   ├── metadata.json
    │       │   │   └── results.json
    │       │   ├── pykeen_results_optim
    │       │   │   ├── best_pipeline
    │       │   │   │   └── pipeline_config.json
    │       │   │   ├── study.json
    │       │   │   └── trials.tsv
    │       │   ├── test.edgelist
    │       │   ├── train.edgelist
    │       │   ├── validation.edgelist
    │       │   └── weighted.edgelist
    │       ├── network_summary.tsv
    │       ├── radical_summary.tsv
    │       ├── sample_scoring.tsv
    │       └── weighted.edgelist
    ├── benchmarking
    │   ├── data
    │   │   └── embedding.tsv
    │   └── results
    │       ├── emb
    │       │   ├── elastic_net
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   ├── gradient_boost
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   ├── logistic_regression
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   ├── random_forest
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   └── svm
    │       │       └── grid_search
    │       │           └── cross_validation_results.json
    │       ├── perm
    │       │   ├── elastic_net
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   ├── gradient_boost
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   ├── logistic_regression
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   ├── random_forest
    │       │   │   └── grid_search
    │       │   │       └── cross_validation_results.json
    │       │   └── svm
    │       │       └── grid_search
    │       │           └── cross_validation_results.json
    │       └── raw
    │           ├── elastic_net
    │           │   └── grid_search
    │           │       └── cross_validation_results.json
    │           ├── gradient_boost
    │           │   └── grid_search
    │           │       └── cross_validation_results.json
    │           ├── logistic_regression
    │           │   └── grid_search
    │           │       └── cross_validation_results.json
    │           ├── random_forest
    │           │   └── grid_search
    │           │       └── cross_validation_results.json
    │           └── svm
    │               └── grid_search
    │                   └── cross_validation_results.json
    └── threshold
        ├── data
        │   └── ppi-kg.edgelist
        └── results
            ├── 1
            │   ├── RotatE
            │   │   ├── cross_validation_results.json
            │   │   ├── embedding.tsv
            │   │   ├── pykeen_results_final
            │   │   │   ├── metadata.json
            │   │   │   └── results.json
            │   │   ├── pykeen_results_optim
            │   │   │   ├── best_pipeline
            │   │   │   │   └── pipeline_config.json
            │   │   │   ├── study.json
            │   │   │   └── trials.tsv
            │   │   ├── test.edgelist
            │   │   ├── train.edgelist
            │   │   └── validation.edgelist
            │   ├── cross_validation_results.json
            │   ├── embedding.tsv
            │   ├── network_summary.tsv
            │   ├── pykeen_results_final
            │   │   ├── metadata.json
            │   │   └── results.json
            │   ├── pykeen_results_optim
            │   │   ├── best_pipeline
            │   │   │   └── pipeline_config.json
            │   │   ├── study.json
            │   │   └── trials.tsv
            │   ├── radical_summary.tsv
            │   ├── sample_scoring.tsv
            │   ├── test.edgelist
            │   ├── train.edgelist
            │   ├── validation.edgelist
            │   └── weighted.edgelist
            ├── 1.5
            │   ├── RotatE
            │   │   ├── cross_validation_results.json
            │   │   ├── embedding.tsv
            │   │   ├── pykeen_results_final
            │   │   │   ├── metadata.json
            │   │   │   └── results.json
            │   │   ├── pykeen_results_optim
            │   │   │   ├── best_pipeline
            │   │   │   │   └── pipeline_config.json
            │   │   │   ├── study.json
            │   │   │   └── trials.tsv
            │   │   ├── test.edgelist
            │   │   ├── train.edgelist
            │   │   └── validation.edgelist
            │   ├── cross_validation_results.json
            │   ├── embedding.tsv
            │   ├── network_summary.tsv
            │   ├── pykeen_results_final
            │   │   ├── metadata.json
            │   │   └── results.json
            │   ├── pykeen_results_optim
            │   │   ├── best_pipeline
            │   │   │   └── pipeline_config.json
            │   │   ├── study.json
            │   │   └── trials.tsv
            │   ├── radical_summary.tsv
            │   ├── sample_scoring.tsv
            │   ├── test.edgelist
            │   ├── train.edgelist
            │   ├── validation.edgelist
            │   └── weighted.edgelist
            ├── 10
            │   ├── RotatE
            │   │   ├── cross_validation_results.json
            │   │   ├── embedding.tsv
            │   │   ├── pykeen_results_final
            │   │   │   ├── metadata.json
            │   │   │   └── results.json
            │   │   ├── pykeen_results_optim
            │   │   │   ├── best_pipeline
            │   │   │   │   └── pipeline_config.json
            │   │   │   ├── study.json
            │   │   │   └── trials.tsv
            │   │   ├── test.edgelist
            │   │   ├── train.edgelist
            │   │   └── validation.edgelist
            │   ├── embedding.tsv
            │   ├── network_summary.tsv
            │   ├── pykeen_results_final
            │   │   ├── metadata.json
            │   │   └── results.json
            │   ├── pykeen_results_optim
            │   │   ├── best_pipeline
            │   │   │   └── pipeline_config.json
            │   │   ├── study.json
            │   │   └── trials.tsv
            │   ├── radical_summary.tsv
            │   ├── sample_scoring.tsv
            │   ├── test.edgelist
            │   ├── train.edgelist
            │   ├── validation.edgelist
            │   └── weighted.edgelist
            ├── 2.5
            │   ├── RotatE
            │   │   ├── cross_validation_results.json
            │   │   ├── embedding.tsv
            │   │   ├── pykeen_results_final
            │   │   │   ├── metadata.json
            │   │   │   └── results.json
            │   │   ├── pykeen_results_optim
            │   │   │   ├── best_pipeline
            │   │   │   │   └── pipeline_config.json
            │   │   │   ├── study.json
            │   │   │   └── trials.tsv
            │   │   ├── test.edgelist
            │   │   ├── train.edgelist
            │   │   └── validation.edgelist
            │   ├── TransE
            │   │   ├── cross_validation_results.json
            │   │   ├── embedding.tsv
            │   │   ├── pykeen_results_final
            │   │   │   ├── metadata.json
            │   │   │   └── results.json
            │   │   ├── pykeen_results_optim
            │   │   │   ├── best_pipeline
            │   │   │   │   └── pipeline_config.json
            │   │   │   ├── study.json
            │   │   │   └── trials.tsv
            │   │   ├── test.edgelist
            │   │   ├── train.edgelist
            │   │   └── validation.edgelist
            │   ├── cross_validation_results.json
            │   ├── embedding.tsv
            │   ├── multi_res
            │   │   ├── elastic_net
            │   │   │   └── grid_search
            │   │   │       └── cross_validation_results.json
            │   │   ├── gradient_boost
            │   │   │   └── grid_search
            │   │   │       └── cross_validation_results.json
            │   │   ├── logistic_regression
            │   │   │   └── grid_search
            │   │   │       └── cross_validation_results.json
            │   │   ├── random_forest
            │   │   │   └── grid_search
            │   │   │       └── cross_validation_results.json
            │   │   └── svm
            │   │       └── grid_search
            │   │           └── cross_validation_results.json
            │   ├── network_summary.tsv
            │   ├── pykeen_results_final
            │   │   ├── metadata.json
            │   │   └── results.json
            │   ├── pykeen_results_optim
            │   │   ├── best_pipeline
            │   │   │   └── pipeline_config.json
            │   │   ├── study.json
            │   │   └── trials.tsv
            │   ├── radical_summary.tsv
            │   ├── sample_scoring.tsv
            │   ├── test
            │   │   ├── diff.txt
            │   │   ├── patient_connection_summary.tsv
            │   │   └── weighted.edgelist
            │   ├── test.edgelist
            │   ├── train.edgelist
            │   ├── validation.edgelist
            │   └── weighted.edgelist
            ├── 20
            │   ├── RotatE
            │   │   ├── cross_validation_results.json
            │   │   ├── embedding.tsv
            │   │   ├── pykeen_results_final
            │   │   │   ├── metadata.json
            │   │   │   └── results.json
            │   │   ├── pykeen_results_optim
            │   │   │   ├── best_pipeline
            │   │   │   │   └── pipeline_config.json
            │   │   │   ├── study.json
            │   │   │   └── trials.tsv
            │   │   ├── test.edgelist
            │   │   ├── train.edgelist
            │   │   └── validation.edgelist
            │   ├── embedding.tsv
            │   ├── network_summary.tsv
            │   ├── pykeen_results_final
            │   │   ├── metadata.json
            │   │   └── results.json
            │   ├── pykeen_results_optim
            │   │   ├── best_pipeline
            │   │   │   └── pipeline_config.json
            │   │   ├── study.json
            │   │   └── trials.tsv
            │   ├── radical_summary.tsv
            │   ├── sample_scoring.tsv
            │   ├── test.edgelist
            │   ├── train.edgelist
            │   ├── validation.edgelist
            │   └── weighted.edgelist
            └── 5
                ├── RotatE
                │   ├── cross_validation_results.json
                │   ├── embedding.tsv
                │   ├── pykeen_results_final
                │   │   ├── metadata.json
                │   │   └── results.json
                │   ├── pykeen_results_optim
                │   │   ├── best_pipeline
                │   │   │   └── pipeline_config.json
                │   │   ├── study.json
                │   │   └── trials.tsv
                │   ├── test.edgelist
                │   ├── train.edgelist
                │   └── validation.edgelist
                ├── cross_validation_results.json
                ├── embedding.tsv
                ├── network_summary.tsv
                ├── pykeen_results_final
                │   ├── metadata.json
                │   └── results.json
                ├── pykeen_results_optim
                │   ├── best_pipeline
                │   │   └── pipeline_config.json
                │   ├── study.json
                │   └── trials.tsv
                ├── radical_summary.tsv
                ├── sample_scoring.tsv
                ├── test.edgelist
                ├── train.edgelist
                ├── validation.edgelist
                └── weighted.edgelist
hybrid-kg/clep-resources

Datasets

Data Availability

Repository Structure