ii-research-yu/large-scale-csk-extraction

Code repository for paper "Refined Commonsense Knowledge from Large-Scale Web Contents"

PythonApache-2.0

Refined Commonsense Knowledge from Large-Scale Web Contents

The pipeline is executed in the following order:

nlp_pipeline.pipeline
open_ie.open_ie
triple_filtering.filter
triple_grouping.group_per_c4_part, triple_grouping.group_all, triple_grouping.get_frequent_triples
triple_clustering.precompute_embeddings, triple_clustering.clustering
conceptnet_mapping.inference
ranking
final_filtering.final_filtering

Global configurations can be found in app_config.py.