/data-cleaning

数据清洗系统;hadoop;实体识别;冲突消解;不一致修复;缺失值填充

Primary LanguageJava

data-cleaning

关键字: 数据清洗系统;hadoop;并行大数据清洗 此项目为863计划信息技术领域主题项目“开放环境下海量Web数据提取、集成、分析和管理系统平台与应用",项目结题之后,应项目组要求进行开源。 系统包括:实体识别、冲突消解、不一致修复、缺失值填充等四个主要子系统。