/tony-bigdata-suites

tools for connection hbase and CRUD

Primary LanguageJava

设计思路:
订单脱敏数据定时发送到spark写文件
在数据迁移过程中,将订单数据传送到hadoop存储
存储到hadoop中的数据,通过map/reduce处理后放入hive
spark读取hive数据,并将数据统计,根据算法重新计算出用户的特征向量(0,1,1,1,1,1)
根据特征向量给用户分组,通过机器学习,分析用户的购买行为
用户平台根据向量算法,对elasticsearch数据评分,向用户主动推荐商品及推送广告
每天凌晨将数据写入到,这也是为什么商品有个审核期的原因,其实审核是一方面,另一方面规避了实时的很多问题
elastic-search存储商品数据
人工智能鉴别人脸识别,完成支付
人工智能根据数据自动判断是否有风险数据
对图像进行识别,并将识别结果,进行数据分析