917lulu's Stars
jarlor/TravelWebsite_BigDataAnalysis
旅游网站(携程网部分数据)大数据分析-hadoop课程设计(本科课设级别)
ZainZhao/HIS
HIS英文全称 hospital information system(医疗信息就诊系统),系统主要功能按照数据流量、流向及处理过程分为临床诊疗、药品管理、财务管理、患者管理。诊疗活动由各工作站配合完成,并将临床信息进行整理、处理、汇总、统计、分析等。本系统包括以下工作站:门诊医生工作站、药房医生工作站、医技医生工作站、收费员工作站、对帐员工作站、管理员工作站。需求为东软提供的云医院。
yikuangcloud/1kuang_datas
亿矿云大数据处理框架:借助Hadoop、Spark、Storm等分布式处理架构,满足海量数据的批处理和流处理计算需求。 亿矿云大数据预处理:运用数据冗余剔除、异常检测、归一化等方法对原始数据进行清洗,为后续存储、管理与分析提高质量数据来源。 亿矿云大数据存储与管理:通过分布式文件系统、NoSQL数据库、关系数据库、时序数据库等不同的数据管理引擎实现海量工业数据的分区选择、存储、编目与索引等。
LiChaoyan/ShGj
1.本项目利用Hadoop处理高校无线定位大数据,有效地将位置信息应用于学生时空行为模式挖掘,建立基于精准位置信息的行为数据挖掘计算模型。 2.基于Hadoop计算平台,并实现对大数据进行可视化分析的Web系统。 3.利用一些合适的算法实现校园热点区域提取、学生异常轨迹探测、人流迁徙分析及学生时空行为相似性分析推测等功能。 4.基于学校地图API和echarts插件可视化展现。
WeBankBlockchain/Data-Stash
Data-Stash是基于FISCO-BCOS的数据仓库组件,通过解析节点的binlog日志,生成该节点状态的全量备份,从而使节点能够实现冷热数据分离和数据裁剪。
xiaoxiangai/analysis
小象数据完整产品包括用户行为分析、用户画像、智慧运营,通过采集用户行为数据和第三方数据进行实时处理和分析,实时获取用户操作、产品体验和运营活动的数据反馈。兼容神策SDK,完整产品包括用户行为分析、用户画像、智慧运营,通过采集用户行为数据和第三方数据进行实时处理和分析,实时获取用户操作、产品体验和运营活动的数据反馈。采用flume进行数据采集,采用flink+clickhouse构建PB级别的海量结构化数据存储和实时分析。
wang-xue-qiang/bigdata-analysis
大数据收集,实时分析,离线分析经典案例
yxq9650/CarParking
运用SSM写的停车场管理系统,加入了车牌识别和数据分析
Tencent/SessionAnalytics
SessionAnalytics-用户路径数据分析挖掘框架
apachecn/ailearning
AiLearning:数据分析+机器学习实战+线性代数+PyTorch+NLTK+TF2
water8394/flink-recommandSystem-demo
:helicopter::rocket:基于Flink实现的商品实时推荐系统。flink统计商品热度,放入redis缓存,分析日志信息,将画像标签和实时记录放入Hbase。在用户发起推荐请求后,根据用户画像重排序热度榜,并结合协同过滤和标签两个推荐模块为新生成的榜单的每一个产品添加关联产品,最后返回新的用户列表。
GrowingGit/GitHub-Chinese-Top-Charts
:cn: GitHub中文排行榜,各语言分设「软件 | 资料」榜单,精准定位中文好项目。各取所需,高效学习。
oxnr/awesome-bigdata
A curated list of awesome big data frameworks, ressources and other awesomeness.
party123/AiQiYi
SparkStreaming大数据实战——实时统计爱奇艺不同栏目点击量
collabH/bigdata-growth
大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。
iGaoWei/BigDataView
100+套大数据可视化炫酷大屏Html5模板;包含行业:社区、物业、政务、交通、金融银行等,全网最新、最多,最全、最酷、最炫大数据可视化模板。陆续更新中
geekyouth/SZT-bigdata
深圳地铁大数据客流分析系统🚇🚄🌟
hansonwang99/JavaCollection
Java开源项目之「自学编程之路」:学习指南+面试指南+资源分享+技术文章
heibaiying/BigData-Notes
大数据入门指南 :star:
yuwenhou/TelecomPro
大数据开发实战项目-电信项目
godelgnisEJW/real-time-monitoring-system
本项目主要用于搭建一个基于docker的实时监控系统,涉及的大数据相关组件有Filebeat,Kafka,Zookeeper,Flink,后端主要使用了SpringBoot进行开发,数据库使用了Redis做缓存,前端用了Vue框架,通过Ant Design组件库和Echarts进行开发
lwhappy/chitu-sdp
赤兔实时计算平台是基于 Apache Flink 构建的企业级、一站式、高性能、低门槛实时大数据实时计算平台,广泛适用于流式数据应用开发场景。
HuQi2018/BiSheServer
本系统是我的毕业设计项目,题目为“基于用户画像的电影推荐系统的设计与实现”。主要是以Django作为基础框架,采用MTV模式,数据库使用MongoDB、MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签,并使用Hadoop、Spark大数据组件进行分析和处理的推荐系统。管理系统使用的是Django自带的管理系统,并使用simpleui进行了美化。
young-pastor/Young-Board-Server
快速采集清洗,任务管理,实时流和批处理数据分析,数据可视化展现,快速数据模板开发,ETL工具集、数据科学等。是轻量级的一站式的大数据平台。帮用户快速搭建CDP客户数据平台,实现对移动端数据分析、用户行为分析、用户标签画像和在线营销。完美兼容神策埋点SDK、友盟埋点SDK和其他终端埋点包。快速对接、快速应用。
HiddenStrawberry/Crawler_Illegal_Cases_In_China
Collection of China illegal cases about web crawler 本项目用来整理所有**大陆爬虫开发者涉诉与违规相关的新闻、资料与法律法规。致力于帮助在**大陆工作的爬虫行业从业者了解我国相关法律,避免触碰数据合规红线。 [AD]中文知识图谱门户
rainweb521/My-tutorial
我想构建形成自己的知识的体系,工作职位是大数据,所以主要还是以大数据为主,从主流框架Hadoop,Spark的开发到某些组件的单独利用,我都会详细的讲解, 大数据开发是很繁琐的,正确的运行环境是成功的第一步,所以我尽量从搭建,部署,开发整个流程都做出来,单独的环节可利用率很低。利人利己,希望帮到更多的人。
wangzhiwubigdata/God-Of-BigData
专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...
JerryLead/SparkInternals
Notes talking about the design and implementation of Apache Spark
uupers/BiliSpider
开发 bilibili 网站爬虫,大数据分析研究
sakura521/wifiProject
基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目