917lulu's Stars
insightglacier/Dictionary-Of-Pentesting
Dictionary collection project such as Pentesing, Fuzzing, Bruteforce and BugBounty. 渗透测试、SRC漏洞挖掘、爆破、Fuzzing等字典收集项目。
didi/sharingan
Sharingan(写轮眼)是一个基于golang的流量录制回放工具,适合项目重构、回归测试等。
hehonghui/android-tech-frontier
【停止维护】一个定期翻译国外Android优质的技术、开源库、软件架构设计、测试等文章的开源项目
simplezhli/flutter_deer
🦌 Flutter 练习项目(包括集成测试、可访问性测试)。内含完整UI设计图,更贴近真实项目的练习。Flutter practice project (including integration testing and accessibility testing). Contains complete UI design drawings for a more realistic practice project.
luoyeETH/selenium_metamask_auto_testing
使用selenium实现对测试网项目的自动化测试
OpenBMB/MiniCPM-V
MiniCPM-V 2.6: A GPT-4V Level MLLM for Single Image, Multi Image and Video on Your Phone
GoAlers/Pinyin_recognize
本项目为基于深度学习的手写汉语拼音识别,采用Pytorch框架,整体采用主流深度学习文字识别算法CRNN+CTC方法,项目流程主要分为数据集采集及标注,算法构建、模型训练、预测与评估等。
GoAlers/BigdataNote
大数据生态学习笔记文档,总结hadoop分布式计算框架、yarn、数据分析步骤、storm、kafka、Hbase、spark等知识用于个人学习,分享优秀笔记博客。
GoAlers/Bigdata_Eshop
本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。
GoAlers/Music-Top-Recommend
利用用户画像数据、物品元数据、用户行为数据为特征构建推荐系统,使用CB和CF算法做推荐召回,使用 Redis数 据库做缓存处理,结合机器学习LR算法推荐排序,达到粗排、精排效果,实现推荐引擎搭建。
scikit-learn/scikit-learn
scikit-learn: machine learning in Python
Jack-Cherish/PythonPark
Python 开源项目之「自学编程之路」,保姆级教程:AI实验室、宝藏视频、数据结构、学习指南、机器学习实战、深度学习实战、网络爬虫、大厂面经、程序人生、资源分享。
zhisheng17/flink-learning
flink learning blog. http://www.54tianzhisheng.cn/ 含 Flink 入门、概念、原理、实战、性能调优、源码解析等内容。涉及 Flink Connector、Metrics、Library、DataStream API、Table API & SQL 等内容的学习案例,还有 Flink 落地应用的大型项目案例(PVUV、日志存储、百亿数据实时去重、监控告警)分享。欢迎大家支持我的专栏《大数据实时计算引擎 Flink 实战与性能优化》
BigDataScholar/TheKingOfBigData
🚀🚀🚀优质的历史文章,大数据高频考点,Java一线大厂知识考点,更有精美简历模板,简历指导手册和上百本技术书籍,最重要的就是被全网下载上千次的我自己花精力去画的大数据生态圈,Kafka,Spark,Scala的思维导图...这是一个你在大数据学习路上不能错过的宝藏项目!
z0gSh1u/hotel-24h
东南大学生产实训项目 - 简易酒店管理系统 SpringBoot + Hadoop
ki-ljl/ncepu-edm
NCEPU-EDM(NCEPU和EDM分别是华北电力大学和教育数据挖掘的缩写)软件是专门为华北电力大学本科生所开发的一款简单软件,具有查询和数据挖掘两大功能模块。其中查询模块为学生提供成绩、课表、考试、GPA、培养方案、成绩总表以及综合测评等教务查询。同时该模块对学生的成绩数据进行可视化分析,包括成绩占比、成绩比较、GPA走势、单科分析、专业排名、挂科分析、单科排名以及个人分析查询。数据挖掘模块对近五年的学生成绩数据进行了关联分析,生成了几十条有用的关联规则,利用关联规则学生可以根据以前考试科目的成绩来大致预测将来考试科目的成绩。同时该模块根据关联规则,选取了关联性较强的一些科目,利用部分科目的成绩来预测特定科目的成绩,并用SVM、KNN等六个机器学习算法来训练模型,进而预测相关成绩,让学生可以根据预测情况进行相应学习状态或者复习状态的调整,最终达到成绩预警的作用。
0voice/interview_internal_reference
2023年最新总结,阿里,腾讯,百度,美团,头条等技术面试题目,以及答案,专家出题人分析汇总。
wolf-song-ml/bi-etl
大数据离线项目之:BI上报(Hadoop、Hbase、Hive、flume、sqoop)
awesome-selfhosted/awesome-selfhosted
A list of Free Software network services and web applications which can be hosted on your own servers
IronmanJay/E-CommerceWarehouse
实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本的框架实现,并实现最终的数据可视化。
The-Joker123/BigData_beauty_analysis
数据大屏可视化,大数据分析(SpringBoot+hiveJDBC+echarts)
HuQi2018/Douban-Explorer
豆瓣探索者这个作品是依托豆瓣这个平台制作的一个数据分析系统。本作品使用Python的BeautifulSoup库爬取了电影、图书、音乐这三个方向的数据存入MongoDB的NoSQL数据库,使用Pyecharts库得到了诸如单部电影评分分布的一维数据图、评分与评论数关系的二维数据图甚至于多维数据图,并结合Django框架、前后端分离技术进行展示。 本系统还有搜索功能,可以具体查询某一部电影、音乐或图书的数据分析,同时当搜索到一个数据库中不存在的数据时,后台将自动进行在线爬取存入数据库,即我们将数据搜集的过程也加入到了网站上,从而实现了数据收集、预处理、存储、处理与分析、可视化的集成系统。
IronmanJay/TelecomCustomerService
通信运营商每时每刻会产生大量的通信数据,例如通话记录,短信记录,彩信记录,第三方服务资费等等繁多信息。数据量如此巨大,除了要满足用户的实时查询和展示之外,还需要定时定期的对已有数据进行离线的分析处理。例如,当日话单,月度话单,季度话单,年度话单,通话详情,通话记录等等。我们以此为背景,寻找一个切入点,学习其中的方法论。当前我们的需求是:统计每天、每月以及每年的每个人的通话次数及时长。
mikenote/homekeeping
这是一个大学生互联网+的大创项目:“一点到家”——云滇家政平台助力乡村振兴,系统前台:微信小程序,后端springboot,数据库mysql。属于一个非常值得推荐的项目,系统源码简单宜读,干净简洁、注释详细,可二次开发。创意满满,贴近生活,缓解就业压力,为农民增收致富,促进社会的稳定发展。
jiguang123/Big-Data-Competition-Project
大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等
fancyChuan/bigdata-hub
数据建设与大数据技术知识体系,包含hadoop、hive、spark、flink主流框架和系列框架,数据中台、数据湖、数据治理、数仓建设、数据化转型等
hyh1750522171/bigData
大数据比赛项目库
yyhsong/iDataV
大屏数据可视化 Big screen data visualization demo
TurboWay/bigdata_analyse
大数据分析项目
ljcan/SparkStreaming
Spark Streaming+Flume+Kafka+HBase+Hadoop+Zookeeper实现实时日志分析统计;SpringBoot+Echarts实现数据可视化展示