/ProjectArchive

组织内所有项目的归档

项目归档

本组织为燕山大学信院528实验室,整个项目由实验室内各个成员提供,此项目主旨在于帮助通过协作开发,提高实验组水平,帮助所有人更好得积累baseline和学习

此文档为项目的归档文档,便于对不同项目进行索引,包含组织内的所有项目以及对应的简介

一、推荐系统方向

1.1 推荐系统模板存储(施工中)

用于存储所有组内的可开源的推荐系统基本模板(尚在开发过程中)

项目地址:https://github.com/ysu528/RecommenderSystems

1.2 统计所有适合本项目组的kaggle类赛事(施工中)

例如CTR模型,可以在对应的赛事项目上来尝试

项目地址:https://github.com/ysu528/ysu528kaggle

1.3 DataWhale推荐系统教程

本教程主要是针对具有机器学习基础并想找推荐算法岗位的同学,由推荐算法基础、推荐算法入门赛、新闻推荐项目及推荐算法面经组成,形成了一个完整的从基础到实战再到面试的闭环。主要分为三个阶段,分别是推荐系统基础、推荐系统进阶和推荐算法面经

项目地址:https://github.com/ysu528/fun-rec

二、机器学习、深度学习方向项目

2.1 动手学深度学习(Dive into Deep Learning,D2L.ai)

本开源项目代表了我们的一种尝试:我们将教给读者概念、背景知识和代码;我们将在同一个地方阐述剖析问题所需的批判性思维、解决问题所需的数学知识,以及实现解决方案所需的工程技能。

项目地址:https://github.com/ysu528/d2l-zh

2.2 南瓜书PumpkinBook

“周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节。”

项目地址:https://github.com/ysu528/pumpkin-book

2.3 统计学习方法(第二版)习题解答

本书分为监督学习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔科夫链蒙特卡罗法、潜在狄利克雷分配和PageRank算法等。本书通过第1章、第12章、第13章、第22章进行总结,其余每章都介绍一种统计学习方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。

项目地址:https://github.com/ysu528/statistical-learning-method-solutions-manual

2.4 巨硬的NumPy

巨硬的NumPy 教程包括两部分:《从小白到入门》和《从入门到精通》。 《从小白到入门》旨在帮助没有基础的同学快速掌握 numpy 的常用功能,保证日常绝大多数场景的使用。 《从入门到精通》目的是帮助有进一步需要的同学对 numpy 进行更深入地了解,主要包括基本介绍、原理分析、基本操作和例子。

项目地址:https://github.com/ysu528/powerful-numpy

2.5 机器学习100天

项目中介绍了常见的机器学习算法,包含了基础介绍、资源内容、代码细节等内容,帮助初学者在100天内逐步探索机器学习的实践细节,可以说对于0基础用户非常的友好,如果你没有什么算法经验,那么建议你跟随文章的学习进度,阅读各种基础资料,并逐步实践各个代码片段,相信对自己的技术提升是非常有帮助的。

项目地址:https://github.com/ysu528/100-Days-Of-ML-Code

2.6 最全面的 Kaggle 解决方案和想法列表

汇总了几乎所有Kaggle历史竞赛解决方案和Top思路的网页,新的比赛一结束,这个名单就会更新

项目地址:https://github.com/ysu528/kaggle-solutions

三、学习资源整理

3.1 燕山大学528组学习资源

项目地址:https://github.com/ysu528/ysu528LearningResources

3.2 Datawhale学习资料

本项目主要存储Datawhale组队学习中“数据挖掘/机器学习”方向的资料。

项目地址:https://github.com/ysu528/team-learning-data-mining

3.3 计算广告论文、学习资料、业界分享

动态更新工作中实现或者阅读过的计算广告相关论文、学习资料和业界分享,作为自己工作的总结,也希望能为计算广告相关行业的同学带来便利。 所有资料均来自于互联网,如有侵权,请联系王喆。同时欢迎对计算广告感兴趣的同学与我讨论相关问题,我的联系方式如下:

项目地址:https://github.com/ysu528/Ad-papers

3.4 推荐系统论文、学习资料、业界分享

动态更新工作中实现或者阅读过的推荐系统相关论文、学习资料和业界分享,作为自己工作的总结,也希望能为推荐系统相关行业的同学带来便利。 所有资料均来自于互联网,如有侵权,请联系王喆。同时欢迎对推荐系统感兴趣的同学与我讨论相关问题,我的联系方式如下:

项目地址:https://github.com/ysu528/Reco-papers

3.5 推荐系统的精选论文列表-RSPapers

该存储库提供有关推荐系统的精选论文列表RSP,包括综合调查、一般推荐系统、社交推荐系统、基于深度学习的推荐系统、推荐系统中的冷启动问题、高效推荐系统、推荐系统中的探索和利用问题、可解释性 在推荐系统以及推荐系统的点击率预测、推荐系统的知识图谱、基于评论的推荐系统、会话推荐系统、工业/实用推荐系统和隐私保护推荐系统。

项目地址:https://github.com/ysu528/RSPapers

3.6 AWS-推荐论文

这是在 IEEE Transactions on Knowledge and Data Engineering 上提交的调查论文“A Survey on Accuracy-oriented Neural Recommendation: From Collaborative Filtering to Information-rich Recommendation”的存储库

项目地址:https://github.com/ysu528/AWS-recommendation-papers

3.7 【机器学习】【白板推导系列】【合集 1~33】

顶级大佬在白板上推导了各个机器学习算法的过程

视频地址:https://www.bilibili.com/video/BV1aE411o7qd?spm_id_from=333.337.search-card.all.click

语雀文档地址:https://www.yuque.com/books/share/f4031f65-70c1-4909-ba01-c47c31398466?#

四、基础算法学习

4.1 codeforces-go整理的算法code库(基于golang实现)

由于算法知识点繁杂,将自己学习到的算法、做过的题目分类整理好是有必要的。 一个算法模板应当涵盖以下几点: 对该算法的基本介绍(核心**、复杂度等) 参考链接或书籍章节(讲的比较好的资料) 模板代码(可以包含一些注释、使用说明) 模板补充内容(常见题型中的额外代码、建模技巧等) 相关题目链接(模板题、经典题、思维转换题等)

项目地址:https://github.com/ysu528/codeforces-go

4.2 labuladong 的算法小抄

做啥事情做多了,都能发现套路的,我把各种算法套路框架总结出来,相信可以帮助其他人少走弯路。我这个纯靠自学的小童鞋,花了一年时间刷题和总结,自己写了一份算法小抄,后面有目录,这里就不废话了。

项目地址:https://github.com/ysu528/fucking-algorithm

五、后端项目学习

5.1 电影推荐系统-王喆

SparrowRecSys是一个电影推荐系统,名字SparrowRecSys(麻雀推荐系统),取自“麻雀虽小,五脏俱全”之意。项目是一个基于maven的混合语言项目,同时包含了TensorFlow,Spark,Jetty Server等推荐系统的不同模块。希望你能够利用SparrowRecSys进行推荐系统的学习,并有机会一起完善它。

项目地址:https://github.com/ysu528/SparrowRecSys

5.2 Course-Selection-System(抢课系统)

本项目是一个选排课系统项目,整个系统包括登录模块、成员模块、排课模块和抢课模块,面向管理员的主要业务为成员管理,进行创建或者删除成员,以及排课管理,设置教师与课程的绑定关系,面向学生的主要业务为抢课以及查看学生课表。就消息队列+令牌环处理抢课高并发问题。

项目文档:https://bytedancecampus1.feishu.cn/docs/doccngiFrZry8S8Y8wqy1wdxKOh#

项目地址:https://github.com/ysu528/Course-Selection-System

5.3 后端架构师技术图谱

从初级开发者到资深架构师,看这些基本就够了

项目地址:https://github.com/ysu528/architect-awesome

5.4 CS-Notes

项目大量介绍了各类常用的基础知识点,包括算法、操作系统 网络、面向对象、数据库、Java、系统设计、工具、编码实践等多个方面

项目地址:https://github.com/ysu528/CS-Notes

5.5 Python-100-Days

python学习的一百天,对于python学习新手有很大的帮助

项目地址:https://github.com/ysu528/Python-100-Days

六、网络协议、爬虫等知识整理

6.1 基于python3的网络爬虫(崔庆才经典爬虫书籍)

无需多言,崔庆才出品的爬虫课程可以说的上是全网最经典的一套

项目地址:https://github.com/ysu528/Python3WebSpider

七、新生培养方案

燕山大学528实验组新生培养方案

项目地址:https://github.com/ysu528/ysu528NewStars

八、工具学习

8.1 latex使用教程

网站:https://www.latexstudio.net/

8.2 github使用教程

项目地址:https://github.com/ysu528/fucking-algorithm

8.3 高并发压力测试工具

项目地址:https://github.com/wg/wrk

8.4 fantastic-matplotlib

matplotlib使用学习

项目地址:https://github.com/ysu528/fantastic-matplotlib

8.5 pycharm使用教程

许多项目调试环节是需要在pycharm中进行的,而且pycharm可以很方便进行本地code和服务器上code的数据同步

8.6 docker使用教程

不少项目环境配置很麻烦,如果采用docker直接打包好,移植就会变得简单许多

九、大数据

9.1 妙趣横生大数据 Juicy Big Data

当今的时代处处充斥着大数据的影子,大数据技术也为信息技术发展带来了重大的变革,并深刻影响着人们生活的方方面面。而我们旨在带领大家走进大数据时代的浪潮中,理解并能够使用目前主流的大数据处理架构Hadoop解决相应的问题,从小白到实践者。

项目地址:https://github.com/ysu528/juicy-bigdata