Statistical-Analysis-and-Modeling-Final-Project

呜咪!!!🐱

这是2023-2024秋学期同济大学软件学院统计分析与建模期末项目🌟

该仓库中是我们小组的期末项目作业🖊️

能力有限,仅供参考与学习🌸

方便自己之后回过来看也希望对大家有所帮助捏!👀

小组成员:

2051498 储岱泽🐱

2051828 莫益萌🎈

2152190 李凌朗🌊

2152208 袁泓博⚡️


题目一:回归模型

  • Mission: 数据集提供了一个全球范围内的教育数据,包括29列,内容涵盖失学率、学业完成率、熟练程度、识字率、出生率以及小学和高等教育入学统计等信息。希望你能够通过数据分析对不同国家和地区的教育动态提供深刻的见解,希望你的工作能够给全球教育工作者一个评估、加强和重塑全球教育系统的机会。

  • Candidate Tasks:

  1. 数据分析&结论
  2. 数据预处理
  3. 数据建模及模型质量评估

题目二:分类模型

  • Mission: 泰坦尼克号的沉没是历史上最著名的沉船事故之一。1912年4月15日,在处女航中,被认为“永不沉没”的皇家邮轮泰坦尼克号与冰山相撞后沉没。不幸的是,船上没有足够的救生艇容纳所有人,导致2224名乘客和船员中的1502人死亡。虽然生存有一些运气因素,但似乎有些群体比其他群体更有可能生存下来。请使用乘客数据(包括姓名、年龄、性别、社会经济阶层等)建立一个预测模型,尝试思考和回答以下问题:“什么样的人更有可能存活下来?”。

  • Candidate Tasks:

    1. 数据分析&结论
    2. 数据预处理
    3. 数据建模及模型质量评估a. 建立是否存活(Survived)的预测模型(Y:Survived)
    4. 模型解读(影响因素分析)
    5. 根据以上数据分析工作回答问题:什么样的人更有可能存活下来?

题目三:时序模型

  • Mission: 该数据集共包含25161行,每行代表特定公司在给定日期的股市数据。数据是从www.nasdaq.com通过网络抓取收集的信息包括上市公司的股价和交易量,如苹果、星巴克、微软、思科系统、高通、Meta、亚马逊、特斯拉、Advanced Micro Devices和Netflix。请对这些公司的数据进行统计分析,希望您能够为投资者提出可靠并宝贵的建议。

  • Candidate Tasks:

  1. 数据分析&结论(以下仅为参考)a. 可视化:每个公司的股票价格随时间的分布,可以使用使用折线图、条形图(barplot)和热图(heatmap)等来可视化股市数据中的趋势、季节性和模式b. 相关性分析:调查不同公司收盘价之间的相关性,以确定潜在的关系,计算相关系数,生成相关系数矩阵。c. 股票不动性分析d. 推荐最佳潜力股
  2. 数据预处理
  3. 数据建模及模型质量评估a. 建立股价预测模型(Y:Survived)
  4. 模型解读(影响因素分析)
  5. 根据以上数据分析工作给投资者提出的几点建议