/FoDSxSMU

Primary LanguageHTML

Foundtations of Data Science with Capstone at SMU, Summer 2023

Course Description

Data science is the interdisciplinary study of the tools and theory behind using data to extract knowledge. It combines ideas from statistics, computer science, and particular domains in the physical and social sciences in order to make predictions and optimal decisions.

This summer intensive course is designed with a practical approach. The students will be guided to learn the basics and move on to more advanced topics in 2 weeks. The final 1 week will be dedicated to practicing and presenting data science skills and competency through capstone projects.

데이터 과학은 데이터를 활용하여 지식을 추출하기 위한 도구와 이론에 관한 다학제적인(interdisciplinary) 연구입니다. 이는 통계학, 컴퓨터 과학, 물리학과 사회과학의 특정 분야에서 아이디어를 결합하여 예측과 최적의 결정을 내리는 데 사용됩니다.

3주간의 여름학기 집중과정은 실용적인 접근 방식으로 설계되었습니다. 학생들은 2주 동안 기초를 학습하고 더욱 고급 주제로 나아갈 수 있도록 마지막 1주에 캡스톤 프로젝트를 하게됩니다. 이 캡스톤 프로젝트를 통해 학생들은 데이터과학에 쓰이는 기술과 역량을 실습하고 마지막에 프로젝트 발표를 하게 될 것입니다.

Session 1: Building Foundations (2 weeks)

During the first 2 weeks, you will learn the foundations of data science including the basics of how to structure, visualize, transform, and model data. The primary programming language that we will be using is R, which is both simple to use and was designed around using data. The development environment we will be using is RStudio. Both R and RStudio are open source, and so may be downloaded to your personal laptop for free.

첫 2주 동안은 데이터 과학의 기초를 학습할 것입니다. 데이터의 구조화, 시각화, 변환, 모델링 등에 대한 기본 개념을 배우게 됩니다. 주로 사용할 프로그래밍 언어는 데이터 활용을 중심으로 설계되어 사용하기 간편한 R입니다. 개발 환경으로는 RStudio를 사용할 것입니다. R과 RStudio는 모두 오픈 소스이며 개인 노트북 컴퓨터에 무료로 다운로드하고 인스톨할 수 있습니다.

Session 2: Practicing Knowledge (1 week)

The Data Science Capstone is a team-based, project-based session, providing an opportunity to apply data science skills and knowledge obtained from the first 2 weeks of the foundation session. Teams of two or three students, under the direction of the course instructor and teaching assistants, will be working on a data project. The primary objective is to educate the students in solving real world data science problems in professional settings by leveraging their own computational, statistical, and domain skills. The capstone will end with a final presentation.

데이터 과학 캡스톤은 팀 기반의 프로젝트 세션으로, 기초 세션에서 얻은 데이터 과학 기술과 지식을 적용하는 기회를 제공합니다. 강사와 조교들의 지도 아래, 두 명 또는 세 명으로 구성된 팀이 데이터 프로젝트에 참여합니다. 주요 목표는 학생들을 전문적인 환경에서 실제 데이터 과학 문제를 해결할 수 있는 역량을 가진 컴퓨터사용, 통계, 및 각자의 도메인 기술을 활용하여 교육하는 것입니다. 캡스톤은 최종 발표로 마무리됩니다.

Student Expectation and Project Outcomes of Capstone

Students will work independently as well as collaboratively in the group for at least 5 hours a day on modeling, analysis, data manipulation/wrangling, visualization, etc. as needed for the project. At the same time, students will be guided to learn soft skills such as project management, presentation, and communication through the daily sync-up. Students will be expected to read necessary background articles/books, learn additional tools, and log their own work and time.

학생들은 프로젝트에 필요한 모델링, 분석, 데이터 조작/가공, 시각화 등을 위해 하루에 최소 5시간 독립적으로 및 협업하여 작업합니다. 동시에 학생들은 매일 진행되는 동기화(Sync-Up)를 통해 프로젝트 관리, 발표, 의사 소통과 같은 소프트 스킬을 학습하는 데에 안내받을 것입니다. 학생들은 필요한 배경 자료, 책이나 아티클을 읽고, 추가적인 도구를 학습하며, 자신의 작업과 시간을 기록하여 보도하게 됩니다.

Each team will provide the following outcomes in a timely manner: • A project proposal detailing the intended goals, methodology, and deliverables • A final presentation on the project outcomes • A GitHub page containing all outcomes (README, data, codes, analyses results, etc.)

각 팀은 그때그때 다음과 같은 결과물을 제출해야 합니다: • 프로젝트 제안서: 목표, 방법론 및 성과물에 대한 구체적인 설명 • 프로젝트 발표: 프로젝트 결과에 대한 최종 발표 • GitHub 페이지: 모든 결과물(README, 데이터, 코드, 분석 결과 등)을 포함하는 GitHub 페이지

Textbook

We will be using R for Data Science by Hadley Wickham and Garrett Grolemund. This book is open source and can be found/downloaded online. Korean version is also available online.

Hadley Wickham과 Garrett Grolemund의 "R for Data Science" 책을 사용할 것입니다. 이 책은 오픈 소스이며 온라인에서 찾아볼 수 있고 무료로 다운로드할 수 있습니다. 한국어판도 온라인에서 이용할 수 있습니다.

[Main Text] R for Data Science by Hadley Wickham and Garrett Grolemund

[Reference]

Notes

This course material is also work-in-progress. It will be constantly updated.