This repository using for giving details about Term Project in INT214 Statistics for Information Technology 1/2021
- Apply quantitative models to solve real world problems in appropriate contexts
- Use statistical reasoning, formulate a problem in statistical terms, perform exploratory analysis of data by graphical and other means, and carry out a variety of formal inference procedures.
- Have communication skills which are necessary to effectively collaborate as part of interdisciplinary teams including the ability to interpret and communicate the results of a statistical analysis through oral and written reports.
- Form team with 3-5 members
- Select dataset
- Create Group Repository in Github Organization: INT214 Statistics 2021
Read more details here
Total Score is 100
- Midterm Assignment 35 Pts
- Final Assignment 65 Pts
- Topics: Exploratory data analysis and desciptive statistics
- Due date: 23 October 2021 (17:00 GMT+7)
- Send Format: GIT Repository with R, md file (Or using Rmd, HTML file)
- Feedback: Using Teams in Github
- Data Exploration (5 Pts)
- สามารถสำรวจชุดข้อมูลและอธิบายข้อมูลได้อย่างครบถ้วน
- Data Cleaning and Data Transformation (10 Pts)
- สามารถแปลงข้อมูลได้เหมาะสม
- สามารถวิเคราะห์และตรวจสอบข้อมูลต่าง ๆ ได้ถูกต้องและเหมาะสม
- เลือกใช้วิธีการทำความสะอาดข้อมูลได้อย่างถูกต้องและเหมาะสม (หากชุดข้อมูลนั้นไม่ต้องทำความสะอาด จะพิจารณาจากการวิเคราะห์และตรวจสอบข้อมูลแทน)
- Data Analysis with Descriptive Statistics (15 Pts)
- สามารถตั้งคำถามเกี่ยวกับชุดข้อมูลได้อย่างเหมาะสม
- เลือกใช้วิธีในการวิเคราะห์และสรุปผลสถิติได้ถูกต้องและเหมาะสม
- ในการสรุปผลเป็นประโยคใจความสมบูรณ์ สามารถสื่อสารกับคนอื่นได้เหมาะสม (เช่น นักเรียนส่วนใหญ่มีค่าเฉลี่ย.... **ไม่ควรสรุปว่า avg = )
- Other + Document (5 Pts)
- Assignment 2-3 (2 Pts)
- มีการจัดเรียงเอกสารใน GIT Repository แบ่งหัวข้อได้อย่างเหมาะสมและสอดคล้อง
- มีการวางแผนขั้นตอนกระบวนการในการวิเคราะห์ข้อมูลได้เหมาะสม
- เขียนอธิบาย สื่อสารให้ผู้อื่นสามารถเข้าใจได้
- Topics: Inferential Statistics, Data Visualization, and Communicate
- Due date: 17 December 2021 (23:00 GMT+7)
- How to submit: send materials that used in presentation and zip project file (GIT Repository) in LEB2
- Oral Presentation: 15 - 17 December 2021
- Data Visualization (15 %)
- แสดงผลข้อมูลในลักษณะ Dashboard โดยใช้เครื่องมือ BI Tools (Power BI, Google Studio, Tableau)
- นำชุดข้อมูลมาแสดงผลได้เหมาะสมกับประเภทข้อมูล
- สามารถปฎิสัมพันธ์ (Interaction)เพื่อให้เห็นความสัมพันธ์ระหว่างข้อมูลได้
- มีการจัดเรียงองค์ประกอบได้เหมาะสมและครบถ้วน อาิทเช่น Title, Source References, Label, etc.
- BI Dashboard สามารถสื่อความหมายได้ด้วยตัวเอง (เข้าใจได้ง่าย)
- Analytical Inferential Statistics (20 %)
- กำหนดโจทย์ ตั้งสมมุติฐาน ทดสอบสมมุติฐาน และสรุปผลได้อย่างถูกต้องและเหมาะสม
- ตามตัวอย่างที่เคยสอนในห้อง 08-HypoTesting.md
- ทำเพียง 1 ข้อ (หรือมากกว่าก็ได้) ลง md file เหมือนเดิม
- สามารถออกแบบโจทย์เป็น OnePop, TwoPop, Match Sample ได้หมดเลย โดยอาจจะใช้เรื่อง sample data หรือแบ่งข้อมูลทำ proportion ก็ได้ นอกจากนี้สามารถทำ Advance นอกเหนือจากที่สอนใน R เป็นหัวข้อ Regression Analysis and Prediction ก็ได้แต่ต้องทำถึง Testing for Significance (ส่วนนี้พี่มีอยู่ในสรุป Final ที่เคยแชร์ให้อยู่หน้า 21-25 ดูได้ที่นี่)
- Data-Storytelling: Oral Presentation (30 %)
- นำเสนอ 5-10 นาที
- สามารถสื่อสารนำเสนอข้อมูลได้เหมาะสมและมีความน่าสนใจ มีรูปแบบการเล่าเรื่องราวน่าสนใจเช่น Data Storytelling
- สามารถสมมุติผู้เล่า-ผู้ฟังได้ เช่น ผู้เล่าเป็น CEO บริษัท, Marketer, Speaker
- ให้มองว่า Data ที่วิเคราะห์มานั้นเป็นส่วนหนึ่งของการนำเสนอหัวข้อที่เลือก
- ไม่จำเป็นต้องนำเสนอทุกคน
- ไม่จำกัดรูปแบบการนำเสนอ สามารถทำเป็น Infographic, Slide Presentation, หรือรูปแบบอื่น ๆ ก็ได้ สามารถใช้ BI Dashboard มาร่วมนำเสนอก็ได้
- ประเด็นในการให้คะแนน: เป้าหมายในการสื่อสารและ Call to Action (5 %), ความน่าสนใจของวิธีการเล่าเรื่อง (10 %), การนำเสนอและแสดงผลข้อมูลที่วิเคราะห์ (10 %), การเตรียมตัว (5 %)
See List of team and group_id here
- ATCHARA TRAN-U-RAIKUL
- JATAWAT XIE (Git: safesit23)