ํ๋ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ์ ๋ชจ๋ํฐ๋ง ๋ฐ ์์ธก ์ข ํฉ ์๋น์ค
๋ฐ์ดํฐ(ํ์ ์์ ๋ฐ ์์ฑ ๋ฐ์ดํฐ)๋ฅผ ์ง์ ์์งํ์ฌ ์กฐ์ง์ ํ์ ํจ์จ์ฑ์ ๋ณด์ฌ์ฃผ๊ธฐ ์ํ ์๊ฐํ ๋ฐ ํ์ ์ง์ ์์ธก ์ข ํฉ ์๋น์ค
ํ์ ์ ํ๋ ์กฐ์ง์ ์ฑ๊ณต์ ํ์์ ์ธ ์์์ด๋ค. ํจ๊ณผ์ ์ธ ํ์ ์ ์์ฐ์ฑ์ ๋์ด๋ฉฐ ํ์ ๊ฐ์ ์์ฌ์ํต๊ณผ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํฅ์์ํจ๋ค.
๊ทธ๋ฌ๋ ๋ง์ ์กฐ์ง์ ํ์ ์ ์ง๊ณผ ํจ์จ์ฑ์ ๊ฐ๊ด์ ์ผ๋ก ํ๊ฐํ๊ณ ๊ฐ์ ํ๊ธฐ ์ด๋ ค์ํ๋ค. ํ์์ ๊ฐ์ ํ์ ์ค ์์ฑ๋๋ ์ ๋ณด๋ ํ์ ์ ์ดํดํ๊ณ ๋ถ์ํ๋ ๋ฐ ์ค์ํ ์์ฐ์ด ๋ ์ ์์ง๋ง ํด๋น ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋ ๋ฐฉ๋ฒ์ด ๋ถ์กฑํ๋ค.
๋ฐ๋ผ์ ๋ณธ ํ๋ก์ ํธ์์๋ ์ง์ ์์งํ ํ์ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ํ์ ๊ตฌ์กฐ๋ฅผ ์๊ฐํํ๊ณ ์ง์ ํ๊ฐํ์ฌ ์กฐ์ง์ ํ์ ํจ์จ์ฑ์ ๊ฐ์ ํ๋ ๋ฐ ๋์์ด ๋๊ณ ์ ํ๋ค.
-
ํ์ ์์ ๋ฐ ์์ฑ ๋ น์์ ํ ์คํธ๋ก ๋ณํ
-
์ถ์ถ๋ ํ ์คํธ ๋ฐํ์ผ๋ก SNA๋ฅผ ์ด์ฉํ ํ์ ๊ตฌ์กฐ ์๊ฐํ
-
์ถ์ถ๋ ํ ์คํธ ๋ฐํ์ผ๋ก ๊ด๊ณํ ๋ฐ์ดํฐ ๋ฒ ์ด์ค(RDB) ์์ฑ
-
AB Test ์งํ
-
์์ฑํ RDB ๋ฐํ์ผ๋ก ํ์ ์ง์๋ฅผ ์์ธกํ๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ๊ฐ๋ฐ ๋ฐ ํ๊ฐ
-
์น ์๋น์ค ๊ฐ๋ฐ ๋ฐ ๋ฐฐํฌ
- ์๋์ฐ
- Mac
์ ๋ชฉ | ๋ด์ฉ | ๋ฒ์ |
---|---|---|
๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐ ๋ถ์ | Numpy: ๋ค์ฐจ์ ๋ฐฐ์ด ๊ฐ์ฒด์ ๋ค์ํ ์ํ ํจ์๋ค์ ์ ๊ณตํ์ฌ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ๊ณผํ ์ฐ์ฐ์ ์ฌ์ฉ Pandas: ๋ฐ์ดํฐ ํ๋ ์ ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํด ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐ ์กฐ์์ ์ฉ์ดํ๊ฒ ํ๋ฉฐ ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ, ์ ๋ฆฌ, ํํฐ๋ง, ์ง๊ณ ๋ฑ์ ์์ ์ ์ํํ๋๋ฐ ์ฌ์ฉ |
numpy>=1.17.3 pandas==1.3.5 |
๋ฐ์ดํฐ ์๊ฐํ | Matplotlib: ๊ธฐ๋ณธ์ ์ธ ํ๋กฏ๊ณผ ์ฐจํธ๋ฅผ ์์ฑํ๋๋ฐ ์ฌ์ฉ Seaborn: Matplotlib๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ณ ๊ธ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ํต๊ณ์ ๋ฐ์ดํฐ ์๊ฐํ์ ์ฌ์ฉ Plotly: ์ธํฐ๋ ํฐ๋ธํ ์๊ฐํ๊ฐ ๊ฐ๋ฅํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ์น ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์๊ฐํ์ ์ฌ์ฉ |
matplotlib==3.4.3 seaborn==0.11.2 plotly>=5.0.0 |
๋คํธ์ํฌ ๋ถ์ | Networkx: ๋คํธ์ํฌ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์๊ฐํ์ ์ฌ์ฉ | networkx==2.6.3 |
์น ๊ฐ๋ฐ | Dash: ์น ๊ธฐ๋ฐ ๋์๋ณด๋๋ฅผ ๊ฐ๋ฐํ๋๋ฐ ์ฌ์ฉ FastAPI: ๊ณ ์ฑ๋ฅ API๋ฅผ ๊ตฌ์ถํ๋๋ฐ ์ฌ์ฉํ์ฌ ๋น ๋ฅด๊ณ ํจ์จ์ ์ธ ์น ์๋น์ค๋ฅผ ๊ฐ๋ฐ Uvicorn: FastAPI ์ ํ๋ฆฌ์ผ์ด์ ์ ์คํํ๊ธฐ ์ํ ASGI ์๋ฒ๋ก ๋น๋๊ธฐ ์น ์๋น์ค์ ์ฑ๋ฅ์ ๊ทน๋ํํ๋๋ฐ ์ฌ์ฉ |
dash==2.7.0 fastapi==0.70.0 uvicorn[standard] |
๊ณผํ ๊ณ์ฐ ๋ฐ ํต๊ณ | SciPy: ๊ณผํ ๊ณ์ฐ์ ์ํ ๋ค์ํ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ฉฐ t-test ๋ฑ์ ๊ณ์ฐํ๋๋ฐ ์ฌ์ฉ Statsmodels: ํต๊ณ ๋ชจ๋ธ์ ์์ฑํ๊ณ ๊ฒ์ฆํ๋๋ฐ ์ฌ์ฉ๋๋ฉฐ, VIF ๊ณ์ฐ ๋ฑ์ ํ์ฉ |
scipy==1.7.3 statsmodels==0.13.2 |
๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ง | Scikit-learn: ๋ถ๋ฅ์ ํ๊ท ๋ฑ ๋ค์ํ ์๊ณ ๋ฆฌ์ฆ์ ์ ๊ณตํ๋ฉฐ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ๊ตฌ์ถ, ํ๊ฐ ๋ฐ ๊ฒ์ฆ์ ์ฌ์ฉ LightGBM: ๊ฐ๋ฒผ์ด Gradient Boosting ํ๋ ์์ํฌ๋ก ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์ ๋น ๋ฅด๊ณ ํจ์จ์ ์ธ ๋ชจ๋ธ ํ์ต์ ์ํด ์ฌ์ฉ๋๋ค. CatBoost: ์นดํ ๊ณ ๋ฆฌํ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ต์ ํํ Boosting ๋ผ์ด๋ธ๋ฌ๋ฆฌ XGBoost: ํจ์จ์ ์ด๊ณ ํ์ฅ์ด ๊ฐ๋ฅํ Gradient Boosting ๋ผ์ด๋ธ๋ฌ๋ฆฌ |
scikit-learn==1.0.2 lightgbm==3.3.1 catboost==1.0.4 xgboost==1.5.0 |
๊ธฐํ | Time: ์๊ฐ ๊ด๋ จ ์์
์ ์ํํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ์คํ ์๊ฐ ์ธก์ ๋ฑ์ ์ฌ์ฉ Base64: ๋ฐ์ดํฐ ์ธ์ฝ๋ฉ ๋ฐ ๋์ฝ๋ฉ ์์ ์ ์ฌ์ฉ os: ์ด์ ์ฒด์ ์ ์ํธ์์ฉํ๋๋ฐ ์ฌ์ฉ Datetime: ๋ ์ง์ ์๊ฐ ๋ฐ์ดํฐ๋ฅผ ์กฐ์ํ๊ณ ํ์์ ๋ณํํ๋๋ฐ ์ฌ์ฉ Collections: ๊ณ ๊ธ ๋ฐ์ดํฐ ๊ตฌ์กฐ(defaultdict, deque ๋ฑ)๋ฅผ ์ ๊ณตํ๋ฉฐ ํจ์จ์ ์ธ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ์ฌ์ฉ Math: ๊ธฐ๋ณธ ์ํ ํจ์ ๋ฐ ์์๋ฅผ ์ ๊ณตํ๋ฉฐ ์ํ์ ๊ณ์ฐ์ ์ํํ๋๋ฐ ์ฌ์ฉ Re: ์ ๊ท ํํ์์ ์ฌ์ฉํ์ฌ ๋ฌธ์์ด ๊ฒ์ ๋ฐ ์ฒ๋ฆฌ๋ฅผ ์ํํ๋๋ฐ ์ฌ์ฉ |
python==3.9 |
-
์จ๋ผ์ธ
- (๋ นํ ํ๋ก๊ทธ๋จ) ์ ์ฌ์ฉํ์ฌ ํ์ํ์ ์น ํ๋ซํผ์ธ ๊ฒ๋(Gather)์์ ๋ นํ ์งํ
-
์คํ๋ผ์ธ
-
๋ชจ๋ฐ์ผ(์์ดํฐ, ๊ฐค๋ญ์) ๋ น์ ๊ธฐ๋ฅ์ ์ด์ฉํ์ฌ ๋ น์ ์งํ
-
Naver Clova Note ์ดํ ๋ด ๋ น์ ๊ธฐ๋ฅ์ ์ด์ฉํ์ฌ ๋ น์ ์งํ
-
-
ํ์ ํ์
-
ํ์ ํ ๊ฐ ํ์์ด ํ์์ ์ํ์ฑ, ๋ชฉํ ๋ฌ์ฑ์ ๋, ๊ฐ ํ์์ ๊ธฐ์ฌ๋ ๋ฑ์ ํฌํจํ์ฌ ์ ์ฒด ํ์ ํ๊ฐ ์ ์์ ๊ตฌ์ฑ์ ๊ฐ์ธ๋ณ ์์ ํ๊ฐ ์ ์, ๊ตฌ์ฑ์ ๊ฐ์ธ๋ณ ๊ตฌ์ฑ์ ํ๊ฐ ์ ์ ๋ฐ์ดํฐ๋ฅผ ์์ง
-
๊ตฌ๊ธ ํผ์ ์ด์ฉํ์ฌ ์จ๋ผ์ธ ์ง๋ฌธ ์์์ ๋ง๋ค์ด ๋ฐ์ดํฐ๋ฅผ ์์ง
-
-
์ง์ ์์งํ ํ์ ๋ฐ์ดํฐ(์์ ๋ฐ ์์ฑ)๋ฅผ ํ ์คํธ ๋ฐ์ดํฐ๋ก ๋ณํํ๊ธฐ ์ํด ๋ค์ด๋ฒ ํด๋ก๋ฐ ๋ ธํธ ์ด์ฉ
-
์ถ์ถ๋ ํ ์คํธ ๋ฐ์ดํฐ์์ ๊ฐ ๋ฐํ์์๊ฒ ๊ณ ์ ํ ๋ฒํธ ํ ๋นํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฌ๊ตฌ์ฑ
-
๋ฐํ์ ์๋ชป ๋งค์นญ๋ ๊ฒฝ์ฐ ์ค์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ฐํ์ ์ ๋ณด ์์
-
๋ณํ๋ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก 1์ฐจ ์งํ๋ฅผ ์ถ์ถํ์ฌ RDB ํํ๋ก ์ ์ฅํ์ฌ ์ฒด๊ณ์ ์ผ๋ก ๊ด๋ฆฌํ๊ณ ๋ถ์ํ ์ ์๋๋ก ํจ
-
ํด๋ก๋ฐ ๋ ธํธ๋ฅผ ํตํด ์ถ์ถ๋ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก SNA ๊ด๋ จ ์งํ๋ฅผ ๊ณ์ฐํ์ฌ ๊ธฐ์กด RDB์ ์ถ๊ฐ
-
ํ์์ ์ง์ ์ํด ํ์๋ค๋ก๋ถํฐ ์์งํ ํ ์ด๋ธ ํํ์ ํ์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ์กด RDB์ ์ถ๊ฐ
-
-
ํ์ ์ค ๊ธฐ๋ก๋ ์์ฌ์ํต ์ํธ์์ฉ์ ์๊ฐํํ Interaction Network ๊ทธ๋ํ
-
๊ฐ ๊ตฌ์ฑ์ ๊ฐ์ ์ํธ์์ฉ ๋น๋์ ํ์ ๋ํฅ์ ๋ถ์ํ๋ ๋ฐ ์ ์ฉํ ๋๊ตฌ
-
-
Gini Coefficient ๊ทธ๋ํ(์ผ๋ง๋ ๊ท ๋ฑํ๊ฒ ์ํตํ๋๊ฐ?)
- ํ์ ์ค ๊ธฐ๋ก๋ ์์ฌ์ํต ์ํธ์์ฉ๊ณผ ์ํธ์์ฉ์ ํ๋ฑ์ฑ์ ์๊ฐํ
-
Degree Centrality ๊ทธ๋ํ(ํ์์ ์ผ๋ง๋ ๊ธฐ์ฌํ๋๊ฐ?)
-
ํ์ ๊ตฌ์ฑ์ ๊ฐ์๊ฐ ๋ค๋ฅธ ๊ตฌ์ฑ์๊ณผ ์ผ๋ง๋ ๋ง์ ์ฐ๊ฒฐ์ ๊ฐ์ก๋์ง๋ฅผ ์๊ฐํ
-
๊ตฌ์ฑ์์ ์ค์ฌ์ฑ์ ๋ํ๋ด๋ฉฐ ๋์ ๊ฐ์ผ์๋ก ๋ ๋ง์ ์ํธ์์ฉ์ ์๋ฏธ
-
-
Normalized Interaction Frequency ๊ทธ๋ํ(์ผ๋ง๋ ์ฌ๋๋ค๊ณผ ์ํต์ ํ๋๊ฐ?)
-
๊ฐ ํ์์์ ์ํธ์์ฉ ๊ฐ๋๋ฅผ ์๋์ ์ผ๋ก ์ดํดํ๋ ๋ฐ ๋์์ ์ฃผ๋ ๊ทธ๋ํ
-
์ํธ์์ฉ์ ๋ฐํ์ ๋ค์์ผ๋ก ๋ฐ์ธํ๋ ์ฌ๋์ ๊ธฐ์ค์ผ๋ก 1ํ๋ก ์ธก์
-
-
Normalized Speech Frequency ๊ทธ๋ํ(์ผ๋ง๋ ๋ง์ ๋จ์ด ์๋ฅผ ๋งํ๋๊ฐ?)
-
๊ฐ ํ์์์ ์ ๊ทํ๋ ๋ฐ์ธ ๋น๋๋ฅผ ๋น๊ตํ์ฌ ์ผ๋ง๋ ๋ง์ ๋จ์ด๊ฐ ์ฐ์๋์ง ์๊ฐํ
-
ํ์์์ ๋ฐ์ธ๋์ ์๋์ ์ผ๋ก ์ดํดํ๋๋ฐ ๋์์ ์ค
-
๊ฒฐ๊ณผ์ ์ผ๋ก ์ด 24๊ฐ์ ์ปฌ๋ผ์ผ๋ก ๊ตฌ์ฑ๋ ์ข ํฉ ํ ์ด๋ธ์ด ์์ฑ๋๋ฉฐ ๋ค์๊ณผ ๊ฐ์ ์ปฌ๋ผ์ด ํฌํจ
์ปฌ๋ผ๋ช | ์ปฌ๋ผ ์ค๋ช |
---|---|
id | ๋ฐ์ดํฐ ๊ณ ์ ์๋ณ์ |
project | ํ๋ก์ ํธ ์ฐจ์ |
meeting_number | ํ์ ์ฐจ์ |
speaker_number | ๋ฐํ์ ๋ฒํธ |
speech_frequency | ๋ฐํ ๋น๋ |
total_words | ์ด ๋จ์ด ์ |
duration | ํ์ ์๊ฐ |
normalized_speech_frequency | ์ ๊ทํ๋ ๋ฐํ๋น๋ |
speaker_id | ๋ฐํ์ ID |
next_speaker_id | ๋ค์ ๋ฐํ์ ID |
count | ์ํธ์์ฉ ์ |
network_density | ๋คํธ์ํฌ ๋ฐ๋ |
weighted_network_density | ๊ฐ์ค ๋คํธ์ํฌ ๋ฐ๋ |
gini_coefficient | ์ง๋ ๊ณ์(๋ถํ๋ฑ ์งํ) |
interaction_equality | ์ํธ์์ฉ ํ๋ฑ์ฑ |
interation_equality_index | ์ํธ์์ฉ ํ๋ฑ์ฑ ์ง์ |
degree_centrality | ๋คํธ์ํฌ ์ฐ๊ฒฐ ์ค์ฌ์ฑ |
indegree_centrality | ์์ ์ฐ๊ฒฐ ์ค์ฌ์ฑ |
outdegree_centrality | ๋ฐ์ ์ฐ๊ฒฐ ์ค์ฌ์ฑ |
betweenness_centrality | ๋งค๊ฐ ์ค์ฌ์ฑ |
closeness_centrality | ๊ทผ์ ์ค์ฌ์ฑ |
eigenvector_centrality | ๊ณ ์ ๋ฒกํฐ ์ค์ฌ์ฑ |
pagerank | ํ์ด์ง ๋ญํฌ(๋ ธ๋ ์ค์๋ ์งํ) |
overall_collaboration_score | ์ ์ฒด ํ์ ํ๊ฐ ์ ์ |
individual_collaboration_score | ๊ฐ์ธ๋ณ ํ์ ํ๊ฐ ์ ์ |
1. ํ์ ํ๊ฒฝ ๋ณํ: Online, Offline
-
ํ ์คํธ ๋ชฉ์
ํ์์์ ๋น๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ์ ๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ์ ๋ฐ๋ฅธ ๊ทธ๋ฃน๊ณผ ๊ฐ์ธ์ ์ฐธ์ฌ๋ ๋ฐ ๋ฐํ๋์ ๋ณํ๋ฅผ ํ์ธํ๋ค.
-
์คํ๊ตฐ ๋ฐ ํต์ ๊ตฐ ์ค๋ช
9์ฐจ ํ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๋น๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๋์์ธ๊ณผ ๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๋์์ธ์ผ๋ก ๋๋์๋ค. ๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ทธ๋ฃน์ 1-8์ฐจ ํ์์ด๋ฉฐ, ๋น๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ทธ๋ฃน์ 9-17์ฐจ ํ์๊ฐ ์ฌ๊ธฐ์ ํด๋นํ๋ค.
-
๊ฒฐ๊ณผ
Online, Offline ํ๊ท ๋ฐํ๋ ์ฐจ์ด
-
ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด๋ก ๋ณผ ์๋ ์์์ง๋ง, ์คํ๋ผ์ธ ํ์๊ฐ ์จ๋ผ์ธ ํ์๋ณด๋ค ๋ฐํ๋์ด ๋ ๋ง์ ๊ฒฝํฅ์ ๋ณด์๋ค.
์ด๋ ์คํ๋ผ์ธ ํ๊ฒฝ์ด ์ฐธ์ฌ์๋ค ๊ฐ์ ์ํต์ ๋ ์ํํ๊ฒ ํ๊ณ , ์ง์ค๋๋ฅผ ๋์ด๋ ํจ๊ณผ๊ฐ ์์ ์ ์์์ ์์ฌํ๋ค.
Online, Offline ํ๊ท ์ํธ์์ฉ ์ฐจ์ด
-
ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด๋ก, ์คํ๋ผ์ธ ํ์๊ฐ ์จ๋ผ์ธ ํ์๋ณด๋ค ์ธํฐ๋์ ์๊ฐ ๋ ๋ง์์ ๋ํ๋ธ๋ค.
์ด๋ ์คํ๋ผ์ธ ํ๊ฒฝ์์ ์ฐธ์ฌ์๋ค์ด ๋ ์ ๊ทน์ ์ผ๋ก ์ํธ์์ฉํ์์ ์์ฌํ๋ค.
-
2. ๋น๊ฒฉ์์ด ์ฌ์ฉ์ ๋ฐ๋ฅธ ๋ณํ
-
ํ ์คํธ ๋ชฉ์
ํ์์์ ๋น๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ์ ๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ์ ๋ฐ๋ฅธ ๊ทธ๋ฃน๊ณผ ๊ฐ์ธ์ ์ฐธ์ฌ๋ ๋ฐ ๋ฐํ๋์ ๋ณํ๋ฅผ ํ์ธํ๋ค.
-
์คํ๊ตฐ ๋ฐ ํต์ ๊ตฐ ์ค๋ช
9์ฐจ ํ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๋น๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๋์์ธ๊ณผ ๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๋์์ธ์ผ๋ก ๋๋์๋ค. ๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ทธ๋ฃน์ 1-8์ฐจ ํ์์ด๋ฉฐ, ๋น๊ฒฉ์์ด๋ฅผ ์ฌ์ฉํ๋ ๊ทธ๋ฃน์ 9-17์ฐจ ํ์๊ฐ ์ฌ๊ธฐ์ ํด๋นํ๋ค.
-
๊ฒฐ๊ณผ
๋น๊ฒฉ์์ด ์ฌ์ฉ ์ฌ๋ถ์ ๋ฐ๋ฅธ ํ๊ท ๋ฐํ๋ ์ฐจ์ด
-
ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด๋ฅผ ๋ณด์๋ค.
์ด๋ ๋น๊ฒฉ์์ด ์ฌ์ฉ์ด ํ์์์์ ๋ฐํ๋์ ์ฆ๊ฐ์ํค๋ ๋ฐ ๊ธฐ์ฌํ์์ ์์ฌํ๋ค.
๋น๊ฒฉ์์ด ์ฌ์ฉ ์ฌ๋ถ์ ๋ฐ๋ฅธ ํ๊ท ์ํธ์์ฉ ์ฐจ์ด
-
ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด๋ฅผ ๋ณด์๋ค.
์ด๋ ๋น๊ฒฉ์์ด ์ฌ์ฉ์ด ์ฐธ์ฌ์๋ค ๊ฐ์ ์ํธ์์ฉ์ ์ฆ๊ฐ์์ผฐ์์ ์๋ฏธํ๋ค.
-
3. ํ์ ํ์ ๋ณํ: Voice, Text
-
ํ ์คํธ ๋ชฉ์
Text ๊ธฐ๋ฐ์ผ๋ก ์งํํ๋ ํ์์ Voice ๊ธฐ๋ฐ์ผ๋ก ์งํํ๋ ํ์์์ ์ฐธ์ฌ์๋ค์ ๋ฐํ๋๊ณผ ์์ฌ์ํต ์์ ๋ณํ๋ฅผ ๊ทธ๋ฃน ๋จ์, ๊ฐ์ธ๋ณ๋ก ํ์ธํ๋ค.
-
์คํ๊ตฐ ๋ฐ ํต์ ๊ตฐ ์ค๋ช
์์ฑ ๊ธฐ๋ฐ์ผ๋ก ํ์๊ฐ ์งํ๋ ํ์ ๋ฐ์ดํฐ์ ๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ์งํ๋ ํ์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ์ฒด ๊ทธ๋ฃน ๋ฐ ๊ฐ์ธ์ ๋ฐํ๋, ์์ฌ์ํต ์๋ฅผ ์ธก์ ํ๋ค.
์์ฑ ๊ธฐ๋ฐ ํ์๋ ๊ฒ๋(Gather)๋ฅผ ํ์ฉํ ํ์ํ์์ ์ง์ ๋ง๋ ์งํํ ํ์๊ฐ ์์ผ๋ฉฐ, ํ ์คํธ ๊ธฐ๋ฐ ํ์๋ ์นด์นด์คํก(Kakao talk)์ ํตํด ์งํ๋์๋ค.
-
๊ฒฐ๊ณผ
Voice, Text ํ๊ท ๋ฐํ๋ ์ฐจ์ด
-
ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด๋ฅผ ๋ณด์๋ค.
์ด๋ Voice ๊ธฐ๋ฐ ํ์์์ ์ฐธ์ฌ์๋ค์ด ๋ ๋ง์ ๋ฐํ๋ฅผ ํ์์ ์์ฌํ๋ค.
Voice, Text ํ๊ท ์ํธ์์ฉ ์ฐจ์ด
-
ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด๋ฅผ ๋ณด์๋ค.
์ด๋ Voice ๊ธฐ๋ฐ ํ์์์ ์ฐธ์ฌ์๋ค ๊ฐ์ ์ํธ์์ฉ์ด ๋ ํ๋ฐํ๊ฒ ์ด๋ฃจ์ด์ก์์ ์๋ฏธํ๋ค.
-
ํ์ ๋ นํ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค(RDB)๋ฅผ ๊ตฌ์ฑํ ํ, ๊ฐ ํ์์ ๋ํ ์ ๋ฐ์ ์ธ ํ์ ์ ์(overall collaboration score), ์๊ธฐ ํ๊ฐ ์ ์(self evaluation score), ํ์ธ ํ๊ฐ ์ ์(others evaluation score)๋ฅผ ์์งํ๋ค.
์ด๋ฌํ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก, ๋ นํ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ ์ ๋ฐ์ ์ธ ํ์ ์ ์, ์๊ธฐ ํ๊ฐ ์ ์, ํ์ธ ํ๊ฐ ์ ์๋ฅผ ์์ธกํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฐํ๊ณ ์ ํ๋ค.
์ด๋ฅผ ์ํด ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ, ํน์ง ์ถ์ถ, ๋ชจ๋ธ ํ์ต ๋ฐ ํ๊ฐ ๊ณผ์ ์ ๊ฑฐ์น๋ฉฐ, ์์ธก ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ต์ ํํ๊ณ ์ ๋ขฐ์ฑ์ ํ๋ณดํ๋ค.
๋ฐ์ดํฐ๋ ํ๋ จ ์ธํธ์ ํ ์คํธ ์ธํธ๋ก ๋ถํ ๋์๋ค. ๋ถํ ๋น์จ์ 70% ํ๋ จ, 30% ํ ์คํธ๋ก ์ค์ ๋๋ค.
๊ฐ ๋ฐ์ดํฐ์ ๋ํด Standard Scaler๋ฅผ ์ ์ฉํ์๊ณ ๊ฐ Speaker ID๋ One-Hot Encoder๋ฅผ ์ฌ์ฉํ์๋ค.
- Linear Regression
- Decision Tree Regressor
- Random Forest Regressor
- XGBoost Regressor
- Gradient Boosting Regressor
- K-Nearest Neighbors Regressor
- LightGBM Regressor
- CatBoost Regressor
- Support Vector Machine (SVM) Regressor
ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ๋ GridSearchCV๋ฅผ ํตํด ์ํ๋๋ฉฐ, ๊ต์ฐจ ๊ฒ์ฆ ๋ํ ์งํ๋์๋ค.
์ฑ๋ฅ ํ๊ฐ๋ ๊ฒฐ์ ๊ณ์(Rยฒ), ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE), ๊ต์ฐจ ๊ฒ์ฆ ์ ์๋ก ํ๊ฐํ๋ฉฐ, ์ฌ๋ฌ ์ฑ๋ฅ ์งํ๋ฅผ ๊ฐ์ค์น ์กฐํฉํ์ฌ ์ต์ข ์ฑ๋ฅ์ ์ฐ์ถํ๋ค.
๋ณธ ํ๋ก์ ํธ๋ ํ๋ ์ฌํ์์ ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ๊ณผ ํ์ ์ ์ธ ์์ด๋์ด ์ฐฝ์ถ์ ์ํด ํ์์ ์ธ ํ์ ๋ฅ๋ ฅ์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ผ๋ก ํ๊ฐํ๊ณ ๋ถ์ํ๋ ์๋ก์ด ์์คํ ์ ๊ฐ๋ฐํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ์๋ค.
ํ๋ก์ ํธ์ ์์์ ๋ค์ํ ๋ฐฐ๊ฒฝ๊ณผ ์ ๋ฌธ์ฑ์ ๊ฐ์ง ๊ฐ์ธ๋ค์ ํจ๊ณผ์ ์ธ ์ํธ์์ฉ์ด ๊ฐ์ธ๊ณผ ์กฐ์ง์ ์ฑ๊ณต์ ์ข์ฐํ๋ ํต์ฌ ์ญ๋์ผ๋ก ๋ถ์ํ๊ณ ์๊ธฐ ๋๋ฌธ์ด๋ค. ์ด๋ฌํ ๋งฅ๋ฝ์์, ๊ฐ๋ฐ๋ ์์คํ ์ ํ์ ๊ฐ์ ์ํธ์์ฉ์ ์ ๋์ ์ผ๋ก ์ธก์ ํ๊ณ , ์ด๋ฅผ ํตํด ํ์ ์ ์ง์ ๊ฐ์ ํ ์ ์๋ ๊ตฌ์ฒด์ ์ธ ๋ฐฉ์์ ์ ๊ณตํ์๋ค.
์ค์ ํ์ ๊ณผ์ ์์์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ๋ถ์ํ์ฌ, ์ฐธ์ฌ์๋ค์ ํ์ ๋ฅ๋ ฅ์ ๊ฐ๊ด์ ์ด๊ณ ์ฒด๊ณ์ ์ผ๋ก ํ๊ฐํ๋ ์ด ์์คํ ์ ํ๋ก์ ํธ ๊ฒฐ๊ณผ๋ฅผ ํตํด ์กฐ์ง ๋ด ํ์ ์ญ๋ ๊ฐํ์ ํ ๊ตฌ์ฑ์ ์ต์ ํ๋ฅผ ์ํ ์ค์ง์ ์ธ ๋๊ตฌ๋ก ํ์ฉ๋ ์ ์๋ค. ๋ํ, ๋ค์ํ ์ฐ์ ๋ถ์ผ์ ์ ์ฉ ๊ฐ๋ฅํ๋ฉฐ, ๊ตญ์ ์ ์ธ ํ๋ก์ ํธ ํ์ด๋ ๋ค์ํ ๋ฌธํ์ ๋ฐฐ๊ฒฝ์ ๊ฐ์ง ํ์๋ค์ด ํจ๊ณผ์ ์ผ๋ก ํ์ ํ ์ ์๋๋ก ์ง์ํ๋ ๋๊ตฌ๋ก์์ ๊ฐ๋ฅ์ฑ์ ๊ฐ์ง๋ค.
ํ๋ก์ ํธ ๊ณผ์ ์์ ๊ฐ๋ฐ๋ ๋ถ์ ๋๊ตฌ๋ค์ ์ค์๊ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ์ฒ๋ฆฌํ๋ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ์์ผ๋ฉฐ, ์ด๋ ํ ๊ตฌ์ฑ์๋ค์ ์ปค๋ฎค๋์ผ์ด์ ํจํด๊ณผ ์ํธ์์ฉ์ ํจ๊ณผ์ ์ผ๋ก ๊ฐ์ ํ๋ ๋ฐ ๊ธฐ์ฌํ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค. ์์ผ๋ก์ ํ๋ก์ ํธ์์๋ ์ด ์์คํ ์ ๋ค์ํ ์กฐ์ง๊ณผ ํ๊ฒฝ์ ์ ์ฉํ์ฌ ๊ทธ ํจ๊ณผ๋ฅผ ๊ฒ์ฆํ๊ณ , ์ถ๊ฐ์ ์ธ ๊ธฐ๋ฅ์ ํตํฉํ์ฌ ๋์ฑ ์ ๊ตํ๊ณ ํฌ๊ด์ ์ธ ํ์ ํ๊ฐ ๋๊ตฌ๋ฅผ ๊ฐ๋ฐํ ๊ณํ์ด๋ค.
์ด๋ฌํ ๋ ธ๋ ฅ์ ํ์ ๊ฐ์์ ์ ์ฌ๋ ฅ์ ์ต๋ํ ๋ฐํํ๊ณ , ์ง์์ ์ผ๋ก ๋ณํํ๋ ์์ ํ๊ฒฝ์ ํจ๊ณผ์ ์ผ๋ก ๋์ํ๋ ๋ฐ ๊ฒฐ์ ์ ์ธ ์ญํ ์ ํ ๊ฒ์ด๋ค.
API๋ ์ฌ๋ฌ ๋ชจ๋๊ณผ ํ์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ผ๋ฉฐ, ๊ฐ๊ฐ์ ๋๋ ํ ๋ฆฌ์ ํ์ผ์ ํน์ ๊ธฐ๋ฅ์ ๋ด๋นํ๋ค.
์ ์ฒด์ ์ธ ๊ตฌ์กฐ๋ ์ต์์ ๋๋ ํ ๋ฆฌ์ ํ์ ๋ชจ๋๋ค๋ก ๊ตฌ์ฑ๋๋ค.
-
์ต์์ ๋๋ ํ ๋ฆฌ
์ ์ฒด API์ ์ง์ ์ ์ด์ ์ฃผ์ ์ค์ ํ์ผ๋ค์ด ํฌํจ๋์ด ์๋ค. ์ฌ๊ธฐ์๋ ์๋ฒ ์คํ์ ์ํ ๋ฉ์ธ ํ์ผ, ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ก์ง, ๋ฐ์ดํฐ ์ ๋ก๋ ์ฒ๋ฆฌ ํ์ผ, Docker ํ๊ฒฝ ์ค์ ํ์ผ ๋ฐ ํ์ํ Python ํจํค์ง ๋ชฉ๋ก์ด ํฌํจ๋๋ค.
-
์ ๋ก๋ ๋ชจ๋
๋ฐ์ดํฐ๋ฅผ ์๋ฒ๋ก ์ ๋ก๋ํ๊ณ , ์ ๋ก๋๋ ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋ฆฌ๋ณด๊ธฐํ๋ฉฐ, ๋ฐ์ดํฐ์ ํ๋ ๋ถ์์ ์ํ ์ ์ฒ๋ฆฌ ๊ธฐ๋ฅ์ ๋ด๋นํ๋ค.
-
๋ฐ์ดํฐ ๋ชจ๋
๋ถ์์ ์ฌ์ฉ๋๋ ์ฃผ์ ๋ฐ์ดํฐ์ ์ ์ ์ฅํ๋ค. ์ด ๋ฐ์ดํฐ์ ์ ํ์ ๋ฐ์ดํฐ, ์ค๋ฌธ์กฐ์ฌ ์ ์, Kakao ๋ฐ์ดํฐ ๋ฑ์ ํฌํจํ๋ฉฐ, ๋ค๋ฅธ ๋ชจ๋์์ ์ ๊ทผํ์ฌ ๋ถ์์ ์ํํ๋ ๋ฐ ์ฌ์ฉ๋๋ค.
-
ํ๋ ๋ถ์ ๋ชจ๋
์ฌ์ฉ์ ํ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ๋ค์ํ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ค. ๋คํธ์ํฌ ์ค์ฌ์ฑ, ํ๋ ๋น๋, ๋ถํ๋ฑ๋, ์ํธ์์ฉ, ์ฌํ ๋คํธ์ํฌ ๋ถ์(SNA) ๋ฑ์ ์ํํ์ฌ ์ฌ์ฉ์ ํ๋์ ์ฌ์ธต์ ์ผ๋ก ์ดํดํ ์ ์๋๋ก ๋๋๋ค.
-
์ฃผ๊ด์ ๋ถ์ ๋ชจ๋
์ฌ์ฉ์ ์ฃผ๊ด์ ์ธ์์ ๋ถ์ํ๋ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ค. ์ฌ๊ธฐ์๋ ์ฃผ๊ด์ ์ธ์๊ณผ ์ค์ ๊ฐ์ ๊ฒฉ์ฐจ ๋ถ์, ๊ฐ๋ณ ์ฌ์ฉ์์ ๋ค๋ฅธ ์ฌ์ฉ์์์ ์ฃผ๊ด์ ๊ด๊ณ ๋ถ์, ๊ฐ๋ณ ์ฌ์ฉ์์ ์๊ธฐ ์ฃผ๊ด์ ์ธ์ ๋ถ์, ์ ์ฒด์ ์ธ ์ฃผ๊ด์ ๋ถ์ ๋ฑ์ด ํฌํจ๋๋ค.
-
A/B ํ ์คํธ ๋ชจ๋
๋ค์ํ A/B ํ ์คํธ๋ฅผ ์ํํ๋ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ค. ์ด ๋ชจ๋์ AB test ์คํ๊ฒฐ๊ณผ๋ฅผ ์๊ฐํํด ๋์ดํ๋ฏ๋ก ์๋น์ค ์ด์ฉ์๊ฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ๊ฒฐ์ ์ ๋ด๋ฆด ์ ์๋๋ก ์ง์ํ๋ค.
-
๋จธ์ ๋ฌ๋ ๋ชจ๋
๋ค์ํ ๋จธ์ ๋ฌ๋ ๋ถ์ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ค. ๊ฐ๋ณ ์ฌ์ฉ์์ ๋ค๋ฅธ ์ฌ์ฉ์์์ ๊ด๊ณ, ๊ฐ๋ณ ์ฌ์ฉ์์ ์๊ธฐ ๋ถ์, ์ ์ฒด์ ์ธ ๋จธ์ ๋ฌ๋ ๋ถ์ ๋ฑ์ ์ํํ์ฌ ๋ฐ์ดํฐ์ ํจํด๊ณผ ์์ธก์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
์ ์ํ | ์ด๋ฏธ๊ฒฝ | ์์ค์ |
---|---|---|
@suntisfied |
@mikyungmon |
@Junyoung0426 |
๊นํ์ | ๋ ธํด์ |
---|---|
@figmarigold115 |
@rohsoo0807 |