/ml-study

매주 머신러닝 스터디를 진행하고 있어요 (since. 2019.5)

ML-study 발표 주제

2023

  • 공기압축기 이상 판단대회
  • Pythonic Code
  • Online learning vs Offline learning
  • 데이콘 Basic 전화 해지 여부 분류 AI 경진대회 리뷰
  • CDP 플랫폼 소개 및 사례 설명
  • Linear Classifier
  • 도커와 쿠버네티스, BentoML 기본 개념과 우당탕탕 서빙 환경 구축기
  • 데이터 불균형 문제 해결 방법 살펴보기 ( image data )
  • 적은 수의 labeled data로 분류 성능 높이기 (PET, Pattern Exploiting Training)
  • [Kaggle] Google - Isolated Sign Language Recognition
  • Rust로 해보는 고성능 Python 확장 모듈 만들어보기
  • 스마트 공장 제품 품질 상태 분류 AI 온라인 해커톤, 자동차 충돌 대회 후기
  • Dacon Car Crash 대회 마감 후기
  • docker 개발환경 소개 및 팁
  • open3d 간단한 코드 사용해보기
  • Optimization 정리
  • 연금저축 종목 선택하기 (feat. 유전알고리즘)
  • Delhi weather forecasting
  • ChatGPT 활용 AI 경진대회
  • 시멘트 강도 예측
  • 2023년 광진구 빅데이터 분석 공모전 with gpt-3
  • 강화학습 개념 및 밴딧 알고리즘 소개
  • 데이콘 차량충돌 대회
  • CAM ( Class activation mapping ) 간단한 소개
  • 지게차 주행 환경 만들기
  • Predict Student Performance from Game Play 살펴보기
  • Delhi weather forecasting
  • Data Centric AI 개념 훑기
  • (논문리뷰) Explainable Recommendation: A Survey and New Perspectives
  • ChatGPT 학습 방법
  • Entity Extraction-BERT 코드 리뷰
  • NFL Health & Safety - Helmet Assignment(2022) 소개 및 대회 Solution Review
  • 시각화를 위한 차원축소 방법론, PaCMAP 논문 리뷰
  • 소비자 수요예측
  • kaggle godaddy microbusiness density baseline 코드 review
  • 모델 성능 추적 테스트 결과 공유
  • Nerf: Representing Scenes as Neural Radiance Fields for View Synthesis 논문 리뷰
  • Transformer 모델 소개
  • Medical image Challenge review : TIGER
  • Kaggle (RSNA Screening Mammography Breast Cancer Detection)
  • Book review - Designing Marching Learning System
  • toy project 소개 (강아지 -> 사람) 스타일 갠
  • vision 관련 논문 리뷰 및 계획
  • 추천시스템(Recommendation System) 개요 및 간단한 실습
  • 이미지 생성 AI의 발전 타임라인 소개
  • 캐글 상위 1% 비법 공유 Competition :Tensorflow – Help Protect the Great Barrier Reef
  • 전기 가격 예측 데이터 EDA / Apache superset dashboard 간단 시연
  • 데이콘: 자동차 충돌분석 대회
  • DBA는 무슨일을 하는지!, 데이터모델링이란!

2022 하반기

  • SNN소개
  • pytorch 2 변경된 부분
  • Multi-Armed Bandit
  • 데이터로 경험을 디자인하라
  • 수소충전소 구축 입지 선정 의사결정 지원시스템 (MCLP)
  • 데이터스토어 소개 및 시계열데이터베이스 중 influxdb 리뷰
  • 업스테이지 Tech talks 다시 보기
  • 정신과 약물 순응도 향상 프로그램을 위한 알약 인식 알고리즘
  • 빅콘테스트 2022: 다각적 모델을 활용한 대출 신청 여부 예측과 고객 군집 별 서비스 메시지 제안
  • 건설기계 오일 상태 분류 AI 경진대회
  • Knowledge Distillation 설명
  • U+ 아이들나라 추천 대회: Neural Collaborative Filtering
  • backpropagation 구현
  • 시계열 분석 기반 용해물 품질 예측 AI 모델 개발
  • 빈도주의 vs 베이지안 통계 비교
  • 통신장비 수요 예측 프로젝트
  • ML service deployment
  • ai ground 아이들나라 추천 모델: Neural Collaborativs filtering
  • 짧은 Pytorch-tabnet 사용후기
  • Elo Merchant Category Recommendation 필사
  • BERT 소개
  • Pallete 모델 학습 및 결과 공유
  • diffusion 모델 개요
  • 캐글: FeedbackPrize / NLP
  • 태양광 발전량 예측을 위한 기상데이터 수집
  • whisper service 만들어 보기
  • abNet 실제 사용 짧은 후기 + pytorch-tabnet 모듈 사용 방법
  • Fast API & 도커 활용
  • 데이터 인프라스트럭처 소개
  • 이미지 개인정보탐지기술 소개 (도입 사례)
  • MCMC 샘플링 소개
  • 시계열 정상성과 AR모델
  • Customer Sementation & RFM Analysis
  • cuML 소개 및 성능 비교
  • 000 투자 산정 최적화 프로젝트 사후 평가
  • 유연탄가격예측 프로젝트
  • 추천시스템 개론(이해해보기)
  • 그래픽스 개략적인 설명
  • ood-cv 진행과정 및 결과
  • 금융 머신러닝 개론
  • 클린코드: 파이썬스러운 코드
  • Dacon: 데이콘 제주도 도로 교통량 예측
  • Kaggle: Costa Rican Household Poverty Level Prediction (2018)
  • 한국어 전처리 및 NPLM
  • FSI Data Challenge 대회 리뷰
  • Why CNN?
  • 태양광 접속반 건전성 평가
  • 머신러닝 엔지니어링 - 전처리부터 모델서빙관리까지. 러닝스푼즈 강의 공유 1/2 주차
  • 농산물 가격 예측대회 baseline 코드 리뷰
  • What is MLOps
  • 모델 최적화 : 목적함수
  • 네이버 웹툰 댓글, 별점 기초 EDA 및 클러스터링 시도
  • Churn Predicion 내용 정리
  • Fine-Tuning 개념 소개 및 질문
  • MNIST FASHION 기본 소스 리딩
  • 탭넷 논문 리뷰
  • ARIMA를 통해 본 시계열 분석

2022 상반기

  • [Causal Discovery] PC 알고리즘
  • streamlit 활용
  • SLASH 22 - 요약공유
  • 베이지언 vs 빈도주의 통계
  • 회귀불연속설계(RDD; Regression Discontinuity Design)
  • LDA 설명
  • orthogonal vector 만들기
  • Dbscan 차근차근 이해하기
  • 선형대수학 - 정규방정식
  • MAB intro & offline평가
  • 고전(?) 비전 개요
  • 주식 보유일 예측
  • 품질좋은와인을고르는방법
  • 정규화 모형(Regularization Models)
  • 캐글 데이터 활용한 얼굴형 분류
  • A Unified Approach to Interpreting Model Predictions 논문 개요
  • 이미지 내의 개인정보 탐지 기술' 소개
  • 쿠버네티스 입문
  • Xgboost와 사이킷런을 활용한 그레디엄트 부스팅
  • 토픽모델링(LSA, LDA) 소개
  • 이중차분법(DID; Difference In Difference)
  • Tree기반 분류모델에 categorical feature가 좋은지 continuous feature가 좋은지
  • soynlp 토크나이저
  • PyOD 이상치 탐지 라이브러리 탐색
  • AWS S3와 Sagemaker로 Kaggle 데이터 분석하기
  • 유럽 축구리그 비교
  • StarSpace : Embed All The Things
  • PEP 8 style guide
  • Permutation Importance
  • Least square problem with Geometry
  • FastText: Enriching Word Vectors with Subword Information
  • Dacon Computer Vision 이상치 탐지 알고리즘 대회
  • 구글의 거대 언어모델 PaLM 간단 소개
  • 데이터 불균형 관련 간단한 코드 구현
  • 자동차 데이터 분석내용 공유
  • MAB(Multi Armed Bandit)
  • 시계열 데이터 예측 모델링(Stacked Hybrids)
  • 다중공선성이 Tree 기반 모델에 미치는 영향
  • 개미 집단 최적화 (ACO, Ant Colony Optimization)
  • AWS Deep Racer 강화학습 Demo
  • Vector space, Words embedding 소개
  • predict accident risk score for location baseline
  • <머신러닝 디자인 패턴> 책 중 <문제표현 디자인 패턴> 챕터 소개
  • Kaggle에서 많이 쓰이는 라이브러리 소개
  • XAI(SHAP)
  • 데이터 버젼관리 테스트 내용 공유
  • 최저임금 연구 보완 및 Catboost Feature Importance
  • H&M EDA
  • Association Rule Mining
  • TPS 문제 및 간단 EDA 결과 공유
  • 시계열 데이터 전처리(Denoising Method)
  • 그래프 인공신경망
  • 설문 데이터 자연어 전처리 내용 공유
  • 데이터 불균형 관련 논문 리뷰
  • [딥러닝을 이용한 파이토치] 책 공부 내용 공유
  • Computer vision in Android
  • 군집분석(clustering) 기초 정리
  • 인과분석 컨셉과 방법(Confounder)
  • 기계학습을 활용한 최저임금의 효과 추정 연구내용 발표
  • Doc2Vec을 활용한 유사 취업공고 찾기
  • Tabnet 논문 리뷰
  • 추천시스템 기초 구현
  • kaggle에 사용된 머신러닝 기법
  • Face Swap (DeepFaceLab) 논문 리뷰
  • 추천 시스템 기초(Matrix Factorization)
  • [kaggle] riiid-test-answer-prediction 필사
  • compound classification 모델
  • 강화학습 소개 및 구현 사례
  • 차량 경로 문제 (VRP, vehicle routing problem)
  • 인공지능을 이용한 미세먼지 추정 연구내용 발표 (Sentinel-5P based estimation of PM2.5 concentrations across Thailand using TabNet)
  • 머신러닝 디자인 패턴(ML Ops) 도서
  • mlops 관련 구글 기술문서 간단 리뷰
  • 초급 파라미터 튜닝