徳島大学 人と地域共創センター2022年秋冬期公開講座 [R104]ビジネスに役立つデータ分析(入門編)の資料置き場です。
身近なデータを題材に、データの見方を学びます。データを要約し、グラフで表現することで、意外な特徴を発見し、意思決定につなぐことができるようになります。また必修化された高校情報Iの内容を学ぶこともできます。
- ビジネスにおけるデータ分析の重要性
- 情報化社会とこれから
- ビッグデータとビッグテック
- ビジネスとデータ分析を紐付ける
- データ分析に取りかかる前に…
- 変数
- 表形式のデータ(データフレーム)
- R速習
- データの種類と表現方法
- 尺度水準
- 欠損値と外れ値、誤差
- 記述統計量と分布の可視化
- 代表値(平均値、**値、最頻値)
- 分散
- 標準偏差
- 度数分布表、ヒストグラム
- 箱ひげ図
- データの背景を探る
- 相関関係と因果関係、見せかけの相関
- 共分散
- 相関係数
- 相関係数行列
- クロス集計
- データ可視化
- アンスコムの例
- 単回帰モデル
- 最小二乗法
- 回帰係数
- 決定係数
- 重回帰モデル
- 多重共線性
- 標準化
- 分類モデル
- ロジスティック回帰
- サポートベクトルマシン
- 評価指標
- 主成分分析
- 主成分軸
- クラスタリング
- k-平均法
- 時系列データ
- 地理空間データ
用意したRスクリプトの実行には2つの方法があります。 一つはウェブブラウザ上で行う方法(binderを利用)、もう一つは手元のコンピューター上で行う方法です。 それぞれの方法を以下で説明します。
こちらはウェブブラウザを介して実行する、簡単な方法です。
こちらのボタンをクリックし、しばらく(数秒〜数十分)待ちます。 画面が切り替わり、RStudio Serverのページが表示されたら準備完了です。 必要なパッケージ、Rスクリプトが用意された状態のため、すぐに講座の内容を試すことができます。
RとRStudioがインストールされていることが前提となります。 必要なファイル一式をダウンロードし、手元のRStudioで動かす方法です。
このページ https://github.com/uribo/cue2022aw_r104 の上部にある緑色の"Code"ボタンをクリック、
さらにDownload ZIP
をクリックしてzipファイルをダウンロードします。
zipファイルを展開、cue2022aw_r104.Rproj
ファイルをダブルクリックするとRStudioが起動します。
この状態ではRスクリプトを動かすためのパッケージがインストールされていないため、 次のコマンドをコンソールで実行します。
install.packages("renv")
renv::restore()
パッケージのインストールを促すメッセージが出力されるので、yをコンソール上で入力します。 パッケージのインストールが完了したら準備完了です。
- 【独立行政法人統計センター】SSDSE(教育用標準データセット) https://www.nstac.go.jp/use/literacy/ssdse/
scales::show_col(c("#364968", "#fddf97", "#e09664", "#6c4343", "#ffffff"), ncol = 5, borders = TRUE)