言語処理のための機械学習入門

奥村学 東工大教授 工博 監修, 高村大也 東工大准教授 博士(工学)著: 言語処理のための機械学習入門, コロナ社, 2010.

目次

1. 必要な数学的知識 (60ページ)
[教員: 3ページ]
1.1 準備と本書における約束事…1
[1番目・谷: 8ページ]
1.2 最適化問題…4
1.2.1 凸集合と凸関数…6
[2番目・北田: 6ページ]
1.2.2 凸計画問題…12
1.2.3 等式制約付凸計画問題…14
1.2.4 不等式制約付凸計画問題…18
[3番目・吉元: 9ページ]
1.3 確率…20
1.3.1 期待値,平均,分散…23
1.3.2 結合確率と条件付き確率…26
1.3.3 独立性…29
[4番目・岡崎: 7ページ]
1.3.4 代表的な離散確率分布…31
1.4 連続確率変数…37
1.4.1 平均,分散…38
1.4.2 連続確率分布の例…38
[5番目・桐本: 5ページ]
1.5 パラメータ推定法…41
1.5.1 i.i.d.と尤度…42
1.5.2 最尤推定…42
1.5.3 最大事後確率推定…46
[6番目・積田: 7ページ]
1.6 情報理論…49
1.6.1 エントロピー…49
1.6.2 カルバック・ライブラー・ダイバージェンス…51
1.6.3 ジェンセン・シャノン・ダイバージェンス…54
1.6.4 自己相互情報量…54
1.6.5 相互情報量…56
[教員: 3ページ]
1.7 この章のまとめ…58
章末問題…59

2. 文書および単語の数学的表現 (16ページ)
[7番目・谷: 6ページ]
2.1 タイプ,トークン…61
2.2 nグラム…62
2.2.1 単語nグラム…62
2.2.2 文字nグラム…63
2.3 文書,文のベクトル表現…64
2.3.1 文書のベクトル表現…64
2.3.2 文のベクトル表現…66
[8番目・北田: 8ページ]
2.4 文書に対する前処理とデータスパースネス問題…67
2.4.1 文書に対する前処理…67
2.4.2 日本語の前処理…70
2.4.3 データスパースネス問題…71
2.5 単語のベクトル表現…71
2.5.1 単語トークンの文脈ベクトル表現…72
2.5.2 単語タイプの文脈ベクトル表現…73
2.6 文書や単語の確率分布による表現…74
[教員: 2ページ]
2.7 この章のまとめ…75
章末問題…76

3. クラスタリング (22ページ)
[9番目・吉元: 5ページ]
3.1 準備…77
3.2 凝集型クラスタリング…78
[10番目・岡崎: 5ページ]
3.3 k-平均法…82
3.4 混合正規分布によるクラスタリング…84
[11番目・桐本: 7ページ]
3.5 EMアルゴリズム…87
[教員: 5ページ]
3.6 クラスタリングにおける問題点や注意点…94
3.7 この章のまとめ…95
章末問題…97

4. 分類 (48ページ)
[12番目・積田: 11ページ]
4.1 準備…99
4.2 ナイーブベイズ分類器…101
4.2.1 多変数ベルヌーイモデル…102
[13番目・谷: 7ページ]
4.2.2 多項モデル…110
[14番目・北田: 10ページ]
4.3 サポートベクトルマシン…117
4.3.1 マージン最大化…118
4.3.2 厳密制約下のSVMモデル…120
4.3.3 緩和制約下のSVMモデル…124
4.3.4 関数距離…125
4.3.5 多値分類器への拡張…126
[15番目・吉元: 11ページ]
4.4 カーネル法…127
4.5 対数線形モデル…132
4.5.1 素性表現の拡張と対数線形モデルの導入…132
4.5.2 対数線形モデルの学習…134
[16番目・岡崎: 5ページ]
4.6 素性選択…138
4.6.1 自己相互情報量…138
4.6.2 情報利得…141
[教員: 4ページ]
4.7 この章のまとめ…143
章末問題…145

5. 系列ラベリング (15ページ)
[17番目・桐本: 6ページ]
5.1 準備…147
5.2 隠れマルコフモデル…148
5.2.1 HMMの導入…149
5.2.2 パラメータ推定…149
5.2.3 HMMの推論…150
5.3 通常の分類器の逐次適用…151
[18番目・積田: 7ページ]
5.4 条件付確率場…153
5.4.1 条件付確率場の導入…153
5.4.2 条件付確率場の学習…154
5.5 チャンキングへの適用の仕方…159
[教員: 2ページ]
5.6 この章のまとめ…160
章末問題…161

6. 実験の仕方など (18ページ)
[19番目・谷: 4ページ]
6.1 プログラムとデータの入手…162
6.2 分類問題の実験の仕方…163
6.2.1 データの分け方と交差検定…164
6.2.2 多クラスと複数ラベル…165
[20番目・北田: 4ページ]
6.3 評価指標…166
6.3.1 分類正解率…166
6.3.2 精度と再現率…166
6.3.3 精度と再現率の統合…168
[21番目・吉元: 7ページ]
6.3.4 多クラスデータを用いる場合の実験設定…170
6.3.5 評価指標の平均…171
6.3.6 チャンキングの評価指標…175
6.4 検定…175
[教員: 3ページ]
6.5 この章のまとめ…177
章末問題…178

付録…180
A.1 初歩的事項…180
A.2 logsumexp…183
A.3 カルーシュ・クーン・タッカー(KKT)条件…184
A.4 ウェブから入手可能なデータセット…185

引用・参考文献…186
章末問題解答…190
索引…206

参考資料


風間 一洋