Pythonではじめるテキストアナリティクス入門

参加者

  1. 赤尾 貴仁
  2. 葛西 日向
  3. 鈴木 葵登
  4. 宇川 徹
  5. 中北 雄大
  6. 山本 悠統
  7. 伊藤 圭二郎
  8. 井上 大成
  9. 佐藤 健丈
  10. 前山 皓亮

目次

巻頭言…3

はじめに…6
 0.1 本書のねらい
 0.2 本書の読み方

第I部 テキストアナリティクスの基礎…17
第1章 テキストアナリティクスことはじめ…19 [前山] (19ページ)
 1.1 テキストアナリティクスとは?
 1.2 分析のためのアプローチ
 1.3 分析のための基盤技術
 1.4 まとめ:自然言語処理を学ぶために
第2章 プログラミングの補足知識…38 [井上] (11ページ)
 2.1 文字コード
 2.2 ファイルの入出力
 2.3 正規表現
 2.4 内包表記
 2.5 まとめ:Pythonを使いこなすために
第3章 環境構築…49 (14ページ)
 2.1 Linux
 2.2 macOS
 2.3 Windows
 2.4 Pythonの仮想環境
 3.5 まとめ:より快適な環境を構築するために
第4章 基礎技術…63 [伊藤] (34ページ)
 4.1 基礎的な解析
 4.2 文書の分類・クラスタリング
 4.3 可視化
 4.4 まとめ:より深い分析を実現するために

第II部 テキストアナリティクスの実践…97
第5章 データ収集…99 [佐藤] (9ページ)
 5.1 公開データ
 5.2 社内データ
 5.3 データ購入
 5.4 ウェブクローリング
第6章 観光テキストの解析…108 [鈴木] (34ページ)
 6.1 データの入手:観光テキスト解析に利用できるソーシャルメディアの例
 6.2 口コミを利用した観光地の分析
 6.3 口コミを利用したテーマパークの分析
 6.4 分析上の注意点
 6.5 研究の紹介
第7章 金融・経済テキストの解析…142 [中北] (12ページ)
 7.1 事前準備:金融・経済における極性分析
 7.2 データの入手:金融・経済テキストデータの分析
 7.3 基礎的な解析:基礎的なテキスト分析
 7.4 分析:有価証券報告書を用いた日経平均予想
 7.5 分析上の注意点
 7.6 研究の紹介
第8章 ソーシャルメディアテキストの解析…154 [赤尾] (33ページ)
 8.1 Twitterデータによる世情分析
 8.2 2ちゃんねるデータによる世情分析
 8.3 大規模データ処理に対する工夫
 8.4 研究の紹介

第III部 応用技術・発展的な内容…187
第9章 実践的なテクニック…189 [葛西] (15ページ)
 9.1 単語処理に関するテクニック
 9.2 その他のツールの比較と利用方法
 9.3 まとめ
第10章 深層学習技術…204 [山本] (30ページ)
 10.1 単語分散表現
 10.2 文分散表現
 10.3 BERTをはじめとするTransformerモデルの利用
 10.4 まとめ
第11章 環境構築の要らないテキストアナリティクス…234 [宇川] (13ページ)
 11.1 Google Colaboratoryを利用したテキストアナリティクス
 11.2 自然言語処理APIを利用したテキストアナリティクス
 11.3 まとめ
付録 本書で利用するPythonライブラリ…247 (3ページ) 索引…250


参考資料


風間 一洋