シラバス参照 |
科目一覧へ戻る | 2024/09/20 現在 |
開講科目名 /Course |
◆データサイエンス応用/Advanced Data Science | ||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
時間割コード /Course Code |
R1001087_G1 | ||||||||||||||||||||
開講所属 /Course Offered by |
共通/ | ||||||||||||||||||||
ターム・学期 /Term・Semester |
2024年度/Academic Year 第3クォーター/3Q | ||||||||||||||||||||
曜限 /Day, Period |
金/Fri 6 | ||||||||||||||||||||
開講区分 /Semester offered |
後期/the latter term | ||||||||||||||||||||
単位数 /Credits |
2.0 | ||||||||||||||||||||
学年 /Year |
2,3,4 | ||||||||||||||||||||
主担当教員 /Main Instructor |
西村 竜一 | ||||||||||||||||||||
授業形態 /Lecture Form |
講義・演習 | ||||||||||||||||||||
教室 /Classroom |
東1号館E1-208/E1-208 | ||||||||||||||||||||
開講形態 /Course Format |
遠隔授業(授業回数全体の半分以上) | ||||||||||||||||||||
ディプロマポリシー情報 /Diploma Policy |
|
教員名 /Instructor |
教員所属名 /Affiliation |
---|---|
西村 竜一 | システム工学部(教員) |
三浦 浩一 | システム工学部(教員) |
授業の概要・ねらい /Course Aims |
本授業では、データサイエンス分野における応用基礎レベルの学修の一つとして、「テキストマイニング」を中心とした内容の講義と演習を実施する。演習環境としては、プログラミング言語Pythonを用いる。テキストからの特徴抽出やテキスト分類等の技術を理解し、実際に利用することで、ソーシャル・ネットワーキング・サービス(SNS)や新聞記事、書籍、論文等のテキストデータから様々な発見を得るための手法を身につける。関連して、音声言語やビッグデータ、Web API等の取り扱いについて体験的に学ぶことができる。 |
---|---|
到達目標 /Course Objectives |
1. Pythonを用いてデータを処理し、データ中に含まれる特徴や傾向を明らかにすることができる。 2. 図表等を用いながら実験の結果をレポートとしてまとめることができる。 3. 世の中に存在する各種データを調査し、それらを利用したデータ利活用の実験を実行することができる。 |
成績評価の方法・基準 /Grading Policies/Criteria |
レポート・課題(100%) 講義や演習内容の理解を確認するための課題(レポートや小論文、Pythonを用いたプログラムのソースコード等)の提出を必須とする。課題の未提出がある場合は、単位を認定しない。また、欠席や動画教材の未視聴等があり、授業への参加が確認できない場合は減点とする。 |
教科書 /Textbook |
特になし。Moodleコースを通じて、資料(動画教材や各種ファイル等)を配布する。 |
参考書・参考文献 /Reference Book |
※ 下記の書籍は、自習用の参考として紹介するものです。授業の中で利用することはありません。 ※ Pythonでテキストマイニングを扱った書籍は数多く出版されているため、次に示す書籍に限らず、自分に合った書籍を探してほしい。 東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~, 塚本邦尊, 山田典一, 大澤文孝, マイナビ出版, ISBN:9784839965259, 3,278円 15Stepで踏破 自然言語処理アプリケーション開発入門, 土屋 祐一郎, リックテレコム, ISBN:9784865941326, 3,300円 Pythonで動かして学ぶ自然言語処理入門, 柳井 孝介, 庄司 美沙, 翔泳社, ISBN:9784798156668, 3,520円 |
履修上の注意 ・メッセージ /Notice for Students |
「データ」の急速な利用拡大にともない、データサイエンスの分野が急速に拡大している。その影響の範囲は、いわゆる文系・理系を問わない。データの利活用に関する理解は、今や基本的な教養であると言える。データ利活用の現場では、プログラミング言語Pythonが多く利用されている。本授業は、Pythonプログラムを道具として利用し、実際に手を動かしながらデータサイエンスに関する理解を深めることができる応用基礎レベルの授業である。 ※本授業は「連携展開科目」として開講されるが、システム工学部の学生が本授業の単位を取得した場合は、「専門教育科目」の「その他メジャー科目」の単位として認定される。 ※本授業を含めたデータサイエンス科目群のPR動画(YouTube)を公開している。視聴して履修の参考にしてほしい。https://www.wakayama-u.ac.jp/news/2022020100056/ |
履修する上で必要な事項 /Prerequisite |
本授業は、最終回を除き、遠隔授業(オンデマンド型)で実施する。指定された〆切までに動画教材を視聴し、Moodle経由で課題を提出する必要がある。なお、最終回のみ、同時双方向型(Teams)で実施する。 授業内でPCを使用するため、各自準備すること。なお、本授業の中では、PCのサポートは行わない。メール、ウェブブラウザやエディタ等のプログラミングに必要な基本的なPCの操作方法は、各自が事前に習得していることを前提とする。 ※本授業は、「データサイエンス基礎」でも利用したPythonの実行環境を使って授業を進める。そのため、Pythonの導入(インストール)については、本授業の中では解説をしない。ただし、本授業ではじめてPythonを利用する受講生のための補足的な資料は用意する。 |
履修を推奨する関連科目 /Related Courses |
データサイエンスへの誘いA/B, データサイエンス入門A/B, データサイエンス基礎, データサイエンス実践, 数理・データサイエンス・AI活用PBL |
授業時間外学修についての指示 /Instructions for studying outside class hours |
授業計画に沿って、準備学習と復習を行うこと。さらに、授業内容に関連する課題に関する調査・考察を含めて、毎回の授業ごとに自主的学習を求める。 本授業では、Pythonのプログラムを道具として利用することを前提としている。プログラミングを学ぶこと自体を授業の主たる目的とはしていない。授業の中で、Pythonプログラムの具体的なコードを例示し、解説は行うが、その内容を深く理解するためには、自主的な学習が必要である。 |
その他連絡事項 /Other messages |
授業内容の質問等は、Moodleのフォーラムを活用すること。また、週1回、Teamsを用いた同時双方向型のオンラインサポート室を開設する。オンラインサポート室は自由参加とするが、積極的に参加して、疑問を解消することを期待している。オンラインサポート室の日程等については授業内で案内する。 |
授業理解を深める方法 /How to deepen your understanding of classes |
本授業では、ウェブ等の資料の検索・調査を通じて自らが課題を設定する課題解決型学習を導入している。最終課題には、自ら設定した課題をまとめた小論文の提出を課している。 【「アクティブ・ラーニング」実施要項②PBL学習, ⑤学生自らが具体的なテーマや対象を設定する学習, ⑥学生自らが実施する調査やトレーニングを必要とする学習】 |
オフィスアワー /Office Hours |
西村教員がとりまとめを行います。下記までご連絡ください。 ※ できる限り、事前にメールでご連絡ください。 メール:nisimura@wakayama-u.ac.jp (西村竜一) (オフィスアワー) 授業開講時:水曜日16:30〜18:00、北1号館7階A716室 |
科目ナンバリング /Course Numbering |
C60032J1111032i4 |
No. | 回(日時) /Time (date and time) |
主題と位置付け /Subjects and instructor's position |
学習方法と内容 /Methods and contents |
備考(担当) /Notes |
---|---|---|---|---|
1 | 1 | テキスト処理の基礎 | 講義と演習: 開発環境と実⾏環境 テキストのデータ表現・文字コード テキストデータの加工・正規表現 |
※PCを使用・遠隔授業(オンデマンド型) |
2 | 2 | テキストの処理単位と形態素解析 | 講義と演習: 自然言語処理の活用事例 テキストの処理単位(文字・文・単語) 形態素解析 |
※PCを使用・遠隔授業(オンデマンド型) |
3 | 3 | テキストの前処理と整形 | 講義と演習: テキストデータの取得 クレンジング・外れ値処理 テキストの正規化 |
※PCを使用・遠隔授業(オンデマンド型) |
4 | 4 | 特徴抽出と可視化 | 講義と演習: Bag of Words・TF-IDF ベクトルの可視化・ヒートマップ 語彙の制限・ストップワード |
※PCを使用・遠隔授業(オンデマンド型) |
5 | 5 | テキストの分類 | 講義と演習: ベクトル間類似度 機械学習(サポートベクタマシン等) 交差検証法 |
※PCを使用・遠隔授業(オンデマンド型) |
6 | 6 | 統計モデルの利用 | 講義と演習: N-gramモデル・最尤推定 未知語・カットオフ スコアリング |
※PCを使用・遠隔授業(オンデマンド型) |
7 | 7 | テキストのベクトル表現 | 講義と演習: one-hotエンコーディング 単語分散表現・Word2Vec 学習⽤データと学習済みモデル |
※PCを使用・遠隔授業(オンデマンド型) |
8 | 8 | 深層学習の基礎と展望 | 講義と演習: ニューラルネットワークの原理 ディープニューラルネットワーク(DNN) 深層学習・AIのフレームワーク(開発環境) |
※PCを使用・遠隔授業(オンデマンド型) |
9 | 9 | データの収集 | 講義と演習: Webクローリング スクレイピング Webページの構造解析・CSSセレクタ |
※PCを使用・遠隔授業(オンデマンド型) |
10 | 10 | データ表現とWeb API | 講義と演習: 構造化データ・半構造化データ CSV・JSON・XML ソーシャルメディアデータ |
※PCを使用・遠隔授業(オンデマンド型) |
11 | 11 | 音声言語の利用 | 講義と演習: 音声データの記録形式・音声コーパス 音声認識・音声合成・音声対話 AI技術の応用システム(スマートスピーカー・AIアシスタント等) |
※PCを使用・遠隔授業(オンデマンド型) |
12 | 12 | ビッグデータの利用 | 講義と演習: ビッグデータの収集・蓄積 クラウドサービス ビッグデータの活用事例(Wikipediaデータ等) |
※PCを使用・遠隔授業(オンデマンド型) |
13 | 13 | 実社会データの調査と実験による仮説の検証 | 講義と演習: 仮説検証・知識発見 データ駆動型社会・Society 5.0 データサイエンス活用事例・AIの社会実装 小論文テーマの決定・実験 |
※PCを使用・遠隔授業(オンデマンド型) |
14 | 14 | セキュリティと社会ルール | 講義: 人工知能(分類・応用・歴史) 人工知能とデータサイエンス セキュリティの3要素(機密性、可用性、完全性)・データの受け渡し・データの暗号化と復号化 ELSI(倫理的・法的・社会的な課題)・プライバシー保護・個人情報の取り扱い・匿名加工情報・仮名加工情報・著作権・AI倫理 |
※PCを使用・遠隔授業(オンデマンド型) |
15 | 15 | 小論文課題 | 演習: 小論文の作成・添削指導 |
※PCを使用・遠隔授業(Teams同時双方向型) |