シラバス参照 |
科目一覧へ戻る | 2024/04/11 現在 |
開講科目名 /Course |
◆データサイエンス入門B/Introduction to Data Science B | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
時間割コード /Course Code |
G1001048_G1 | |||||||||
開講所属 /Course Offered by |
共通/ | |||||||||
ターム・学期 /Term・Semester |
2024年度/Academic Year 第4クォーター/4Q | |||||||||
曜限 /Day, Period |
木/Thu 6 | |||||||||
開講区分 /Semester offered |
第4クォーター/4Q | |||||||||
単位数 /Credits |
1.0 | |||||||||
学年 /Year |
1,2,3,4 | |||||||||
主担当教員 /Main Instructor |
吉野 孝 | |||||||||
授業形態 /Lecture Form |
講義・演習 | |||||||||
教室 /Classroom |
東1号館E1-208/E1-208 | |||||||||
開講形態 /Course Format |
遠隔授業(授業回数全体の半分以上) | |||||||||
ディプロマポリシー情報 /Diploma Policy |
|
教員名 /Instructor |
教員所属名 /Affiliation |
---|---|
西村 竜一 | システム工学部(教員) |
三浦 浩一 | システム工学部(教員) |
吉野 孝 | システム工学部(教員) |
授業の概要・ねらい /Course Aims |
R を用いたデータサイエンスの入門となる講義を実施する。R は、フリーの統計解析向けのプログラミング言語およびその開発実行環境である。データを適切に処理・ 分析し、データの特徴を数値化または視覚化する技法を習得する。図表等で得られた結果の解釈の方法も身につける。この授業では、特に、Rを用いたデータサイエンスの基本的な手法について講義を行う。 |
---|---|
到達目標 /Course Objectives |
1.データサイエンスの基本的な手法の特徴を理解し、説明することができる。 2.Rを用いて、データサイエンスの基本的な手法を利用できる。 3.データを適切に処理し、データの特徴を数値化、視覚化する技法を習得する。 4.図表等で与えられた結果の解釈方法を身につける。 |
成績評価の方法・基準 /Grading Policies/Criteria |
小テスト・課題レポート100%。毎回の講義内容の理解度を確認するための小テスト・レポート課題の提出が必要です。また、小テストやレポートの提出がされていても、講義動画の視聴がされていない場合は、未受講と判断します。単にレポート課題が提出されていても、内容が不十分な場合には、評価が低くなります。 |
教科書 /Textbook |
Rで学ぶ統計的データ解析、講談社、ISBN-13 : 978-4065186190,3,300円 |
参考書・参考文献 /Reference Book |
※下記の書籍は自習用の参考として紹介するものです。授業の中で利用することはありません。 ・R言語ではじめるプログラミングとデータ分析、ソシム、ISBN-10 : 4802612389,3,300円 Rの入門とデータ分析の話として良いと思います。 ・Rによるデータサイエンス(第2版):データ解析の基礎から最新手法まで ,森北出版,ISBN-10 : 462709602X,3,960円 データサイエンスの少し高度な内容として良いと思います. ・実践Data Scienceシリーズ ゼロからはじめるデータサイエンス入門 R・Python一挙両得、講談社、ISBN-13 : 978-4065132326,3,520円 内容は重なっていますが、別の説明の仕方をしています。 |
履修上の注意 ・メッセージ /Notice for Students |
・PC利用(BYOD) ・「データ」の急速な利用拡大にともない、データサイエンスの分野が急速に拡大しています。この影響は、文系・理系を問いません。データの利活用に関する最低限の理解は、基本的な教養になっています。この講義を履修すると、データサイエンスの基本的な事項を修得したこになります。Rの操作を修得すると、自分で収集したデータなどの分析もできるようになります。積極的に参加してください。 ・本授業を含めたデータサイエンス科目群のPR動画(YouTube)を公開しています。視聴して履修の参考にしてほください。https://www.wakayama-u.ac.jp/news/2022020100056/ |
履修する上で必要な事項 /Prerequisite |
・授業内でPCを使用する。 ・この授業は、基本は、動画配信によるオンデマンド型遠隔授業で実施します。また、講義の中では、PCを用いた演習があります。 ・基本はオンデマンド型ですが、フォローアップ講義とし、同時双方向型のビデオ会議(Teams)による講義を一回実施します。 ・オンデマンド型、同時双方向型のビデオ会議(Teams)の講義では、視聴状況も確認します。視聴していない場合には、小テストやレポートの提出がされていても、未受講と判断します。 ・小テストは、Moodle上で実施します。 ・レポート提出は、Moodle経由での提出となります。 |
履修を推奨する関連科目 /Related Courses |
データサイエンスへの誘いA/B,データサイエンス入門A,データサイエンス基礎,データサイエンス応用,データサイエンス実践 |
授業時間外学修についての指示 /Instructions for studying outside class hours |
本授業の授業計画に沿って、準備学習と復習を行ってください。さらに、授業内容に関連する課題に関する調査・考察を含めて、毎回の授業ごとに自主的学習を求めます。 |
その他連絡事項 /Other messages |
教材は、毎週配信されます。指定された〆切までに動画教材の視聴を完了して、小テストの受験、課題提出をしてください。 この講義の教材は、和歌山県データ利活用推進センターの協力のもとに作成されています。 |
授業理解を深める方法 /How to deepen your understanding of classes |
Rの操作方法やプログラミングの理解のためには、実際に自分で入力して、試してみることが重要です。各回の講義は、相互に関係していますので、講義の復習や課題の復習をして、理解を深めて下さい。 【「アクティブ・ラーニング」実施要項 ⑥学生自らが実施する調査やトレーニングを必要とする学習】 |
オフィスアワー /Office Hours |
本授業に関する質問や相談等は、Moodleのフォーラム(掲示板)を用いて随時受け付けます。 また、本授業は、同時双方向型のビデオ会議(Teams)を用いたサポート室を開設します(吉野、三浦、西村が対応)。開設時間は授業の中で案内します。 問い合わせ用メールアドレス(ds-class@ml.wakayama-u.ac.jp) |
科目ナンバリング /Course Numbering |
C60031J1010021d2 |
No. | 回(日時) /Time (date and time) |
主題と位置付け(担当) /Subjects and instructor's position |
学習方法と内容 /Methods and contents |
備考 /Notes |
---|---|---|---|---|
1 | (1) | 決定木 | ・決定木とは ・同質性または不純度の測定 ・Rの演習 |
・PCを使用・遠隔授業 (オンデマンド型) |
2 | (2) | k近傍法 | ・k近傍法とは ・kの選び方 ・k近傍法の長所と短所 ・Rの演習 |
・PCを使用・遠隔授業 (オンデマンド型) |
3 | (3) | アソシエーション分析 | ・アソシエーション分析とは ・相関ルール ・相関ルールの評価指標 ・Rの演習 |
・PCを使用・遠隔授業 (オンデマンド型) |
4 | (4) | 主成分分析 | ・主成分分析とは ・主成分分析のRの出力結果 ・主成分分析の解釈 ・Rの演習 |
・PCを使用・遠隔授業 (オンデマンド型) |
5 | (5) | k平均法 | ・クラスター分析 ・k平均法とは ・kの決定方法 ・Rの演習 |
・PCを使用・遠隔授業 (オンデマンド型) |
6 | (6) | 階層的クラスタリング | ・階層的クラスタリング ・距離の指標 ・凝集型階層的クラスタリング |
・PCを使用・遠隔授業 (オンデマンド型) |
7 | (7) | テキストマイニング | ・自然言語処理 ・自然言語処理技術の紹介 ・自然言語処理の難しさ ・頻度分析 |
・PCを使用・遠隔授業 (オンデマンド型) |
8 | (8) | 課題解説や総評等 | 同時双方向型ビデオ会議(Teams)による授業を実施 | 第8回のみ同時双方向型ビデオ会議(Teams)での実施です |