![]() ![]() |
科目一覧へ戻る | 2020/05/12 現在 |
開講科目名 /Course |
データサイエンス応用Ⅰ |
---|---|
時間割コード /Course Code |
R1001028_G1 |
開講所属 /Course Offered by |
共通/ |
ターム・学期 /Term・Semester |
2020年度/Academic Year 第3クォーター/3Q |
曜限 /Day, Period |
火/Tue 5 |
開講区分 /semester offered |
第3クォーター/3Q |
単位数 /Credits |
1.0 |
学年 /Year |
2,3,4 |
主担当教員 /Main Instructor |
西村 竜一 |
科目区分 /Course Group |
_ |
授業形態 /Lecture Form |
|
教室 /Classroom |
学術情報センター第2演習室/学術情報センター第2演習室 |
教員名 /Instructor |
教員所属名 /Affiliation |
---|---|
西村 竜一 | システム工学部(教員) |
三浦 浩一 | システム工学部(教員) |
授業の概要・ねらい /Course Aims |
本授業では、Pythonを使ったデータサイエンスの学修の一つとして、テキストマイニングを中心とした講義と演習を実施する。テキストからの特徴抽出、分類などを応用することで、ソーシャル・ネットワーキング・サービス(SNS)や新聞記事、書籍、論文等のテキスト情報から様々な傾向を発見するための手法の修得を目指す。特に、「データサイエンス応用I」では、整ったテキストデータである大規模コーパスを対象とした処理の実際を学ぶ。 |
---|---|
到達目標 /Course Objectives |
1. Pythonを使ってテキストデータを適切に処理し、コーパス中に含まれる特徴や傾向を明らかにすることができる。 2. ビッグデータ(大容量データ)処理の一つとして、大規模コーパスの計算機上での処理方法を説明することができる。 3. 図表等を用いて、演習(実験)の結果をレポートとしてまとめることができる。 |
成績評価の方法・基準 /Grading Policies/Criteria |
レポート・課題(100%)。毎回、講義内容の理解度を確認するレポート及び実習(Pythonを利用したプログラミング)の課題の提出を必須とします。レポート・課題の未提出がある場合は、単位を認定しません。また、欠席過多の場合も不合格となります。 |
教科書 /Textbook |
特にありません。 |
参考書・参考文献 /Rreference Book |
適時、紹介する他、資料を配布します。 |
履修上の注意 ・メッセージ /Notice for Students |
「データ」の急速な利用拡大にともない、データサイエンスの分野が急速に拡大しています。この影響は、文系・理系を問いません。データの利活用に関する最低限の理解は、基本的な教養にもなっています。また、データサイエンスの分野では、データ解析の多くにPythonが利用されています。この講義を履修すると、データサイエンスの基本事項を修得するとともに、Pythonの基本操作も修得することができます。そのためには、積極的に参加し、実際に手を動かしながら学習を進めてください。 |
履修する上で必要な事項 /Prerequisite |
特にありません。 |
履修を推奨する関連科目 /Related Courses |
データサイエンス基礎I/II |
授業時間外学修についての指示 /Instructions for studying outside class hours |
本授業の授業計画に沿って、準備学習と復習を行ってください。さらに、授業内容に関連する課題に関する調査・考察・プログラミングスキルを含めて、毎回の授業ごとに自主的学修を求めます。 なお、本授業では、自主的な学習の環境を整備するために、授業を録画したビデオアーカイブを公開します。 |
その他連絡事項 /Other messages |
授業内でPCを使用するため、各自持参するようにしてください。本授業の中では、PCのサポートは行いません。メール、ウェブブラウザやエディタ等のプログラミング実習に必要なPCの操作方法は、各自が事前に習得していることを前提として授業を実施します。 |
授業理解を深める方法 /How to deepen your understanding of classes |
本授業は、受講生の主体的な創意・工夫による課題解決を目指すPBL学習を含みます。 |
オフィスアワー /Office Hours |
質問等は、西村教員がとりまとめを行います。下記までご連絡ください。 メール:nisimura@wakayama-u.ac.jp (西村竜一) オフィスアワー: (授業開講時)水曜日16:30〜18:00、北2号館6階S604室 可能な限り、事前にメールでご連絡ください。 |
科目ナンバリング /Course Numbering |
C9340003J |
高等教育無償化に関する特記事項 /Special note on free higher education |
No. | 回(日時) /Time (date and time) |
主題と位置付け(担当) /Subjects and instructor's position |
学習方法と内容 /Methods and contents |
備考 /Notes |
---|---|---|---|---|
1 | 1. コンピュータによる文字列・テキスト処理の基礎 2. 形態素解析と単語・文のベクトル表現 3. ベクトル表現を用いたテキストからの特徴抽出 4. 日本語の処理 5. 統計的言語処理 6. 確率モデルによるテキスト分類 7. 単語辞書とコーパス 8. 大規模コーパスを用いたテキストマイニング実験 |
|||
2 | ||||
3 | ||||
4 | ||||
5 | ||||
6 | ||||
7 | ||||
8 | ||||
9 | ||||
10 | ||||
11 | ||||
12 | ||||
13 | ||||
14 | ||||
15 | ||||
16 | ||||
17 | ||||
18 | ||||
19 | ||||
20 | ||||
21 | ||||
22 | ||||
23 | ||||
24 | ||||
25 | ||||
26 | ||||
27 | ||||
28 | ||||
29 | ||||
30 |