Language:

2021年度 データサイエンス論 (4105)

授業科目基本情報PDFダウンロード

科目区分 専門科目 教職科目 指定なし
単位数 1 選択・必修・自由 選択
授業形態 講義 主な使用言語 英語
開講時期 履修登録システム 使用する
履修登録期間 2021/04/13~2021/05/14 履修取消期限 2021/06/04

教育プログラム別の履修区分

プログラム名 IS CB BS BN MS CP DS
履修区分
コア科目 C
履修方法 ・修士論文研究又は特別課題研究を履修する場合は、基盤科目及び専門科目から12単位以上履修すること。
・課題研究を履修する場合は、基盤科目及び専門科目から14単位以上履修すること。
・コア科目の履修方法については、入学年次の教育課程表の(2)履修方法を参照すること。

授業科目概要

担当責任教員 中村 哲
担当教員 中村哲、船津公人、浦岡行治、作村諭一、宮尾知幸、小野直亮、田中宏季、品川政太朗、小鍛冶俊也
教育目的/学修到達目標 【教育目的】
センシング装置の小型化,高速化,ネットワークの高速化,インターネットの大規模化により,テキストからセンサーデータに至る多様で膨大なデータが出現した.これまでの仮説に基づき実験を行って検証を行うスタイルに対し,今後はデータから人工知能理論を活用し仮説を作り実験を行うデータ駆動型科学が重要となる.本講義では,多様なデータに基づくデータ駆動型サイエンスの理論,最先端の方法,実際の利用について学ぶ.

【学修到達目標】
1) データサイエンスに関する基本概念について説明、記述できる。
2) データサイエンスの基本要素技術について整理、議論ができる。
3) データサイエンスの関連要素技術を俯瞰できる。
4) データサイエンスの基本要素技術を自らの研究に適用できる。
授業概要/指導方針 【授業概要/指導方針】
本授業では多様な大規模データに基づくデータ駆動型サイエンスに必要な人工知能・機械学習の理論、データサイエンスの理論を学ぶ。さらに、インターネット上のテキストデータマイニング,バイオインフォマティクス、ネットワークバイオロジー、マテリアル・ケモインフォマティックスにおけるデータ駆動型サイエンスについて学ぶ.

【授業時間外学修(予習・復習等)の目安】
各回毎に授業内で与えられたAssignmentの予習2時間
各回毎に復習2時間程度

クラス情報



表示可能なデータがありません。

授業計画

[1限目 9:20-10:50] [2限目 11:00-12:30] [3限目 13:30-15:00] [4限目 15:10-16:40] [5限目 16:50-18:20] [6限目 18:30-20:00]
回数 日付 [時間] 担当教員 テーマ 内容
1 5/21 [4] 宮尾 知幸 基礎統計 統計学における基本的な用語・概念を学習する。記述統計、推測統計、ベイズ統計の考え方を例題を通して理解する。
2 6/4 [4] 田中 宏季 機械学習1:分類、クラスタリング データサイエンス手法の1つである機械学習について概観する.教師あり学習,教師なし学習の違いとそれらの基本的手法について学ぶ.(例、ウォード分析、階層的クラスタリング、決定木、ランダムフォレスト)
3 6/11 [4] 品川 政太朗 機械学習II:PCA、回帰、系列データ学習、深層学習 データサイエンスで汎用的に使われる機械学習の手法の基本として、主成分分析、回帰モデル、系列データ学習、深層学習などについて説明する。
4 6/18 [4] 小野 直亮 バイオサイエンスにおけるビッグデータ解析とデータサイエンス バイオサイエンスにおけるデータサイエンスの応用について学ぶ。ゲノム解析や系統解析、遺伝子診断、代謝解析やその他のマルチオーミクス解析など網羅的かつ大規模、多元的な生物データに基づく解析と、それらを支えるバイオデータベースについて紹介する。
5 6/25 [4] 作村 諭一、小鍛治 俊也 バイオサイエンスにおけるモデル構築とスモールデータ解析 バイオサイエンスにおけるデータサイエンスの基礎と応用について学ぶ。細胞内分子システムの決定論的順モデルの構築方法、および実験観測の制約によりデータ数が少ない場合の順モデルとベイズ統計を用いた解析について学ぶ。
6 7/2 [4] 宮尾 知幸 マテリアル・分子設計における記述子 ※6回目の講義について:講師はWebexでオンライン参加します。L1教室のスクリーンにWebexでの授業を写しますので、都合のよい受講方法を選んでください。
WebExのリンクはこの授業で共通のURLです。配布資料の欄をご覧ください。
材料設計、分子設計において、データ科学手法を適用するために必要な記述子(数値化)について、分子構造のコンピュータ上での表現を含め、事例を通して学ぶ。
7 7/16 [4] 船津 公人 有機材料開発、触媒設計 材料の特性に影響する種々のパラメータを俯瞰し、材料とその特性との相関関係をモデル化する手法を実例を通して理解する。および材料物性間のトレードオフを対象としたパレート最適解探索を触媒探索を通して理解する。
8 7/30 [4] 試験 最終試験を実施します。詳細は本ページ中の下記の項目を見てください。
■その他
成績評価の方法と基準
◆最終試験について:

授業日程

[1限目 9:20-10:50] [2限目 11:00-12:30] [3限目 13:30-15:00] [4限目 15:10-16:40] [5限目 16:50-18:20] [6限目 18:30-20:00]
回数 日付 時間 講義室 備考
1 5/21 4 エーアイ大講義室[L1](IS) 講義は 1)対面式 2)オンライン 3)アーカイブ より、状況に応じて選択してください。 対面式を希望する場合、教員のいるL1の最大収容人数が75名のため先着順とします。 L1に入れなかった場合は、L2でアカデミックチャンネルを視聴するか、オンラインで受講していただくことになります。 L2で受講する場合、質問はWebExのチャットから受け付けること、またオンライン受講に切り替える場合に備えてなるべくノートPCを持参するようにしてください。 なお、オンライン講義の接続先URLは、配布資料欄に掲載している「WebEx URL」(PDF)を参照ください。
2 6/4 4 エーアイ大講義室[L1](IS) 同上
3 6/11 4 エーアイ大講義室[L1](IS) 同上
4 6/18 4 エーアイ大講義室[L1](IS) 同上
5 6/25 4 エーアイ大講義室[L1](IS) 同上
6 7/2 4 エーアイ大講義室[L1](IS) 注意。講義は 2)オンライン 3)アーカイブ の2つより、状況に応じて選択してください。L1教室ではWebExでのライブ授業を投影します(講師は教室にはいません)。 L1に入れなかった場合は、L2でアカデミックチャンネルを視聴するか、オンラインで受講していただくことになります。 L2で受講する場合、質問はWebExのチャットから受け付けること、またオンライン受講に切り替える場合に備えてなるべくノートPCを持参するようにしてください。 なお、オンライン講義の接続先URLは、配布資料欄に掲載している「WebEx URL」(PDF)を参照ください。
7 7/16 4 エーアイ大講義室[L1](IS) 同上
8 7/30 4 エーアイ大講義室[L1](IS) 最終試験を実施します。詳細は本ページ中の下記の項目を見てください。 ■その他 成績評価の方法と基準 ◆最終試験について:

テキスト・参考書

テキスト 特になし
参考書 特になし

その他

履修条件 上記履修方法参照
オフィスアワー Eメールで連絡の上、日時を決める
成績評価の方法と基準 各回の課題(50%)と最終試験(50%)の合計を基本として評価

◆各回の課題について

・提出先:
 NAISTレポート提出システム(https://nrss.naist.jp)
 "データサイエンス論 / Data Science [ID:4105] #*
  (*は授業の回数)と名前のついたデータボックスに それぞれの授業のレポートを提出して下さい。
・課題レポート用テンプレート:
 http://www-dsc.naist.jp/dsc_jp/wp-content/uploads/2021/05/2XXXXXX_your_name.docx
・ファイル名: 
 「student ID_first name_last name」で統一 (例):123456_taro_naist
・レポート形式: 
 WordからPDFに変換して提出
・レポート提出に関する問い合わせ先: 
 ds1-ds2-ta@is.naist.jp (TA学生)
(授業内容に関する質問がある場合は、授業担当教員にメールで質問をしてください。)

◆最終試験について:
最終試験を7月30日の講義時間にL1講義室で実施します。講義全体の内容から出題されます。前半については理論の実際の計算の理解、後半はそれぞれの分野のデータサイエンス手法の理解に関する問題を出題します。講義資料、ノート類は持ち込み可で、PCなどモバイルデバイスの試験中の利用を不可とします。留学生で日本に帰国できないなど、大学で実際の試験を受験できない方はレポートなど配慮しますので、直接、担当教員( ds1-ds2-faculty@is.naist.jp )まで、7月30日までに連絡ください。

関連科目 融合序論,バイオサイエンスにおけるビッグデータ,マテリアルインフォマティクス特論,系列データモデリング,視覚メディア処理I, データマイニング,多次元信号処理,自然言語処理,数理生命科学,バイオサイエンスのセンタ技法,バイオサイエンスにおける統計と数理,光・情報素子工学特論
関連学位 工学,理学,バイオサイエンス
注意事項

授業関連URL



表示可能なデータがありません。

配布資料

  資料名 備考 公開期限
データサイエンス論 第3回 小野 2022/03/31 学内専用