科目区分 | 基盤科目 | 教職科目 | 指定なし |
---|---|---|---|
単位数 | 1 | 選択・必修・自由 | 選択 |
授業形態 | 演習 | 主な使用言語 | 日本語/英語 |
開講時期 | Ⅰ | 履修登録システム | 使用する |
履修登録期間 | 2022/04/12~2022/05/13 | 履修取消期限 | 2022/06/08 |
プログラム名 | IS | BS | MS | DS | DGI |
---|---|---|---|---|---|
履修区分 | △ | ○ | ○ | ○ | □ |
コア科目 | - | - | - | - | C |
履修方法 | ・修士論文研究又は特別課題研究を履修する場合は、序論科目、基盤科目及び専門科目から14単位以上履修すること。 ・課題研究を履修する場合は、序論科目、基盤科目及び専門科目から16単位以上履修すること。 |
担当責任教員 | - |
---|---|
担当教員 | 作村諭一、峠隆之、末次志郎、山崎将太朗 |
教育目的/学修到達目標 | 【教育目的】 どんなに努力して得たデータも、適切なデータ解析、検定、視覚化を行い、明確かつ客観的に表現しなければ説得力のある主張をすることはできない。また、不適切なデータ解析や統計検定は、誤った結論を導くことで、研究の方向性に重大な悪影響を及ぼし、研究の意義や成果を失わせかねない。そのため、データの形式や解析の目的に応じて、適切なデータ処理の手法を学ぶ必要がある。 前半では、実測データの解析に必要な基礎的概念を理解することを重視するとともに、Microsoft Excelを用いたデータ解析法の基礎を学ぶ。また、学んだ内容をもとに実践的かつ応用的な思考が可能となるように演習を行う。トランスクリプトームデータやメタボロミクスデータなどを例に、実測データの解析を行うための基礎を学び、データ解析に必要な基礎知識の習得を目標とする。 後半では、Excel等のアプリケーションでは難しい処理を中心に、Python3を用いたデータ解析や統計検定、視覚化の手法を学ぶ。また、深層学習を用いたデータ処理、特に、画像処理の方法の初歩を学ぶ。 【学修到達目標】 1) 目的に応じてデータを適切に表現できる。 2) 適切なデータ処理の方法について説明、記述できる。 3) 得られたデータ解析や統計検定の結果について整理、議論ができる。 4) 実測データの性質と解析目的に沿ったデータ標準化法を判断できる。 5) Microsoft Excelを用いたデータ処理(グラフ作成、関数、条件式、検索、平均、分散、検定、標準化法、データ解析の自動化など)の操作ができる。 6) Python3を用いたデータ処理の基本操作ができる。 |
授業概要/指導方針 | 【授業概要/指導方針】 実験を伴う多くの研究では、様々な性質をもつデータを、そのデータの形式や解析の目的に応じて処理する必要がある。実験から得られた実測データに対し、どのような解析を行い、何を結論付けることができるのかを解説する。インタラクティブな授業をおこない、研究活動に必要なデータ解析手法の習得を目的とした指導を行う。 前半では、MicrosoftExcelを用いて解析する際に必要な基礎的概念やExcelの関数や機能を紹介することで、学んだ内容をもとに実践的かつ応用的な思考が可能となるように演習を行い、理解を深め、知識を定着させる。 後半では、Python3を用いて、より発展的なデータ解析手法を学ぶ。 【授業時間外学修(予習・復習等)の目安】 各回毎に授業内で与えられたAssignmentの予習2時間 各回毎に復習2時間程度 |
表示可能なデータがありません。 |
回数 | 日付 [時間] | 担当教員 | テーマ | 内容 |
---|---|---|---|---|
1 | 6/6 [5] | 作村 諭一 | Excelの操作と関数(1) | Excel の編集操作と簡単な関数(ソート、最大、最小、合計、平均など)について解説する。 |
2 | 6/8 [5] | 作村 諭一 | Excelの関数(2) | 特に検索に関する関数を解説する。条件つきカウント、文字列の検索とその結果に基づく情報抽出、参照方法の違い(絶対/相対)などについて解説する。 |
3 | 6/13 [5] | 作村 諭一 | Excel のフィルターとグラフ化 | データを条件で絞り込む方法、およびグラフ化する方法について解説する。 |
4 | 6/15 [5] | 作村 諭一 | Excel による基本統計 | 分散、標準偏差、標準誤差、検定等の算出方法について解説する。 |
5 | 6/17 [5] | 峠 隆之 | 実測データの標準化 | 生体サンプルから得られた実測データを種類別に解説する。とくにトランスプリプトームデータやメタボロミクスデータを例に、データの性質と解析目的に沿ったデータ標準化法を交えて解説する。 |
6 | 6/20 [5] | 峠 隆之 | データ解析の自動化 | 実測データの解析の自動化について解説する。とくにグラフ作成の自動化や配列数式、例外処理などについて解説する。 |
7 | 6/22 [5] | 峠 隆之 | データフォーマットと情報抽出 | 遺伝子データベースなどから得られたデータの情報抽出法について解説する。とくに遺伝子リストなどのデータを例に、文字列の性質と目的に沿ったデータ抽出法を解説する。 |
8 | 6/24 [5] | 峠 隆之 | データ解析演習 | 実測データやデータベースからの情報を用いた解析演習を行う。トランスプリプトームデータ、メタボロミクスデータや遺伝子リストを用いて、グラフ作成の自動化や統計解析などを行う。 |
9 | 6/27 [5] | 山﨑 将太朗 | バイオインフォマティクスの紹介 | バイオインフォマティクス全般の紹介とPythonを用いることで、どのようなデータの解析・視覚化が可能なのかを解説する。 |
10 | 7/13 [5] | 山﨑 将太朗 | データの分布を捉える | Pythonにて表データを読み込み、数値の分布を比較・解析し、様々な図の形式で視覚化する方法を実習形式で学ぶ。例: 定量値の分布・比較など。 |
11 | 7/15 [5] | 山﨑 将太朗 | データの全体像を捉える | 複数の要因が関わるデータについて、階層的クラスタリングや主成分分析を用いて全体像を捉え、視覚化する方法を実習形式で学ぶ。例: 複数の変異体における様々な遺伝子の発現量など。 |
12 | 7/20 [5] | 山﨑 将太朗 | 数値間の関係性を明らかにする | 数値と数値の間の関係性を、PLS回帰や、Lasso回帰、決定木を用いて解析し、視覚化する方法を実習形式で学ぶ。例: ある病気の罹患率と様々な身体的特徴の関係性など。 |
13 | 7/22 [5] | 山﨑 将太朗 | Pythonを用いた統計検定 | 統計検定の意味や重要性を紹介しつつ、適切な統計検定の仕方や、Excelでは難しい統計検定手法、多重比較検定の方法を実習形式で学ぶ。 |
14 | 7/25 [5] | 末次 志郎 | 機械学習による画像解析 解説 | 機械学習を用いた画像解析について、実例などをもとにどういうことができるか紹介する。 |
15 | 7/27 [5] | 末次 志郎 | 機械学習による画像解析 演習1 | 機械学習を用いた画像解析について、プログラミングをほぼせずに実践してみる。 |
16 | 7/29 [5] | 末次 志郎 | 機械学習による画像解析 演習2 | 機械学習を用いた画像解析について、プログラミングをして、実践してみる。 |
回数 | 日付 | 時間 | 講義室 | 備考 |
---|---|---|---|---|
1 | 6/6 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
2 | 6/8 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
3 | 6/13 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
4 | 6/15 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
5 | 6/17 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
6 | 6/20 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
7 | 6/22 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
8 | 6/24 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
9 | 6/27 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
10 | 7/13 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
11 | 7/15 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
12 | 7/20 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
13 | 7/22 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
14 | 7/25 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
15 | 7/27 | 5 | Rethink バイオサイエンス大講義室〔L11〕 | |
16 | 7/29 | 5 | Rethink バイオサイエンス大講義室〔L11〕 |
テキスト | 特になし。必要に応じて解説資料を配布する。 |
---|---|
参考書 | Jake VanderPlas 著、菊池 彰 訳、Pythonデータサイエンスハンドブック、オライリー・ジャパン(2018) |
履修条件 | ・デジタルグリーンプログラミング演習 (3044)を履修していること。または、同レベルのPythonプログラミングができること。 |
---|---|
オフィスアワー | Eメールで連絡の上、日時を決める。 |
成績評価の方法と基準 | ・5段階(秀・優・良・可・不可)で評価する。 ・演習テストにより評価する。 |
関連科目 | デジタルグリーンプログラミング演習 (3044) |
関連学位 | 工学,理学,バイオサイエンス |
注意事項 | ・ExcelとWeb ブラウザ(Chrome、Firefox等)が使えるノートPCを持参すること(持っていない場合は事務室で借りられます) https://ad-info.naist.jp/gakusei/gakumu_kankei/lending_laptop/Conditions_laptop.pdf |
表示可能なデータがありません。 |
表示可能なデータがありません。 |