データサイエンス特別講義 (7024)

授業科目基本情報

科目区分 研究者の素養を養う科目 教職科目 指定なし
単位数 1 選択・必修・自由 選択
授業形態 講義 主な使用言語 英語
開講時期 履修登録システム 【使用しない】
履修登録期間 履修取消期限

教育プログラム別の履修区分

プログラム名 IS CB BS BN MS CP DS
履修区分
コア科目
履修方法

授業科目概要

担当責任教員 中村 哲
担当教員 中村哲、船津公人、森浩禎、浦岡行治、小野直亮、鈴木優、国田勝行、安国良平
教育目的/授業目標 情報科学、バイオサイエンス、物質科学、各分野のデータサイエンスとしての最先端の研究の取組の現状を紹介し、データ駆動型科学、AI駆動型科学が持つ可能性、今後の方向性を学ぶ。
指導方針 データサイエンスについて、具体的な研究紹介を通して、データサイエンスの現状の理解を深める。

クラス情報



表示可能なデータがありません。

授業計画

回数 日付 [時間] テーマ 内容
1 7/25 [3] 深層学習の基礎とバイオメディカルデータへの応用 
平成30年7月25日(水) 13:30-15:00
講義室:物質創成科学棟 E207/208
講師:新岡 宏彦 先生(大阪大学 データビリティフロンティア機構 特任准教授)
ディープラーニングは、人や車などの一般的な画像認識においては人の認識能力と同レベルに達しつつあると言われており、様々な分野へ応用されつつある。ディープラーニングの勃興の背景として計算能力の向上、アルゴリズムの進化、そしてビッグデータが挙げられており、バイオメディカル分野においても患者のカルテ,MRI や CT 画像,病理画像,DNAの配列など様々なビッグデータが蓄積されている。このような背景において、医師の負担軽減やデータと病気の間にある新たな関係の発見などを目的とし、ディープラーニングのバイオメディカル分野への応用も急速に進みつつある。講義では、ニューラルネットワークなどディープラーニングの基礎的な部分と、ディープラーニングが実際にどのような計算をしているのかを解説する。その後、ディープラーニングの一般的な応用事例を提示しつつ、バイオメディカル分野の応用例として、病理画像から癌細胞を見分ける例や、細胞形態の画像情報から細胞種を特定する試み、ウィルスDNA分類などについて紹介する。


2 9/10 [4] マテリアルズ・インフォマティクス概論
2018年9月10日 15:10-16:40
講義室:物質大講義室
講師:伊藤 聡 先生(物質・材料研究機構 情報統合型物質・材料研究拠点 拠点長)
概要:昨今、物質科学・材料工学の分野においてデータ駆動型科学であるマテリアルズインフォマティクスが急速に進行している。これは物質・材料に関するデータを元に物性・プロセスを理解し、その研究開発を加速しようというものである。本講演ではまず、マテリアルズインフォマティクスの国内外の動向を紹介し、国内で行われているプロジェクト「情報統合型物質・材料開発イニシアティブ」での研究成果からいくつか紹介する。材料研究にスパースモデリングやベイズ最適化などのデータ科学がどのように使われているかを具体的に述べる。さらに、材料データ収集に関する最近の取り組みを紹介したい。
3 9/14 [3] 滋賀大学データサイエンス学部について
2018年9月14日 13:30-15:00
講義室:物質大講義室
講師:竹村彰通先生(滋賀大学 データサイエンス学部長)
概要:滋賀大学では昨年4月に日本初のデータサイエンス学部を開設した。定員は100名である。最近ではあらゆる分野でデータが得られるようになっており、データサイエンスの応用先は広い。文系の応用も多く、学部としては文理融合的な教育を標榜している。一方でIT系等ではデータサイエンティストとして修士以上が要求されることが多いため、来年4月には修士課程(定員20名)を早期設置予定である。

4 9/20 [2] トランスオミクス:多階層オミクス統合によるシステム生物学
2018年9月20日 時間:11:00-12:30
講義室:バイオ棟D113
講師:柚木 克之 先生(理化学研究所 統合生命医科学研究センター 上級研究員)
概要:細胞は、ゲノム(DNA)、トランスクリプトーム(RNA)、プロテオーム(タンパク質)、メタボローム(代謝物質)など複数のオミクス階層にまたがる分子間相互作用ネットワークによって多彩な機能を発揮するシステムである。近年の質量分析計や次世代シークエンサーの技術革新により、これらオミクス階層の網羅的計測が可能となりつつある。我々は、同一条件でサンプル調製・測定された多階層オミクスデータ(マルチオミクスデータ)を用いて、情報科学的・統計学的手法により階層内のみならず階層を縦断する生化学ネットワークをも再構築し、間接的な相関関係ではなく、直接的な分子間相互作用の連鎖としてオミクス階層間をつなぐ「トランスオミクス解析」の方法論を開発した。当日はトランスオミクス解析の実例として、インスリンで刺激したラット肝がん由来Fao細胞から得られたオミクスデータから再構築した多階層代謝制御ネットワークおよび微分方程式モデルを用いた新規調節経路の発見について紹介する。
5 9/25 [2] 東北メディカルバンクプロジェクト
日時:9/25 (Tue) 11:00 - 12:30
講義室:バイオ棟D105 中セミナー室2
講師:長神 風二 先生(東北メディカル・メガバンク機構 広報渉外・企画分野特任教授)
概要:Constructing cohort is one of the major strategies in epidemiological study and those kinds of study have already produced thousands of knowledge which elucidate the relationships between diseases and some environmental factors. From early 2000s, the advancement in genomic methodology shed a new light on the field. Cohort studies deal with large number of people, but it had not been realistic to analyze genome sequences for such a large number of people. The situation has changed especially after the appearance of next-generation sequencer that can make a whole genome sequencing completed in a few days and with available costs. So, the era of genome cohort began. Since then, some advanced countries has started the large scale biobank based on cohort studies, which stored a large number of biological specimens in a long-term.
In 2012, Tohoku Medical Megabank Project has started in Miyagi and Iwate prefectures, constructing over 150,000 people cohort study and biobank. The project is designed to contribute for the reconstruction from the damage of the Great East Japan Earthquake in 2011 and the goal is to establish the next-generation medicine in the region. The project contains not only a large scale cohort study and biobank, but also some analytical studies for making the “integrated biobank” which stores and distribute not only the biospecimen but the information analyzed from the specimens. The project has already finished around 5,000 whole genome sequencing and tens of thousands of metabolome analysis, and has started to share those data with the academia and industries in Japan. In the lecture, the project outline will be explained and the problems and challenges of big data creating and sharing will be discussed.
6 9/27 [2] Chasing cellular and molecular dynamics using DNA barcodes and genome editing
日時:9/27 (木)11:00 - 12:30
講義室:バイオ棟D105 中セミナー室2
谷内江 望 先生(東京大学 先端科学技術研究センター 准教授)
概要:Mammalian development, tumorigenesis and other dynamic progression of heterogeneous cell systems remain largely unclear. The molecular landscape of cells have been rapidly unveiled by fast-developing sequencing and mass-spectrometry technologies, which however all require destruction of the samples and limit us to analyze dynamics of single cells or individuals. One can analyze spatiotemporal dynamics of molecules and cells by microscopic observation with fluorescent proteins or probes, but only for a limited number of objects. Not surprisingly, the above mentioned technologies only allow us to examine the events that occur at the time of their observation. This prevents global analyses of heterogeneous molecular and cellular dynamics in a complex system. To address this issue, our laboratory has been developing several cell-embedded dynamic DNA memories using genome editing and DNA sequencing technologies. In this talk, I will present about our progress in developing a dynamic DNA memory that continuously recodes cellular lineage and molecular event information and another DNA memory technology that enables time- course omic analysis of a target cell clone buried in a complex population. I will also discuss about the need of robotic technologies to promote such cell engineering for the biology of the next decades.
7 11/16 [3] 分子設計、材料設計、プロセス設計のためのデータ駆動型化学
日時:11/16 (金)13:30 - 15:00
講義室:物質棟E318 中講義室
船津公人先生(奈良先端大 データ駆動型サイエンス創造センター研究ディレクター・物質創生科学領域教授、東京大学 工学系研究科教授)
概要:目的物性を持つ構造、材料候補を提案する-この逆解析こそがデータ駆動型化学に求められる重要項目と理解され始めてきた。さらに「何を作るか」から、それを「どう作るか」、すなわち材料そのものの開発から、その安定品質による生産のためのプロセス監視や制御までを含んだ課題に、いまやデータの集約的活用が不可欠となってきた。事例を通してこのことを理解する。
8 11/21 [3] 系列予測問題としてのニューラル機械翻訳 
平成30年11月21日(水) 13:30-15:00
講義室:融合棟1号館4F会議室
講師:須藤克仁(奈良先端大 情報科学領域 知能コミュニケーション研究室 准教授 兼 データ駆動型サイエンス創造センター)
概要:機械翻訳は計算機科学の勃興期から長く挑戦的な課題であり続けてきたが,自然言語処理技術の発展,そして大量のデータと膨大な計算能力を背景として21世紀に入ってから徐々に「使える技術」としての広がりを見せてきていた.
2010年前後からの深層学習技術の急速な進展の中生まれた「ニューラル機械翻訳」はそうして蓄積されてきた機械翻訳の方法論を大きく変化させたと言ってよい.
これまで自然言語に対する仮説に基づいて構築されてきた機械翻訳の考え方は,単純な系列予測問題として扱うニューラル機械翻訳によって変容しつつあり,また,機械翻訳に限らない様々な応用に広がりつつある.
本講演ではニューラル機械翻訳が生まれた背景と,そこからわずか3年あまりの間の急速な発展について述べる.
また,その一方で未だ解決されていない問題についても紹介したい.

授業日程

回数 日付 時間 講義室 備考
1 7/25 3 【E207 208】
2 9/10 4 【物質大講義室】
3 9/14 3 【物質大講義室】
4 9/20 2 D113
5 9/25 2 D105
6 9/27 2 D105
7 11/16 3 E318
8 11/21 3 学際融合領域研究棟1号館4F会議室

テキスト・参考書

テキスト 必要に応じてプリントを配付する。
参考書 特になし

その他

履修条件 特になし
オフィスアワー Eメールで連絡の上、日時を決める
成績評価の方法と基準 ・5段階(秀・優・良・可・不可)で評価する。
・講義終了後、3分野から選択してレポートを提出し採点する
関連科目 情報理工学・情報生命科学・バイオサイエンス・バイオナノ理工学・物質理工学・知能社会創成科学の各特別講義
関連学位 理学、工学、バイオサイエンス
注意事項

授業関連URL



表示可能なデータがありません。

配布資料



表示可能なデータがありません。