情報教育推進センターへのリンク
最新の講義資料の閲覧をしたい方は、リンク先へ。
授業の内容
概要・目的
この授業の目的は、大規模データ解析を行う為の基礎的な技術を身につけることにある。はじめに、大規模データを統計処理する上で基本となる数値解析・数値計算の基礎について講述する。2分法やニュートン法などの基本的な内容について学習した後、計算機で統計計算を行う上で重要となるアルゴリズムを解説する。特に、連立一次方程式の解法であるLU分解、最小二乗法において基礎となるQR分解と主成分分析などで重要となる特異値分解について解説する。
次に、統計計算の基礎である回帰分析、主成分分析、独立成分分析等について取り上げる。さらに、それらの知識を踏まえて、Excelと統計ソフトRを使って統計計算の実習を行う。Excelは、単にその機能を使いこなすのみに止まらず、VBA(Visual Basic For Application)によるプログラミングを習得することも目指す。より大規模なデータ処理のために、統計ソフトRのR言語についても習熟する。さらに、統計計算はスーパーコンピューティングと親和性が高いため、スーパーコンピューティングにおける数値解析アルゴリズムを実装するための手法について講述するとともに、この分野の代表的なソフトウェアであるBLAS、LAPACKについて解説する。
加えて,近年注目されているクラウドコンピューティングについて講述する。最後に、可視化による大規模データの理解を目指し、可視化の基本技術について学習する。
授業計画と内容
全14回の予定は、以下の通りである。
・計算科学とは(1回)
計算科学(けいさんかがく, Computational Science)は、数学的モデルとその定量的評価法を構築し、計算機を駆使して科学技術上の問題を解決する学問分野である。計算科学概論、計算科学の応用について講述する。
・数値計算 (4回)
計算科学の重要な手法である数値解析・数値計算の基礎について講述する。2分法やニュートン法などの基本的な数値計算の内容について学習する。また、線形代数の基礎的な内容を学習した上で、計算機で統計計算を行う上で重要となるアルゴリズムを
解説する。特に、連立一次方程式の解法であるLU分解、最小二乗法において基礎となるQR分解と特異値分解について解説する。
・統計処理 (5回)
統計処理について概説し、統計学の基礎的な概念である平均、分散等を解説する。その後、回帰分析、主成分分析等のデータの統計処理について講述する。加えて、Excelと統計ソフトRの実習を行う。Excelにおいては、VBA(Visual Basic For Application)によるプログラミングを習得する。統計ソフトRのR言語についても実習を行う。
・大規模な計算とデータ処理 (2回)
より大規模なデータ処理を行うために、近年注目されているクラウドコンピューティングについて講述する。特に、Hadoop、MapReduce等の具体的な分散処理の手法について解説する。
・情報の可視化 (2回)
履修要件
特になし
成績評価の方法・基準
大規模データ解析を行うことができるレベルのExcelと統計ソフトRの利用技術(プログラミング技術も含む)を習得できているかについて、その習熟度をレポート課題を通して判断し、評価する。講義・実習の出席率も評価の基準に加える。
教科書
資料が必要な場合には、授業中にプリント等を配布する
参考書等
その他(授業外学習の指示・オフィスアワー等)
木村欣司:金曜・3限目13:00-14:30 kkimur[at]amp.i.kyoto-u.ac.jp
授業時間外で、質問がある場合には、あらかじめ、上記のアドレスにメールをすること。
授業情報
科目名 | 情報基礎III |
---|---|
科目名(英訳) | Fundamentals of Informatics III |
配当学年 | 全回生 |
単位数 | 2 |
開講期 | 前期・後期 (リピート) |
曜時限 | 火5 |
授業形態 | 講義 |
講義室 | 学術情報メディアセンター南館203 |
担当教員 | 情報学研究科特定准教授 木村 欣司 情報学研究科 特定助教 關戸 啓人 |