データ工学特論

天野 浩文 准教授

授業の目的

ディスクアレイや並列ファイルシステムなどの高速大容量データ入出力システム、 並列問い合わせ処理やオンライントランザクション処理のような データベースシステム高速化手法などを通じて、 現代の計算機システムにおける二次記憶装置の役割を探ります。

授業の概要

プログラムがアクセスする二次記憶装置内のデータが大規模化・複雑化してきたため、プログラムに対して、
  1. 大量のデータ全体をいかに高速に供給するか
  2. 大量のデータの中から必要な部分だけをいかに高速に抜き出して供給するか
といった問題が重要になってきました。そこでこれらを解決するため、さまざまな技術が開発されてきています。
たとえば、大規模科学技術計算システムにおいてはプログラムの大規模化・並列化が急速に進んでおり、 大量のデータを高速に供給するのに適したディスクアレイ、 並列プログラムのデータアクセスを効率化するための 並列ファイルシステムや並列ファイル入出力インタフェースといった技術が登場しています。
また、大規模データベースシステムにおいては、並列問い合わせ処理や オンライントランザクション処理などを用いた高速化技法が用いられています。
さらに、大規模データの共有を効率化するため のストレージエリアネットワークのような、 まったく新しいストレージアーキテクチャも実現されています。
そこで、この講義では、ストレージシステムを高性能化・高機能化するための種々の技法、 データベースシステムの各種高速化手法、および、データ供給の効率化のためのストレージアーキテクチャなどを通じて、 現代の計算機システムにおける二次記憶装置の役割を探っていきます。
講義資料で学習する:
1 ディスクアレイ、RAID
2 RAID
3 RAID、並列ファイルシステム
4 並列ファイルシステム
5 ディスク利用形態の変遷
計算機とディスク(アレイ)の間の接続インタフェース
各種ディスク入出力インタフェース
6 (この回は特別講義のため資料がありません)
7 並列入出力ライブラリ
(既存のライブラリの)並列入出力インタフェース
8 データベース処理の高速化
ディスクの高機能化
並列データベースシステム