杉木　章義(スギキ　アキヨシ)(情報基盤センター　システムデザイン研究部門)

研究者データベース

杉木　章義(スギキ　アキヨシ)

情報基盤センター　システムデザイン研究部門

准教授

researchmap個人ページ

Last Updated :2024/05/09

基本情報

所属

情報基盤センター　システムデザイン研究部門

職名

准教授

学位

博士(工学)（電気通信大学）

ホームページURL

http://axi-sugiki.github.io/

J-Global ID

200901066692217291

研究分野

情報通信 / ソフトウェア

担当教育組織

学士課程　工学部

修士課程　情報科学院

博士課程　情報科学院

職歴

2015年04月 - 現在北海道大学情報基盤センター准教授

2009年04月 - 2011年10月筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻（学術情報メディアセンター）

2011年10月筑波大学システム情報系情報工学域

2007年04月 - 2009年03月科学技術振興機構 CREST 研究員

所属学協会

IEEE ACM 情報処理学会 Institute of Electrical and Electronics Engineers (IEEE) Association for Computing Machinery

研究活動情報

論文

データ活用社会創成に向けた基盤ソフトウェア環境の構築
杉木章義, 空閑洋平, 竹房あつ子, 藤原一毅, 合田憲人, 中村遼, 塙敏博, 鈴村豊太郎, 宮本大輔, 田浦健次朗, 伊達進, 建部修見
大学ICT推進協議会学術情報処理研究（JACN） 26 2022年11月 [査読有り][招待有り]

mdx: A Cloud Platform for Supporting Data Science and Cross-Disciplinary Research Collaborations
Toyotaro Suzumura, Akiyoshi Sugiki, Hiroyuki Takizawa, Akira Imakura, Hiroshi Nakamura, Kenjiro Taura, Tomohiro Kudoh, Toshihiro Hanawa, Yuji Sekiya, Hiroki Kobayashi, Shin Matsushima, Yohei Kuga, Ryo Nakamura, Renhe Jiang, Junya Kawase, Masatoshi Hanai, Hiroshi Miyazaki, Tsutomu Ishizaki, Daisuke Shimotoku, Daisuke Miyamoto, Kento Aida, Atsuko Takefusa, Takashi Kurimoto, Koji Sasayama, Naoya Kitagawa, Ikki Fujiwara, Yusuke Tanimura, Takayuki Aoki, Toshio Endo, Satoshi Ohshima, Keiichiro Fukazawa, Susumu Date, Toshihiro Uchibayashi
the 8th IEEE International Conference on Cloud and Big Data Computing (CBDCom 2022) 2022年09月 [査読有り][通常論文]

データ利活用に向けた高性能Kubernetes環境構築の検討
杉木章義
情報処理学会研究報告（2022-HPC-185） 18 1 - 7 2022年07月 [査読無し][通常論文]

データ利活用に向けた仮想化プラットフォームmdxの基本性能評価
塙敏博, 中村遼, 空閑洋平, 杉木章義, 田浦健次朗
情報処理学会研究報告（2022-HPC-183） 7 1 - 9 2022年03月 [査読無し][通常論文]

データ活用社会創成プラットフォーム mdx の設計・実装・運用〜多様な学際領域における共創に向けて～”，
鈴村豊太郎, 杉木章義, 滝沢寛之, 今倉暁, 中村宏, 田浦健次朗, 工藤知宏, 塙敏, 博, 関谷勇司, 小林博樹, 松島慎, 空閑洋平, 中村遼, 姜仁河, 川瀬純也, 華井雅, 俊, 宮嵜洋, 石﨑勉, 下徳大祐, 関本義秀, 樫山武浩, 合田憲人, 竹房あつ子, 政谷, 好伸,栗本崇, 笹山浩二, 北川直哉, 藤原一毅, 朝岡誠, 中田秀基, 谷村勇輔, 青木, 尊之, 遠藤敏夫, 大島聡史, 深沢圭一郎, 伊達進, 天野浩文
大学 ICT 推進協議会 2021 年度年次大会 2021年12月 [査読無し][通常論文]

高水準なマイクロサービス層における複数ドメインを連携させたインタークラウドHPC環境実現の検討
杉木章義
情報処理学会研究報告（2021-OS-153） 9 1 - 6 2021年07月 [査読無し][通常論文]

microburst: クラウドネイティブ環境を起点とした異種混合 HPC アプリケーション開発と展開の検討
杉木章義
情報処理学会研究報告（2021-HPC-180） 20 1 - 7 2021年07月 [査読無し][通常論文]

Distribution system for japanese synthetic population data with protection level
Tadahiko Murata, Susumu Date, Yusuke Goto, Toshihiro Hanawa, Takuya Harada, Manabu Ichikawa, Hao Lee, Masaharu Munetomo, Akiyoshi Sugiki
Proceedings - International Conference on Machine Learning and Cybernetics 2020-December 187 - 193 2020年12月02日
In this paper, we introduce a distribution system of synthesized data of Japanese population using Interdisciplinary Large-scale Information Infra-structures in Japan. Synthetic population is synthesized based on the statistics of the census that are conducted by the government and publicly released. Therefore, the synthesized data have no privacy data. However, it is easy to estimate the compositions of households, working status in a certain area from the synthetic population. Therefore, we currently distribute the synthesized data only for public or academic purposes. For academic purposes, it is important to encourage scholars or researchers to use a large-scale data of households, we define protection levels for the attributes in the synthetic populations. According to the protection levels, we distribute the data with proper attributes to those who try to use them. We encourage researchers to use the synthetic populations to be familiar to large-scale data processing.

Distribution System for Japanese Synthetic Population Data with Protection Level
Tadahiko Murata, Susumu Date, Yusuke Goto, Toshihiro Hanawa, Takuya Harada, Manabu Ichikawa, Hao Lee, Masaharu Munetomo, Akiyoshi Sugiki
International Conference on Machine Learning and Cybernetics: ICMLC 2020 2020年12月 [査読有り]

Synthetic Population for Real-Scale Social Simulations
Tadahiro Murata, Susumu Date, Yosuke Goto, Toshihiro Hanawa, Takuya Harada, Manabu Ichikawa, Hao Lee, Masaharu Munetomo, Akiyoshi Sugiki
SC20 Exhibition 2020年11月 [査読有り][通常論文]

Distribution of Synthetic Populations of Japan for Social Scientists and Social Simulation Researchers.
Tadahiko Murata, Takuya Harada, Manabu Ichika Wa, Yusuke Goto, Lee Hao, Susumu Date, Masaharu Munetomo, Akiyoshi Sugiki
2019 International Conference on Machine Learning and Cybernetics(ICMLC) 1 - 5 2019年 [査読有り]

Multi-Objective Hadoop Configuration Optimization using Steady-State NSGA-II
Phyo Thandar Thant, Courtney Powell, Akiyoshi Sugiki, Masaharu Munetomo
2016 JOINT 8TH INTERNATIONAL CONFERENCE ON SOFT COMPUTING AND INTELLIGENT SYSTEMS (SCIS) AND 17TH INTERNATIONAL SYMPOSIUM ON ADVANCED INTELLIGENT SYSTEMS (ISIS) 293 - 298 2016年 [査読有り][通常論文]

Hadoop configuration optimization is very challenging because of the complexity of its framework. And optimized Hadoop parameter configuration settings depend significantly on the performance of MapReduce applications in the cluster. Although much research has been conducted on Hadoop parameters configuration optimization, configuring its resource setting parameters to minimize the execution time of MapReduce jobs in clusters still needs a lot of continuing researches. Further, determining the type of machine instances that should be used to minimize the resource usage cost for executing applications in clusters is also difficult. This paper addresses these problems by optimizing the instance resource usage and execution time of MapReduce tasks using a multi-objective steady-state Non-dominated Sorting Genetic Algorithm II (ssNSGA-II) approach. In this approach, the instance resource usage cost of MapReduce tasks is calculated based on the cost of machine instance types and the number of machine instances in the Hadoop cluster. The optimized configuration is identified by selecting an optimal setting that satisfies two objective functions associated with instance resource usage and execution time minimization, from Pareto optimal front solutions. Although dynamic machine instance type is considered within the search process in our system, dynamic cluster size is out of consideration and intended to be carried out in our future. Experiments conducting using workloads from the HiBench benchmark on a high specification 6-node Hadoop cluster verify the efficacy of our proposed approach.

クラウド基盤ミドルウェアKumoiのセキュリティ設計と実装
杉木,章義, 加藤,和彦
コンピュータソフトウェア（採録決定） 30 4 3 - 17 日本ソフトウェア科学会 2013年10月 [査読有り][通常論文]

著者らは，クラウド基盤ミドルウェアKumoiを開発している．Kumoiでは，物理計算機，仮想マシン，ネットワークなどのさまざまな資源を分散オブジェクトとして抽象化し，スクリプティングでこれらを組み合わせ，クラウドシステム全体を構成可能とすることで，カスタマイズ性と拡張性の実現を目指している．本論文では，クラウド基盤ミドルウェアに必要とされている認証・認可・課金・監査，および通信路の暗号化などの機能が，Kumoiの当初のコンセプトを保ちつつ，ソフトウェア構成の観点から，どのように自然に実現されているかについて述べる．

学内無線LANシステムにおける利用統計データの分析とその課題
杉木, 章義, 佐藤, 聡, 和田, 耕一
情報処理学会研究報告. IOT, [インターネットと運用技術] 2013 7 1 - 5 一般社団法人情報処理学会 2013年09月 [査読無し][通常論文]

教育や研究環境の充実を目的として,多くの大学で学内無線 LAN システムが導入されている.大規模データ解析の手法を学内無線 LAN の統計データに応用すれば,従来の手法では見つけることのできなかった潜在的な問題を発見し,また戦略的なネットワークの配備計画が可能になることから,利用者から見た学内ネットワークの品質を大幅に向上させることができると期待される.本論文では,学内無線 LAN システムに関する利用統計データを蓄積し,対話的に解析を行うためのシステムについて提案する.また,いくつかの解析事例について紹介し,その際に課題となる利用者のプライバシーやセキュリティに関する配慮などについても議論する.

Mobile Devices in the Wild (Campus)
杉木, 章義, 佐藤, 聡, 和田, 耕一
情報処理学会研究報告. [システムソフトウェアとオペレーティング・システム] 2013 21 1 - 8 一般社団法人情報処理学会 2013年07月 [査読無し][通常論文]

近年,従来からのノート PC に限らず,スマートフォンやタブレットなど,多様な移動端末が利用されている.近い将来,一人のユーザが複数の端末を当たり前のように活用し,生活を行うといったことが指摘されているものの,実際の我々の身近な利用状況について報告されているものはまだ少ない.本研究では,大学のキャンパスで利用されている Wi-Fi 端末の利用状況について,約 2 ヶ月半にわたり,475 台のアクセスポイントを利用して観測を行った.その結果について,本稿で報告する.

東日本大震災時の筑波大学情報インフラにおける対応と課題
佐藤, 聡, 杉木, 章義, 陳, 漢雄, 古瀬, 一隆, 片岸, 一起, 中井, 央, 秡川, 友宏, 前田, 敦司, 和田, 耕一
情報処理学会論文誌 54 3 1038 - 1049 一般社団法人情報処理学会 2013年03月 [査読無し][通常論文]

平成23年3月11日に起きた東日本大震災で,茨城県つくば市にメインキャンパスを持つ筑波大学も被災し,大学周辺地域とともに停電を体験した.これにより,筑波大学の情報インフラの運用は大きな影響を受けた.各種システムの依存関係を考慮し,限られた電源容量において稼働可能な最低限のシステムを選択し,運用するといった震災関連の対応を振り返ることにより,今後の防災対策案を検討した.その中から実施したいくつの対策案について報告する.また震災後のネットワークシステムのログを分析し,震災後に学内,学外からどのようにネットワークが利用されたかを示し,情報発信のために行った対策が有効であったかを示す.

An integrated management framework for virtual machines, switches, and their SDNs.
Akiyoshi Sugiki
19th IEEE International Conference on Networks, ICON 2013, Singapore, December 11-13, 2013 1 - 6 IEEE 2013年 [査読有り][通常論文]

仮想資源管理基盤におけるキャッシュ機構の導入
杉木, 章義, 加藤, 和彦
情報処理学会論文誌. コンピューティングシステム 6 1 31 - 44 一般社団法人情報処理学会 2013年01月 [査読無し][通常論文]

近年,クラウドコンピューティングが注目されている.クラウドを支えるデータセンタにおいて,仮想計算機,ネットワーク,ストレージなどのさまざまな資源が用いられており,これらを効率的かつ適切に管理することは重要である.本論文では,これらを管理する仮想資源管理基盤ソフトウェアにキャッシュ機構を導入する.本機構では,さまざまな資源を分散オブジェクトとして統一的に扱うため,分散オブジェクトのキャッシュ技術をそのまま適用することができる.また,キャッシュポリシによる資源ごとのキャッシュ期間の指定や,インバリデーションによるキャッシュの無効化も行う.実験では,個別の操作ごとの性能改善効果やオーバヘッドを示すとともに,多数の仮想計算機を管理する場合の効率性を改善できることを確認した.

Elements and Composition of Software-defined Data Centers
Akiyoshi, Sugiki, Kazuhiko, Kato
4th ACM/IFIP/USENIX Int'l Conf. on Middleware (MIddleware 2012), Demos and Posters Track 2 ACM 2012年12月 [査読有り][通常論文]

Towards Robust Tuning of Hadoop by using Design of Experiments Approach
Akiyoshi, Sugiki, Kazuhiko, Kato
18th IEEE Pacific Rim Int'l Symp. on Dependable Computing (PRDC 2012), Fast Abstract 2 2012年11月 [査読有り][通常論文]

サーバ・チューニング記述のためのスクリプティング環境
相川, 拓也, 杉木, 章義, 加藤, 和彦
情報処理学会論文誌. コンピューティングシステム 5 5 138 - 151 一般社団法人情報処理学会 2012年10月 [査読有り][通常論文]

サーバのチューニングは,性能を左右する重要なタスクである一方で,管理者にとって困難をともなう.パラメータの最適値は多くの場合, 1 回のチューニングでは求まらず,さまざまな試行錯誤を行う必要がある.また, 1 回の試行においても,サーバの設定を変更するだけではなく,複数台からなるクライアントの設定を変更し,起動するなど,煩雑な手続きが必要である.本研究では,このチューニングにおける試行錯誤の過程を効率化するスクリプティング環境を提案する.本提案では,サーバやクライアントなどチューニングに関連する要素をすべて分散オブジェクト化し,統一的な環境で高水準に試行の過程を記述可能とする.また,自動チューニングアルゴリズムのライブラリ化を行うことで,利便性の向上を図る.実験では, SPECweb2005 ベンチマーク下の Apache ウェブサーバと Hadoop を対象として実験を行い,本環境を利用してチューニングができることを確認した.

クラウド基盤ソフトウェアにおけるFailure-Oblivious Computing導入
杉木, 章義, 奥畑, 聡仁, 加藤, 和彦
情報処理学会論文誌. コンピューティングシステム 5 5 103 - 117 一般社団法人情報処理学会 2012年10月 [査読有り][通常論文]

近年,クラウドコンピューティングが注目されている.クラウドは多くの場合,大規模なデータセンタで運用されており,さまざまな障害にもかかわらず,全体のシステムを適切に運用する必要がある.本論文では, Failure-Oblivious Computing の概念をクラウド基盤ソフトウェアに導入し,可用性を向上させることを提案する.本方式では,全体の処理の継続を優先し,一部の障害を見逃すことでシステム全体の可用性の向上を目指す.我々が開発しているクラウド基盤ソフトウェア KumoiにFailure-Oblivious Computing の導入を行い,システムの継続性や副作用による影響などの観点から評価を行った.

クラウド基盤ソフトウェアにおけるLineageを利用した障害対策手法の検討
奥畑, 聡仁, 杉木, 章義, 加藤, 和彦
情報処理学会研究報告. [システムソフトウェアとオペレーティング・システム] 2012 21 1 - 8 一般社団法人情報処理学会 2012年07月 [査読無し][通常論文]

近年のクラウドコンピューティングの普及に伴い,データセンターの規模が拡大している.これらの多数の計算機資源を管理するデータセンターにおいて,日常的に発生している障害への対策は大きな課題である.本研究では,クラウド環境で典型的に行われるリソースプールから資源を取り出すという操作に着目し,その障害対策を Lineage と呼ばれるモデルを用いて導入する.障害が発生した資源の代わりをクラウド基盤ソフトウェアが自動的に用意し,透過的に障害に対応することを目指す.本研究では,この手法を当研究室で開発しているクラウド基盤ソフトウェアである Kumoi に導入し,いくつかのスクリプトを用いて実験を行い,障害発生時の Lineage の挙動を確認した.

レイテンシの違いを利用したネットブート配信環境の局所的な切り替え手法(システム制御,インターネットと情報倫理教育,一般)
高田, 真吾, 佐藤, 聡, 中井, 央, 杉木, 章義, 新城, 靖
電子情報通信学会技術研究報告. IA, インターネットアーキテクチャ 111 485 65 - 70 一般社団法人電子情報通信学会 2012年03月 [査読無し][通常論文]

大学のような多数の計算機を保有する組織では,その稼働率を上げることが課題となっている.本研究では,ネットワークブートされる計算機資源を有効活用するため,局所的に通常とは異なる計算機環境を配信する手法を提案する.提案手法では,ネットブートで利用されるDHCPが早い者勝ちのプロトコルであるという特徴を利用し,既存のDHCPサーバよりも早く応答するDHCPサーバをネットワークに接続し,そのサーバからの応答が届く範囲にのみ,通常とは異なる計算機環境を配信する.提案手法を実際に筑波大学の端末室に適用し評価実験を行ったところ,本来のDHCPサーバからの応答はリレーにより遅延し,接続したDHCPサーバからの応答が先に端末に到達することを確認した.また,この遅延による時間差は,DHCPサーバへのリクエストが集中した場合には小さくなることを示した.

A P2P Approach to Scalable Network-Booting
Shingo Takada, Akira Sato, Yasushi Shinjo, Hisashi Nakai, Akiyoshi Sugiki, Kozo Itano
2012 THIRD INTERNATIONAL CONFERENCE ON NETWORKING AND COMPUTING (ICNC 2012) 201 - 207 2012年 [査読有り][通常論文]

Network-booting is widely adopted in universities that have to maintain many client computers. In conventional network-booting systems, the primary bottleneck is the disk image distribution servers and the network to these servers. To eliminate this bottleneck, peer-to-peer (P2P) methods must work. However, existing P2P methods, including BitTorrent, do not work well for network-booting because they are highly optimized for distributing an entire large file, while network-booting requires certain parts of a large file. In the present study, aiming to solve the problems described above, we describe a new network-booting system that uses a P2P method. In our P2P-based network-booting system, a client node receives disk blocks not only from central distribution servers but also from the other client nodes that already have the demanded disk blocks. To the best of our knowledge, our network-booting system is the first effective implementation of a network-booting system that uses a P2P method in a local area network. Unlike conventional P2P systems, the proposed network-booting system can deal with demanded parts of a large disk image. We performed experiments with 112 client nodes in real classrooms on a university campus. The results of the experiments show that our implementation scales well as the number of client nodes grows.

クラウド環境におけるサーバパラメータ調整のためのスクリプティング環境
相川, 拓也, 杉木, 章義, 加藤, 和彦
情報処理学会研究報告. [システムソフトウェアとオペレーティング・システム] 2011 11 1 - 8 一般社団法人情報処理学会 2011年07月 [査読無し][通常論文]

近年のクラウドコンピューティングの普及に伴い,効率的なデータセンター管理が求められている.サーバのパラメータ調整は知識と経験を必要とする難易度の高いタスクである一方で,適切に調整を行うかどうかでサーバの性能に大きな差が生じる.本研究では,サーバパラメータ調整のためのスクリプティング環境を提案する.パラメータ調整に必要なアプリケーション,クライアントなど全ての構成要素を分散オブジェクト化し,統一的な環境で,高水準なスクリプティングによりパラメータ調整を可能とする.また,さまざまなアプリケーションに対応するため,インターフェース定義言語から分散オブジェクトの自動生成を行う.実験では,SPECweb2005 を使用した Apache ウェブサーバおよび Hadoop に対して実際にスクリプト記述を行い,パラメータ調整が可能であることを確認した.

An extensible cloud platform inspired by operating systems
Akiyoshi Sugiki, Kazuhiko Kato
Proceedings - 2011 4th IEEE International Conference on Utility and Cloud Computing, UCC 2011 306 - 311 2011年 [査読有り][通常論文]

Virtualization has changed the ways computation is done, especially in utility and cloud computing. While several virtualization cloud platforms have emerged to provide interfaces between users and data centers, traditional operating systems (OSes) have defined interfaces between applications and hardware. We argue that virtualization cloud platforms and OSes can share many problems, thus, many techniques developed for OSes can be applied to such platforms. We have implemented a prototype of an OS-like middleware that adopted a micro kernel design, had resource abstraction achieved by objects and functions, and offered a scripting environment as a programming interface. The experimental results demonstrated that it had the ability to achieve elasticity and high-availability VMs. We also carried out qualitative comparisons with other middleware to clarify our research position. © 2011 IEEE.

Self-stabilizing passive replication for Internet service platforms
Koji Hasebe, Kei Yamatozaki, Akiyoshi Sugiki, Kazuhiko Kato
2011 4th IFIP International Conference on New Technologies, Mobility and Security, NTMS 2011 - Proceedings 1 - 6 2011年 [査読有り][通常論文]

We present a self-stabilizing passive replication mechanism for Internet service platforms. The proposed system based on this mechanism aims to provide services despite simultaneous failure of the majority of nodes. To achieve this objective, we use the self-stabilizing consensus algorithm introduced by Dolev et al. [7], instead of a majority-based consensus algorithm such as Paxos. Although our system allows temporary illegal behavior, it eventually converges on the desired state without interruption of services. Thus, the proposed system is useful for providing services that require high availability, but not strict consistency, a prime example of which is an Internet bulletin board for communication during large-scale natural disasters. We implemented a prototype and evaluated it with experiments to demonstrate availability through various patterns of failures.

インターネットサービス基盤の構築に向けたパッシブ複製の自己安定化手法
大和崎,啓, 長谷部,浩二, 杉木,章義, 加藤,和彦
情報処理学会研究報告 2011 11 1 - 8 一般社団法人情報処理学会 2011年01月 [査読無し][通常論文]

An extensible cloud platform inspired by operating systems
Akiyoshi Sugiki, Kazuhiko Kato
Proceedings - 2011 4th IEEE International Conference on Utility and Cloud Computing, UCC 2011 306 - 311 2011年 [査読有り][通常論文]

Virtualization has changed the ways computation is done, especially in utility and cloud computing. While several virtualization cloud platforms have emerged to provide interfaces between users and data centers, traditional operating systems (OSes) have defined interfaces between applications and hardware. We argue that virtualization cloud platforms and OSes can share many problems, thus, many techniques developed for OSes can be applied to such platforms. We have implemented a prototype of an OS-like middleware that adopted a micro kernel design, had resource abstraction achieved by objects and functions, and offered a scripting environment as a programming interface. The experimental results demonstrated that it had the ability to achieve elasticity and high-availability VMs. We also carried out qualitative comparisons with other middleware to clarify our research position. © 2011 IEEE.

Dynamic grid quorum: A reconfigurable grid quorum and its power optimization algorithm
Munetoshi Ishikawa, Koji Hasebe, Akiyoshi Sugiki, Kazuhiko Kato
Service Oriented Computing and Applications 4 4 245 - 260 2010年12月 [査読有り][通常論文]

Power-saving has become a central issue for well-configured SOC platforms. In particular, as a high percentage of the total energy is used by the storage systems, the cost effectiveness of data management is equally as important as reliability and availability. To address this issue, we propose the dynamic grid quorum as a method for reducing the power consumption of large-scale distributed storage systems. The basic principle of our approach is to skew the workload toward a small number of quorums. This can be realized using the following three techniques. First, our system allows reconfiguration by exchanging nodes without any data migration, so that high-capacity nodes can be reallocated to busier quorums. Second, for more effective skewing of the workload, we introduce the notion of dual allocation, which makes it possible to consider two distinct allocations in the same grid for write and read quorums. Finally, we present an optimization algorithm to find a pair of a strategy and an allocation of nodes, which minimizes power for a given system setting and its workload. We also demonstrate that the dynamic grid quorum saves, on average, 14-25% energy compared with static configurations, when the intensity of the total workload changes. © 2010 Springer-Verlag London Limited.

Kumoi: A high-level scripting environment for collective virtual machines
Akiyoshi Sugiki, Kazuhiko Kato, Yoshiaki Ishii, Hiroki Taniguchi, Nobuyuki Hirooka
Proceedings of the International Conference on Parallel and Distributed Systems - ICPADS 322 - 329 2010年 [査読有り][通常論文]

We have designed and implemented a scripting environment called "Kumoi" for managing collective VMs in a large-scale data center. Kumoi is unlike other scripting environments because it exploits strong typing with type inference and high-level description. Kumoi introduces several advancements, including treating virtual machines as first-class objects and decoupling the scripting model and its execution for hiding as many details as possible. We implemented Kumoi as an embedded domain-specific language based on Scala along with distributed agents running on each physical machine. Evaluation using example scripts showed that an administrator can more concisely write the instructions for performing complex VM lifecycle management tasks. Use of this environment should improve management efficiency and agility. © 2010 IEEE.

Power-saving in large-scale storage systems with data migration
Koji Hasebe, Tatsuya Niwa, Akiyoshi Sugiki, Kazuhiko Kato
Proceedings - 2nd IEEE International Conference on Cloud Computing Technology and Science, CloudCom 2010 266 - 273 2010年 [査読有り][通常論文]

We present a power-saving method for large-scale distributed storage systems. The key idea is to use virtual nodes and migrate them dynamically so as to skew the workload towards a small number of disks while not overloading them. Our proposed method consists of two kinds of algorithms, one for gathering or spreading virtual nodes according to the daily variation of workloads so that the active disks are reduced to a minimum, the other for coping with the changes in the popularity of data over a longer period. For this dynamic migration, data stored in virtual nodes are managed by a distributed hash table. Furthermore, to improve the reliability as well as to reduce the migration cost, we also propose an extension of our method by introducing a replication mechanism. The performance of our method is measured both by simulation and a prototype implementation. From the experiments, we observed that our method skews the workload so that the average load for the active physical nodes as a function of the overall capacity is 67%. At the same time, we maintain a preferred response time by setting a suitable maximum workload for each physical node. © 2010 IEEE.

Kumoi: A high-level scripting environment for collective virtual machines
Akiyoshi Sugiki, Kazuhiko Kato, Yoshiaki Ishii, Hiroki Taniguchi, Nobuyuki Hirooka
Proceedings of the International Conference on Parallel and Distributed Systems - ICPADS 322 - 329 2010年 [査読有り][通常論文]

We have designed and implemented a scripting environment called "Kumoi" for managing collective VMs in a large-scale data center. Kumoi is unlike other scripting environments because it exploits strong typing with type inference and high-level description. Kumoi introduces several advancements, including treating virtual machines as first-class objects and decoupling the scripting model and its execution for hiding as many details as possible. We implemented Kumoi as an embedded domain-specific language based on Scala along with distributed agents running on each physical machine. Evaluation using example scripts showed that an administrator can more concisely write the instructions for performing complex VM lifecycle management tasks. Use of this environment should improve management efficiency and agility. © 2010 IEEE.

広域分散環境のための仮想機械を利用したサービス協調複製基盤
杉木, 章義, 大和﨑, 啓, 加藤, 和彦
情報処理学会論文誌. コンピューティングシステム 2 1 1 - 11 一般社団法人情報処理学会 2009年03月 [査読有り][通常論文]

近年のインターネットサービスは厳しい時間と資源制約のもとに開発されている.サービスに対する高い可用性が求められているものの,短い開発期間からサービスに複製処理を追加し,十分なテストを行うことは難しい.また,離れた拠点に複製を行う広域複製が潜在的には望まれているものの,多くの場合,コストの問題から導入を諦めているのが現状である.本論文では,広域分散環境における仮想機械を利用したサービス協調複製基盤を提案する.まず,サービス提供者がお互いに計算機資源を提供し,サービスを複製しあうことで少ない参加コストでサービスの可用性を高めることができる.次に,仮想機械を用いることでサービスごとの独立性を高め,特定のサービスに依存しない複製処理や再開機能を提供することができる.本基盤をXenとScrap Book for User-Mode Linuxの2つの仮想機械とともに実装し,日本国内の3拠点で実験を行った.その結果,2つのサービスを同時に稼働させた場合でも,障害から回復する

Dynamic grid quorum: A novel approach for minimizing power consumption without data migration in grid quorums.
Munetoshi Ishikawa, Koji Hasebe, Akiyoshi Sugiki, Kazuhiko Kato
IEEE International Conference on Service-Oriented Computing and Applications, SOCA 2009, 14-15 December 2009, Taipei, Taiwan 1 - 8 IEEE Computer Society 2009年 [査読有り][通常論文]

耐障害性向上のための自己安定性に基づくインターネットサービス基盤の構築
大和崎啓, 長谷部浩二, 杉木章義, 加藤和彦
コンピュータソフトウェア日本ソフトウェア科学会 2009年01月 [査読有り][通常論文]

Tuning mechanisms for two major parameters of Apache web servers
Akiyoshi Sugiki, Kenji Kono, Hideya Iwasaki
SOFTWARE-PRACTICE & EXPERIENCE 38 12 1215 - 1240 2008年10月 [査読有り][通常論文]

Apache web servers are widely used as stand-alone servers or front-ends in multi-tiered web servers. Despite the wide availability of software, it is quite difficult for many administrators to properly configure their web servers. In particular, setting the performance-related parameters is an error-prone and time-consuming task because their values heavily depend on the server environment. In this paper, two mechanisms are described for automatically tuning two performance-related parameters of Apache web servers: KeepAliveTimeout and MaxClients. These mechanisms are easy to deploy because no modifications to the server or the operating system are required. Moreover, they are parameter specific. Although interference between KeepAliveTimeout and MaxClients is inevitable, the tuning mechanisms minimize the correlation by using almost completely independent metrics. Experimental results show that these mechanisms work well for two different workloads; the parameter values are close to optimal and can adapt to workload changes. Copyright (C) 2007 John Wiley & Sons, Ltd.

Tuning mechanisms for two major parameters of Apache web servers
Akiyoshi Sugiki, Kenji Kono, Hideya Iwasaki
SOFTWARE-PRACTICE & EXPERIENCE 38 12 1215 - 1240 2008年10月 [査読無し][通常論文]

Apache web servers are widely used as stand-alone servers or front-ends in multi-tiered web servers. Despite the wide availability of software, it is quite difficult for many administrators to properly configure their web servers. In particular, setting the performance-related parameters is an error-prone and time-consuming task because their values heavily depend on the server environment. In this paper, two mechanisms are described for automatically tuning two performance-related parameters of Apache web servers: KeepAliveTimeout and MaxClients. These mechanisms are easy to deploy because no modifications to the server or the operating system are required. Moreover, they are parameter specific. Although interference between KeepAliveTimeout and MaxClients is inevitable, the tuning mechanisms minimize the correlation by using almost completely independent metrics. Experimental results show that these mechanisms work well for two different workloads; the parameter values are close to optimal and can adapt to workload changes. Copyright (C) 2007 John Wiley & Sons, Ltd.

A Platform for Cooperative Server Backups based on Virtual Machines
Akiyoshi,Sugiki, Kei,Yamatozaki, Richard,Potter, Kazuhiko,Kato
International Service Availability Symposium 2008 5017 129-141 Lecture Notes in Computer Science (LNCS) 2008年05月 [査読有り][通常論文]

実験計画法を利用したウェブサーバの主要なパラメータ選択手法(セッション2:システム構成法)
杉木, 章義, 加藤, 和彦
情報処理学会研究報告. [システムソフトウェアとオペレーティング・システム] 2008 35 33 - 40 一般社団法人情報処理学会 2008年04月 [査読無し][通常論文]

近年,ウェブサーバの管理コストが主要な問題の一つとして認識されており,効率的な管理手法が求められている.特に,パラメータ設定作業は多大な経験と時間を必要とし,難易度の高いタスクとなっている.最新のウェブサーバには数十個のパラメータがあり,これらを人手で設定するのは難しい.また,計算機による自動設定の場合であっても,全てのパラメータを対象としたのでは探索空間が膨大となり,現実的な時間で設定完了するのは困難である.本論文では,実験計画法を利用した主要なパラメータ選択手法を提案する.本手法を用いることで少ない実験回数で多数のパラメータを同時に調査し,少数の性能に大きな影響を与えるパラメータに絞り込むことができる.また,性能測定に含まれる誤差を統計的に管理し,効果を判定することができる.Apacheウェブサーバに対してSPECweb2005の3種類のワークロードを与えた場合について調査を行い,32回の実験で試行した24個のパラメータのうち,6-9個に有意に

A Platform for Cooperative Server Backups Based on Virtual Machines.
Akiyoshi Sugiki, Kei Yamatozaki,Richard Potter, Kazuhiko Kato
Service Availability, 5th International Service Availability Symposium, ISAS 2008, Tokyo, Japan, May 19-21, 2008, Proceedings 129 - 141 Springer 2008年 [査読有り][通常論文]

仮想機械のスナップショット機構を利用したサービスの高信頼なパッシブ複製手法(仮想化(2))
杉木, 章義, Potter, Richard, 加藤, 和彦
情報処理学会研究報告. [システムソフトウェアとオペレーティング・システム] 2008 9 79 - 86 一般社団法人情報処理学会 2008年01月 [査読無し][通常論文]

近年,PCサーバ上で仮想機械を利用したサービス提供が広く行われている.仮想機械はサービスの提供に必要な環境をカプセル化し,環境ごと移送できるため,ディザスタリカバリなどの障害対策にも応用することができる。本論文では,特定のサービスに依存しない仮想機械のスナップショット機構を利用した高信頼なパッシブ複製手法を提案する.本機構はPaxosアルゴリズムを利用し,スナップショットの複製中に障害が発生しても,最新のコミットされたスナップショットから正しく回復させることができる。また,本機構は差分スナップショットとそのマージ機構を利用しており,ネットワーク転送コストと回復時間の削減の両立を行っている。本機構をSBUMLを利用し,Javaで実装を行った.標準的なベンチマークで実験を行ったところ,障害から正しく回復できることを対処できることを確認した.

リクエスト待機間隔を考慮したウェブサーバのkeep-alive時間の自動設定 ”
杉木章義, 河野健二, 岩崎英哉
コンピュータソフトウェア 24 2 68-78 日本ソフトウェア科学会 2007年01月 [査読有り][通常論文]

A practical approach to automatic parameter-tuning of Web servers
A Sugiki, K Kono, H Iwasaki
ADVANCES IN COMPUTER SCIENCE - ASIAN 2005, PROCEEDINGS 3818 146 - 159 2005年 [査読有り][通常論文]

This paper presents a practical approach to automatically tuning the parameters of the Apache Web server. In particular, two significant parameters, KeepAliveTimeout and MaxClients, are dealt with. The notable features of our approach are twofold. First, it is easy to deploy because no modifications to Apache or the underlying operating system are required. Second, our approach is based on the detailed analysis on how each parameter affects the server's behavior. Experimental results demonstrate that our prototype works well on different workloads; it can discover almost optimal values and quickly adapt to workload changes.

A practical approach to automatic parameter-tuning of web servers
Akiyoshi Sugiki, Kenji Kono, Hideya Iwasaki
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 3818 146 - 159 2005年 [査読有り][通常論文]

This paper presents a practical approach to automatically tuning the parameters of the Apache Web server. In particular, two significant parameters, KeepAliveTimeout and MaxClients, are dealt with. The notable features of our approach are twofold. First, it is easy to deploy because no modifications to Apache or the underlying operating system are required. Second, our approach is based on the detailed analysis on how each parameter affects the server's behavior. Experimental results demonstrate that our prototype works well on different workloads it can discover almost optimal values and quickly adapt to workload changes. © Springer-Verlag Berlin Heidelberg 2005.

講演・口頭発表等

高水準なマイクロサービス層における複数ドメインを連携させたインタークラウドHPC環境実現の検討 [通常講演]
杉木章義
研究報告システムソフトウェアとオペレーティング・システム（OS） 2021年07月口頭発表（一般）

microburst: クラウドネイティブ環境を起点とした異種混合HPCアプリケーション開発と展開の検討 [通常講演]
杉木章義
研究報告ハイパフォーマンスコンピューティング（HPC） 2021年07月口頭発表（一般）

Synthetic Population for Real-Scale Social Simulations [通常講演]
Tadahiko Murata, Susumu Date, Yusuke Goto, Toshihiro Hanawa, Takuya Harada, Manabu Ichikawa, Hao Lee, Masaharu Munetomo, Akiyoshi Sugiki
IEEE/ACM International Conference for High Performance Computing, Networking, Storage and Analysis: SC 20 (online, USA) ポスター発表

日本人口の保護レベル別合成データ配布システム [通常講演]
村田忠彦, 市川学, 後藤裕介, 杉木章義, 伊達進, 塙敏博, 原田拓弥, 棟朝雅晴, 李皓
第 36 回ファジィシステムシンポジウム(ビデオ会議，久留米，福岡) ポスター発表

大型計算機センター法制化50周年記念シンポジウム：パネルディスカッション [招待講演]
岩下武史, 杉木章義, 江川隆輔, 星野哲也, 嶋田創, 深沢圭一郎, 伊達進, 嶋吉隆夫
大型計算機センター法制化50周年記念シンポジウム 2019年06月シンポジウム・ワークショップパネル（指名）

GakuNin RDMと北海道大学ハイパフォーマンスインタークラウドの連携による研究活動の推進について [通常講演]
杉木章義
国立情報学研究所学術情報基盤オープンフォーラム2019：コンテンツ・OSトラック(1) 2019年05月公開講演，セミナー，チュートリアル，講習，講義等

北海道大学ハイパフォーマンスインタークラウドの概要：SINET5と学認クラウド連携による実用フェーズのインタークラウド環境 [通常講演]
杉木章義
国立情報学研究所学術情報基盤オープンフォーラム2019：クラウドトラック(1) 2019年05月公開講演，セミナー，チュートリアル，講習，講義等

その他活動・業績

5分で分かる!? 有名論文ナナメ読み：Anil Madhavapeddy et al. : Unikernels : Library Operating Systems for The Cloud
杉木章義情報処理学会会誌「情報処理」 61 (11) 1142 -1144 2020年10月 [査読無し][通常論文]

北海道大学ハイパフォーマンスインタークラウドの設計,構築,運用まで
杉木章義, 棟朝雅晴日本オペレーションズ・リサーチ学会機関誌「オペレーションズ・リサーチ」 64 (9) 507 -513 2019年

Hadoop/Sparkにおける第2階層スケジューラ導入によるタスク進捗度平準化の検討
杉木章義, 岩井良成情報処理学会研究報告(Web) 2017 (OS-141) Vol.2017‐OS‐141,No.17,1‐7 (WEB ONLY) 2017年07月19日 [査読無し][通常論文]

Cgroupsを利用したHadoopにおける落ちこぼれタスクのリソース制限による再現
岩井良成, 杉木章義, 棟朝雅晴情報処理学会研究報告(Web) 2017 (OS-140) Vol.2017‐OS‐140,No.13,1‐6 (WEB ONLY) 2017年05月09日 [査読無し][通常論文]

冬道情報サービスのためのエッジサーバーによる分散処理環境の検討 (ITS研究会通信,計測,ITS関連一般)
市居遼平, 棟朝雅晴, 杉木章義電気学会研究会資料. ITS 2016 (1) 83 -88 2016年03月10日 [査読無し][通常論文]

冬道情報サービスのためのエッジサーバーによる分散処理環境の検討 (ITS)
市居遼平, 棟朝雅晴, 杉木章義電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 (504) 83 -88 2016年03月10日 [査読無し][通常論文]

冬道情報サービスのためのエッジサーバーによる分散処理環境の検討
市居遼平, 棟朝雅晴, 杉木章義電子情報通信学会技術研究報告 115 (504(ITS2015 84-99)) 83‐88 2016年03月03日 [査読無し][通常論文]

Heterogeneous Architectureを活用したネットワークパケット処理の検討
杉木章義, 佐藤聡情報処理学会研究報告(Web) 2014 (OS-130) VOL.2014-OS-130,NO.19 (WEB ONLY) 2014年07月21日 [査読無し][通常論文]

Heterogeneous Architectureを活用したネットワークパケット処理の検討
杉木章義, 佐藤聡研究報告システムソフトウェアとオペレーティング・システム（OS） 2014 (19) 1 -6 2014年07月21日 [査読無し][通常論文]

本論文では，Intel MIC アーキテクチャや CPU/GPU 統合プロセッサに代表される異種混在型アーキテクチャ上でのネットワークパケット処理について検討する．元々は GPGPU 用に記述された Longest Prefix Match (LPM)，Packet Classifier，Aho-Corasick の 3 つのアルゴリズムを OpenCL に移植し，Xeon Phi 上で予備評価を行った結果について報告する．また，汎用マルチコア CPU 上で処理を行った場合との性能比較を行い，今後のアプローチの有効性について検討する．

筑波大学におけるMS EESの導入 : KMSライセンス認証ログの分析から (インターネットアーキテクチャ)
杉木章義, 佐藤聡, 和田耕一電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113 (443) 171 -177 2014年02月27日 [査読無し][通常論文]

筑波大学では,Microsoft EESライセンスを2013年3月より締結し,導入に向けた作業を行った.EESライセンスは国内の数多くの大学でも既に導入されているが,本学での状況に合わせて運用をカスタマイズし,学内ダウンロードによるソフトウェア配布とKMSライセンス認証を原則とした運用方針を採用した.本研究では,MS EESライセンスの導入を行った2013年3月から12月にかけての9ケ月以上にわたるKMSライセンス認証ログを蓄積し,その分析から,学内でのMS EESライセンスの活用状況やその問題点について報告する.

筑波大学におけるMS EESライセンスの導入 : KMSライセンス認証ログの分析から (技術と社会・倫理)
杉木章義, 佐藤聡, 和田耕一電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113 (442) 171 -177 2014年02月27日 [査読無し][通常論文]

筑波大学では,Microsoft EESライセンスを2013年3月より締結し,導入に向けた作業を行った.EESライセンスは国内の数多くの大学でも既に導入されているが,本学での状況に合わせて運用をカスタマイズし,学内ダウンロードによるソフトウェア配布とKMSライセンス認証を原則とした運用方針を採用した.本研究では,MS EESライセンスの導入を行った2013年3月から12月にかけての9ケ月以上にわたるKMSライセンス認証ログを蓄積し,その分析から,学内でのMS EESライセンスの活用状況やその問題点について報告する.

筑波大学におけるMS EESの導入―KMSライセンス認証ログの分析から―
杉木章義, 佐藤聡, 和田耕一電子情報通信学会技術研究報告 113 (442(SITE2013 58-74)) 171 -177 2014年02月20日 [査読無し][通常論文]

筑波大学におけるMS EESの導入―KMSライセンス認証ログの分析から―
杉木章義, 佐藤聡, 和田耕一研究報告インターネットと運用技術（IOT） 2014 (30) 1 -7 2014年02月20日 [査読無し][通常論文]

筑波大学では，Microsoft EES ライセンスを 2013 年 3 月より締結し，導入に向けた作業を行った．EES ライセンスは国内の数多くの大学でも既に導入されているが，本学での状況に合わせて運用をカスタマイズし，学内ダウンロードによるソフトウェア配布と KMS ライセンス認証を原則とした運用方針を採用した．本研究では，MS EES ライセンスの導入を行った 2013 年 3 月から 12 月にかけての 9 ヶ月以上にわたる KMS ライセンス認証ログを蓄積し，その分析から，学内での MS EES ライセンスの活用状況やその問題点について報告する．

学内無線LANシステムにおける利用統計データの分析とその課題
杉木章義, 佐藤聡, 和田耕一情報処理学会研究報告(Web) 2013 (IOT-23) VOL.2013-IOT-23,NO.7 (WEB ONLY) 2013年09月20日 [査読無し][通常論文]

大学キャンパス内の移動端末の利用状況
杉木章義, 佐藤聡, 和田耕一情報処理学会研究報告(Web) 2013 (OS-126) WEB ONLY VOL.2013-OS-126,NO.21 2013年07月24日 [査読無し][通常論文]

仮想資源管理基盤におけるキャッシュ機構の導入
杉木章義, 加藤和彦情報処理学会論文誌トランザクション(CD-ROM) 2012 (2) ROMBUNNO.KONPYUTINGUSHISUTEMU,VOL.6,NO.1,31-44 2013年04月15日 [査読無し][通常論文]

クラウド基盤ソフトウェアにおけるFailure‐Oblivious Computing導入
杉木章義, 奥畑聡仁, 加藤和彦情報処理学会論文誌トランザクション(CD-ROM) 2012 (2) ROMBUNNO.KONPYUTINGUSHISUTEMU,VOL.5,NO.5,103-117 2013年04月15日 [査読無し][通常論文]

サーバ・チューニング記述のためのスクリプティング環境
相川拓也, 杉木章義, 加藤和彦情報処理学会論文誌トランザクション(CD-ROM) 2012 (2) ROMBUNNO.KONPYUTINGUSHISUTEMU,VOL.5,NO.5,138-151 2013年04月15日 [査読無し][通常論文]

東日本大震災時の筑波大学情報インフラにおける対応と課題
佐藤聡, 杉木章義, 陳漢雄, 古瀬一隆, 片岸一起, 中井央, 秡川友宏, 前田敦司, 和田耕一情報処理学会論文誌 54 (3) 1038 -1049 2013年03月15日
平成23年3月11日に起きた東日本大震災で，茨城県つくば市にメインキャンパスを持つ筑波大学も被災し，大学周辺地域とともに停電を体験した．これにより，筑波大学の情報インフラの運用は大きな影響を受けた．各種システムの依存関係を考慮し，限られた電源容量において稼働可能な最低限のシステムを選択し，運用するといった震災関連の対応を振り返ることにより，今後の防災対策案を検討した．その中から実施したいくつの対策案について報告する．また震災後のネットワークシステムのログを分析し，震災後に学内，学外からどのようにネットワークが利用されたかを示し，情報発信のために行った対策が有効であったかを示す．University of Tsukuba, which has main campus at Tsukuba City in Ibaraki, was struck by Tohoku Region Pacific Coast Earthquake that occurred on March 11, 2011. Moreover, our university experienced the power failure with the university surrounding area. We selected minimum systems which can run in limited power capacity considering the dependancy between systems, and have operated them. These plan and action have reflected on several disaster plan concerning the information infrastructure. Using analysis of the network system logs before/after the earthquake, we report how the campus from outside after the earthquake that the network was used from inside/outside, and clarify the effectiveness of the measures of information infrastructure in order to continue the announcement.

東日本大震災時の筑波大学情報インフラにおける対応と課題
佐藤聡, 杉木章義, CHEN Hanxiong, 古瀬一隆, 片岸一起, 中井央, 秡川友宏, 前田敦司, 和田耕一情報処理学会論文誌ジャーナル(CD-ROM) 54 (3) 1038 -1049 2013年03月15日 [査読無し][通常論文]

仮想資源管理基盤におけるキャッシュ機構の導入
杉木章義, 加藤和彦情報処理学会論文誌コンピューティングシステム（ACS） 6 (1) 31 -44 2013年01月31日
近年，クラウドコンピューティングが注目されている．クラウドを支えるデータセンタにおいて，仮想計算機，ネットワーク，ストレージなどのさまざまな資源が用いられており，これらを効率的かつ適切に管理することは重要である．本論文では，これらを管理する仮想資源管理基盤ソフトウェアにキャッシュ機構を導入する．本機構では，さまざまな資源を分散オブジェクトとして統一的に扱うため，分散オブジェクトのキャッシュ技術をそのまま適用することができる．また，キャッシュポリシによる資源ごとのキャッシュ期間の指定や，インバリデーションによるキャッシュの無効化も行う．実験では，個別の操作ごとの性能改善効果やオーバヘッドを示すとともに，多数の仮想計算機を管理する場合の効率性を改善できることを確認した．In recent years, cloud computing has been received much attention. Resources in such clouds are managed in a large-scale data center which consists of thousands of machines, network switches, and storages. Virtualization technology at each layer also makes management ever difficult. In this paper, we present a caching technique for such virtual infrastructure. By taking advantage of reference locality, it achieves high efficiency as well as maintaining consistency. Our approach is based on classical caching techniques for distributed objects since resources in the target platform are represented as distributed objects. Consistency is also managed by timeouts and invalidation protocol following the given policy. In the experiments, we have shown that overhead and performance improvement for each operation and demonstrated its effectiveness in virtual machine management.

クラウド基盤ミドルウェアKumoiのセキュリティ設計と実装
杉木章義, 加藤和彦コンピュータソフトウェア 30 (4) 4.3-4.17 (J-STAGE) -17 2013年 [査読無し][通常論文]

著者らは，クラウド基盤ミドルウェアKumoiを開発している．Kumoiでは，物理計算機，仮想マシン，ネットワークなどのさまざまな資源を分散オブジェクトとして抽象化し，スクリプティングでこれらを組み合わせ，クラウドシステム全体を構成可能とすることで，カスタマイズ性と拡張性の実現を目指している．本論文では，クラウド基盤ミドルウェアに必要とされている認証・認可・課金・監査，および通信路の暗号化などの機能が，Kumoiの当初のコンセプトを保ちつつ，ソフトウェア構成の観点から，どのように自然に実現されているかについて述べる．

サーバ・チューニング記述のためのスクリプティング環境
相川拓也, 杉木章義, 加藤和彦情報処理学会論文誌コンピューティングシステム（ACS） 5 (5) 138 -151 2012年10月15日
サーバのチューニングは，性能を左右する重要なタスクである一方で，管理者にとって困難をともなう．パラメータの最適値は多くの場合， 1 回のチューニングでは求まらず，さまざまな試行錯誤を行う必要がある．また， 1 回の試行においても，サーバの設定を変更するだけではなく，複数台からなるクライアントの設定を変更し，起動するなど，煩雑な手続きが必要である．本研究では，このチューニングにおける試行錯誤の過程を効率化するスクリプティング環境を提案する．本提案では，サーバやクライアントなどチューニングに関連する要素をすべて分散オブジェクト化し，統一的な環境で高水準に試行の過程を記述可能とする．また，自動チューニングアルゴリズムのライブラリ化を行うことで，利便性の向上を図る．実験では， SPECweb2005 ベンチマーク下の Apache ウェブサーバと Hadoop を対象として実験を行い，本環境を利用してチューニングができることを確認した．Although parameter tuning is critical for server performance, that tuning process is error-prone and time consuming. An administrator must repeat many iterations to find an optimal configuration and even at each step non-trivial tasks, including proper configuration of a server and launching benchmark clients, are required. In this paper, we present a scripting environment for efficiently describing such tuning process. We offer distributed objects as ways to manipulate a server and benchmark clients. By this way, tuning process can be described by scripting them in an integrated environment. We also provide automatic tuning as a library for further efficiency. In the experiments, we confirmed that tuning of an Apache web server under SPECweb2005 benchmark and a Hadoop cluster were successfully possible in our tuning environment.

クラウド基盤ソフトウェアにおけるFailure-Oblivious Computing導入
杉木章義, 奥畑聡仁, 加藤和彦情報処理学会論文誌コンピューティングシステム（ACS） 5 (5) 103 -117 2012年10月15日
近年，クラウドコンピューティングが注目されている．クラウドは多くの場合，大規模なデータセンタで運用されており，さまざまな障害にもかかわらず，全体のシステムを適切に運用する必要がある．本論文では， Failure-Oblivious Computing の概念をクラウド基盤ソフトウェアに導入し，可用性を向上させることを提案する．本方式では，全体の処理の継続を優先し，一部の障害を見逃すことでシステム全体の可用性の向上を目指す．我々が開発しているクラウド基盤ソフトウェア KumoiにFailure-Oblivious Computing の導入を行い，システムの継続性や副作用による影響などの観点から評価を行った．In recent years, cloud computing has drawn much attention from both industry and academia. A cloud is typically hosted in a large-scale data center that must be well operated despite various failures that may cause severe damage. In this paper, we present a technique to increase availability by introducing a failure-oblivious concept into a software cloud platform. As in the original concept, we made the cloud platform continue its operation even when the presence of failures. To confirm the effectiveness of this approach, we have implemented that concept into our cloud platform, Kumoi, and evaluated it in terms of continued execution and influence from side-effects.

クラウド基盤ソフトウェアにおけるLineageを利用した障害対策手法の検討
奥畑聡仁, 杉木章義, 加藤和彦情報処理学会研究報告(CD-ROM) 2012 (3) ROMBUNNO.OS-122,NO.21 2012年10月15日 [査読無し][通常論文]

クラウド基盤ソフトウェアにおけるFailure-Oblivious Computing導入の検討
杉木章義, 奥畑聡仁, 加藤和彦先進的計算基盤システムシンポジウム論文集 2012 168 -175 2012年05月09日 [査読無し][通常論文]

レイテンシの違いを利用したネットブート配信環境の局所的な切り替え手法
高田真吾, 佐藤聡, 中井央, 杉木章義, 新城靖研究報告インターネットと運用技術（IOT） 2012 (12) 1 -6 2012年03月08日
大学のような多数の計算機を保有する組織では，その稼働率を上げることが課題となっている．本研究では，ネットワークブートされる計算機資源を有効活用するため，局所的に通常とは異なる計算機環境を配信する手法を提案する．提案手法では，ネットブートで利用される DHCP が早い者勝ちのプロトコルであるという特徴を利用し，既存の DHCP サーバよりも早く応答する DHCP サーバをネットワークに接続し，そのサーバからの応答が届く範囲にのみ，通常とは異なる計算機環境を配信する．提案手法を実際に筑波大学の端末室に適用し評価実験を行ったところ，本来の DHCP サーバからの応答はリレーにより遅延し，接続した DHCP サーバからの応答が先に端末に到達することを確認した．また，この遅延による時間差は，DHCP サーバへのリクエストが集中した場合には小さくなることを示した．Improving the usage rate of the computers is important in organizations that have a lot of computers. The authors propose a method to switch the computer environment which is distributed via the network. The proposed system uses the DHCP's characteristic: first-come-first-served. We inject a DHCP server which can respond to the client faster than the original one. Only netboot clients that receive the injected server's DHCP message faster than the original server can boot the different computer environment. The authors constructed a prototype of the proposed method and made experiments. The results show: (1) the original server's response is slower than the injected one because of the delay of the DHCP relaying, (2) the relaying delay would be reduced if the DHCP requests are concentrated.

レイテンシの違いを利用したネットブート配信環境の局所的な切り替え手法
高田真吾, 佐藤聡, 中井央, 杉木章義, 新城靖電子情報通信学会技術研究報告 111 (484(SITE2011 32-55)) 65 -70 2012年03月08日 [査読無し][通常論文]

大学のような多数の計算機を保有する組織では,その稼働率を上げることが課題となっている.本研究では,ネットワークブートされる計算機資源を有効活用するため,局所的に通常とは異なる計算機環境を配信する手法を提案する.提案手法では,ネットブートで利用されるDHCPが早い者勝ちのプロトコルであるという特徴を利用し,既存のDHCPサーバよりも早く応答するDHCPサーバをネットワークに接続し,そのサーバからの応答が届く範囲にのみ,通常とは異なる計算機環境を配信する.提案手法を実際に筑波大学の端末室に適用し評価実験を行ったところ,本来のDHCPサーバからの応答はリレーにより遅延し,接続したDHCPサーバからの応答が先に端末に到達することを確認した.また,この遅延による時間差は,DHCPサーバへのリクエストが集中した場合には小さくなることを示した.

クライアント,ネットワーク,サーバ環境を統合したディペンダブルクラウドの検証
廣岡誠之, 石井嘉明, 矢野恭平, 杉木章義, 加藤和彦情報処理学会全国大会講演論文集 74th (1) 1.3-1.4 2012年03月06日 [査読無し][通常論文]

広域分散環境を活用した災害対策用自律ミラーサイトシステムの開発
矢野恭平, 石井嘉明, 廣岡誠之, 杉木章義, 加藤和彦情報処理学会全国大会講演論文集 74th (1) 1.5-1.6 2012年03月06日 [査読無し][通常論文]

予見化によるシームレスなスケーラビリティと統合的システム復旧を実現するクラウドシステム
石井嘉明, 矢野恭平, 廣岡誠之, 杉木章義, 加藤和彦情報処理学会全国大会講演論文集 74th (1) 1.1-1.2 2012年03月06日 [査読無し][通常論文]

クラウドコンピューティング基盤を活用した災害対策用自律ミラーサイトシステムの提案
矢野恭平, 石井嘉明, 廣岡誠之, 杉木章義, 加藤和彦全国大会講演論文集 2012 (1) 5 -7 2012年03月06日 [査読無し][通常論文]

2011年に発生した東日本大震災では,サーバへのアクセス集中などにより,地方自治体や公共交通機関において,情報伝達に不具合が発生した.これらの機関では,大規模災害時においても継続した情報サービスの提供が求められ,システムには高い可用性が必要となる.本研究では,アクセス負荷に対して自律的にスケールアウトするミラーサイトシステムをクラウドコンピューティング基盤Kumoiを機能拡張することにより開発した.本システムは,複数のデータセンターを用いた広域分散環境を活用し,データセンター間でデータを同期することで,データセンター障害にも対応している.

クライアント,ネットワーク,サーバ環境を統合したディペンダブルクラウドの検証
廣岡誠之, 石井嘉明, 矢野恭平, 杉木章義, 加藤和彦全国大会講演論文集 2012 (1) 3 -5 2012年03月06日 [査読無し][通常論文]

近年,クラウドコンピューティングによるサービスが利用されるようになり,インターネットを通して安定したサービスの提供が求めれられている.しかし,クラウドコンピューティングを支える技術はサーバ環境を基本としており,クライアント環境やネットワーク環境についてはあまり考慮されていない.本研究では,クライアント環境,ネットワーク環境,サーバ環境を統合し,ディペンダブルなクラウドコンピューティング環境を構築した.本環境の性能検証をおこなった結果,ネットワーク障害やサーバ障害に対して自動的に復旧し,クライアントから継続的にサービスが利用できることを確認した.

予見化によるシームレスなスケーラビリティと統合的システム復旧を実現するクラウドシステム
石井嘉明, 矢野恭平, 廣岡誠之, 杉木章義, 加藤和彦全国大会講演論文集 2012 (1) 1 -3 2012年03月06日 [査読無し][通常論文]

近年,クラウドコンピューティングの普及が進んでいる.クラウドコンピューティング環境では,運用効率を高めるために物理計算機を仮想化する場合が多い.仮想化技術に基づくHAやスケーラビリティといった技術は,サービスの継続性を確保する上で重要である.しかし,これらの技術はシステム全体を復旧するものではない.本研究では,クラウドコンピューティング基盤Kumoiを用い,物理・仮想計算機障害に対して,アプリケーションを含めたシステム全体を自動復旧するクラウドシステムを開発した.また,リソース負荷を予見化し,スケールアウトする仮想計算機を事前に作成,起動することで,シームレスなスケーラビリティも実現した.

クラウドコンピューティング基盤を活用した災害対策用自律ミラーサイトシステムの提案
矢野恭平, 石井嘉明, 廣岡誠之, 杉木章義, 加藤和彦第74回全国大会講演論文集 2012 (1) 5 -6 2012年03月06日 [査読無し][通常論文]

2011年に発生した東日本大震災では，サーバへのアクセス集中などにより，地方自治体や公共交通機関において，情報伝達に不具合が発生した．これらの機関では，大規模災害時においても継続した情報サービスの提供が求められ，システムには高い可用性が必要となる．本研究では，アクセス負荷に対して自律的にスケールアウトするミラーサイトシステムをクラウドコンピューティング基盤Kumoiを機能拡張することにより開発した．本システムは，複数のデータセンターを用いた広域分散環境を活用し，データセンター間でデータを同期することで，データセンター障害にも対応している．

クライアント，ネットワーク，サーバ環境を統合したディペンダブルクラウドの検証
廣岡誠之, 石井嘉明, 矢野恭平, 杉木章義, 加藤和彦第74回全国大会講演論文集 2012 (1) 3 -4 2012年03月06日 [査読無し][通常論文]

近年，クラウドコンピューティングによるサービスが利用されるようになり，インターネットを通して安定したサービスの提供が求めれられている．しかし，クラウドコンピューティングを支える技術はサーバ環境を基本としており，クライアント環境やネットワーク環境についてはあまり考慮されていない．本研究では，クライアント環境，ネットワーク環境，サーバ環境を統合し，ディペンダブルなクラウドコンピューティング環境を構築した．本環境の性能検証をおこなった結果，ネットワーク障害やサーバ障害に対して自動的に復旧し，クライアントから継続的にサービスが利用できることを確認した．

予見化によるシームレスなスケーラビリティと統合的システム復旧を実現するクラウドシステム
石井嘉明, 矢野恭平, 廣岡誠之, 杉木章義, 加藤和彦第74回全国大会講演論文集 2012 (1) 1 -2 2012年03月06日 [査読無し][通常論文]

近年，クラウドコンピューティングの普及が進んでいる．クラウドコンピューティング環境では，運用効率を高めるために物理計算機を仮想化する場合が多い．仮想化技術に基づくHAやスケーラビリティといった技術は，サービスの継続性を確保する上で重要である．しかし，これらの技術はシステム全体を復旧するものではない．本研究では，クラウドコンピューティング基盤Kumoiを用い，物理・仮想計算機障害に対して，アプリケーションを含めたシステム全体を自動復旧するクラウドシステムを開発した．また，リソース負荷を予見化し，スケールアウトする仮想計算機を事前に作成，起動することで，シームレスなスケーラビリティも実現した．

Kumoiを用いたスケーラブルなMoodle環境の構築
石井嘉明, 矢野恭平, 廣岡誠之, 杉木章義, 加藤和彦情報処理学会研究報告(CD-ROM) 2011 (5) ROMBUNNO.CLE-6,NO.4 2012年02月15日 [査読無し][通常論文]

VMApplex:仮想マシンとアプリケーションの統合管理環境
相川拓也, 杉木章義, 加藤和彦日本ソフトウエア科学会大会講演論文集(CD-ROM) 29th ROMBUNNO.DP-1 2012年 [査読無し][通常論文]

Kumoiを用いたスケーラブルなMoodle環境の構築
石井嘉明, 矢野恭平, 廣岡誠之, 杉木章義, 加藤和彦研究報告教育学習支援情報システム（CLE） 2011 (4) 1 -7 2011年11月24日 [査読無し][通常論文]

クラウド環境におけるサーバパラメータ調整のためのスクリプティング環境
相川拓也, 杉木章義, 加藤和彦情報処理学会研究報告(CD-ROM) 2011 (2) ROMBUNNO.OS-118,NO.11 2011年08月15日 [査読無し][通常論文]

インターネットサービス基盤の構築に向けたパッシブ複製の自己安定化手法
大和崎啓, 長谷部浩二, 杉木章義, 加藤和彦情報処理学会研究報告(CD-ROM) 2010 (5) ROMBUNNO.OS-116,NO.11 2011年02月15日 [査読無し][通常論文]

耐障害性向上のための自己安定性に基づくインターネットサービス基盤の構築
大和崎啓, 長谷部浩二, 杉木章義, 加藤和彦コンピュータソフトウェア 28 (1) 1.248-1.257 (J-STAGE) 2011年 [査読無し][通常論文]

分散ハッシュテーブルによる省電力性を考慮したストレージシステム
丹羽達也, 長谷部浩二, 杉木章義日本ソフトウェア科学会大会論文集 27 1 -9 2010年09月13日 [査読無し][通常論文]

分散ハッシュテーブルによる省電力性を考慮したストレージシステム
丹羽達也, 長谷部浩二, 杉木章義, 加藤和彦日本ソフトウエア科学会大会講演論文集(CD-ROM) 27th ROMBUNNO.5B-2 2010年 [査読無し][通常論文]

Kumoi:クラウドコンピューティング研究開発のためのシェル環境の構築
杉木章義, 加藤和彦情報処理学会シンポジウム論文集 2009 (13) 75 -82 2009年11月19日 [査読無し][通常論文]

広域分散環境のための仮想機械を利用したサービス協調複製基盤
杉木章義, 大和崎啓, 加藤和彦情報処理学会論文誌トランザクション(CD-ROM) 2008 (2) VOL.2NO.1,1-11 2009年04月15日 [査読無し][通常論文]

広域分散環境のための仮想機械を利用したサービス協調複製基盤
杉木章義, 大和﨑啓, 加藤和彦情報処理学会論文誌コンピューティングシステム（ACS） 2 (1) 1 -11 2009年03月25日
近年のインターネットサービスは厳しい時間と資源制約のもとに開発されている．サービスに対する高い可用性が求められているものの，短い開発期間からサービスに複製処理を追加し，十分なテストを行うことは難しい．また，離れた拠点に複製を行う広域複製が潜在的には望まれているものの，多くの場合，コストの問題から導入を諦めているのが現状である．本論文では，広域分散環境における仮想機械を利用したサービス協調複製基盤を提案する．まず，サービス提供者がお互いに計算機資源を提供し，サービスを複製しあうことで少ない参加コストでサービスの可用性を高めることができる．次に，仮想機械を用いることでサービスごとの独立性を高め，特定のサービスに依存しない複製処理や再開機能を提供することができる．本基盤をXenとScrap Book for User-Mode Linuxの2つの仮想機械とともに実装し，日本国内の3拠点で実験を行った．その結果，2つのサービスを同時に稼働させた場合でも，障害から回復することが確認された．Recent Internet services have been developed at extremely limited time and resources. Although service availability is highly demanded, it is generally difficult to achieve high availability within short developing time. Remote replication is a potentially demanded solution to protect a service from whole site down, but it is hardly adopted from small service providers due to unacceptable costs. In this paper, we present a cooperative virtual machine-based replication platform for wide-area environments. We provide a cost-effective, highlyavailable solution via service state replication over peer-to-peer platform. Virtual machines increase reliability over such platform by isolating each other and capturing complete service state. We have implemented a prototype supporting two virtual machines, Xen and Scrap Book for User-Mode Linux. Our experimental results show that the prototype successfully replicated two services on three sites in Japan and recovered them in case of failures.

Power‐aware Chord:省電力性を考慮した分散ハッシュテーブル
丹羽達也, 長谷部浩二, 杉木章義, 加藤和彦日本ソフトウエア科学会大会講演論文集(CD-ROM) 26th ROMBUNNO.4B-3 2009年 [査読無し][通常論文]

耐障害性向上のための自己安定性に基づくインターネットサービス基盤の構築
大和崎啓, 長谷部浩二, 杉木章義, 加藤和彦日本ソフトウエア科学会大会講演論文集(CD-ROM) 26th ROMBUNNO.3B-3 2009年 [査読無し][通常論文]

広域分散環境のための仮想機械を利用したサービス協調複製基盤
杉木章義, 大和崎啓, 加藤和彦情報処理学会シンポジウム論文集 2008 (12) 3 -12 2008年11月05日 [査読無し][通常論文]

クォーラムシステムにおける消費電力の最適化手法
石川宗寿, 長谷部浩二, 杉木章義, 品川高廣, 加藤和彦電子情報通信学会技術研究報告 108 (248(DC2008 22-27)) 17 -22 2008年10月13日 [査読無し][通常論文]

本研究では,クォーラムシステム,特にその特殊型であるCrumbling wallの消費電力を最小化するためのアルゴリズムを示す.我々のアルゴリズムは,ある与えられたCrumbling wallに対して,各ノードのキャパシティを超えないようにしながらストラテジー(処理の割り振り方)を最適化するものである.ただしここで,Crumbling wallにおけるストラテジーの組み合わせは,ノード数の増加に対して爆発する可能性がある.したがって,線形計画法などを直接用いることでストラテジーの最適化を行うことは難しい.そのため本稿で提案する基本的なアイデアは,最適解が常に含まれるようにしながら,探索空間となるストラテジーの集合をある特殊な範囲に限定するというものである.これにより,我々のアルゴリズムは行の数がdのCrumbling wallに対してO(d^2)の計算量で最適なストラテジーを求めることができる.

応答時間を考慮した Quorum プロトコルを利用するストレージの配置最適化
石川宗寿, 杉木章義, 品川高廣, 加藤和彦情報処理学会研究報告システムソフトウェアとオペレーティング・システム（OS） 2008 (35) 107 -113 2008年04月24日 [査読無し][通常論文]

データセンターの多拠点化やエッジサーバなど，広域分散環境でインターネットサービスの提供を行う機会が増加している．それに伴い，ストレージも広域分散化しており，データの一貫性を適切に管理する必要がある．Quorum プロトコルは，一定の制約のもとで書き込み，読み込みを行う複製の台数を柔軟に変えることができるプロトコルであり，サービスの性質に応じて可用性や応答性を適切に調整することができる．本研究では，応答時間を考慮した Quorum プロトコルの複製の台数を自動設定する機構を提案する．本論文は，提案アルゴリズムについて説明し，その議論を行う．A growing number of Internet services are provided through geographically distributed servers such as edge servers or clusters. In such environments, a certain level of replica consistency must be preserved. A Quorum-based protocol is a kind of replication protocol which can dynamically change the number of replicas that clients write to or read from depending on various circumstances. By changing the number of replicas, each service can satisfy a specific requirements for service availability and latency. In this paper, we present a flexible, latency-aware optimization method for quorum-based protocol. This paper specifically deals with the details of our protocol and discusses basic assumptions and future directions.

仮想機械を利用したサーバ間の協調的バックアップ基盤
大和崎啓, 杉木章義, 加藤和彦情報処理学会研究報告システムソフトウェアとオペレーティング・システム（OS） 2008 (35) 1 -8 2008年04月23日 [査読無し][通常論文]

近年，インターネットサービスに高い可用性が求められている．一般的に可用性を高める手法として複数の物理計算機に複製する手法が広く知られている．しかし，この手法は複数の物理計算機を用意する必要がありコストが高く，特に小さなサービスで広域的に複製を行う場合，利用が難しい．本論文では，仮想機械を利用した Peer-to-Peer 型の協調バックアップ基盤を提案する．サービスを提供する物理計算機同士が互いにサービスの複製を行うことで，少ない計算機資源で耐障害性をサービスに持たせている．また，仮想機械を利用することで，サービス間の独立性を高め，アプリケーションに改変を加えることなく複製や移送を行うことができる．本機構のプロトタイプを仮想機械に Xen を利用し，当研究室で開発が進めているサステーナブルサービス基盤の一部として実装および実験を行った．その結果，障害発生時に複製サーバがサービスを再開し，サービスに耐障害性を持たせられることを確認した．Service availability is crucial for today's Internet services. Traditionally, replicating service state on multiple physical hosts is widely used for high availability. But, preparing multiple machines in geographically diverse environment is expensive, especially for small Internet services. In this paper, we present a virtual machine-based cooperative platform for service backup. The advantage of our platform is twofold: First, by enabling many Internet services to back up their services cooperatively, the platform provides high availability with minimum cost. Second, by using virtual machines, the platform encapsulates the complete states of the services. Furthermore services can share a physical host while maintaining a high level of isolation. We have implemented a prototype of our platform and evaluated it by experiments. The results of our experiments show that participating hosts can back up each others, and that services can recover from host failures.

応答時間を考慮したQuorumプロトコルを利用するストレージの配置最適化
石川宗寿, 杉木章義, 品川高廣, 加藤和彦情報処理学会研究報告 2008 (35(OS-108)) 107 -113 2008年04月16日 [査読無し][通常論文]

データセンターの多拠点化やエッジサーバなど，広域分散環境でインターネットサービスの提供を行う機会が増加している．それに伴い，ストレージも広域分散化しており，データの一貫性を適切に管理する必要がある．Quorum プロトコルは，一定の制約のもとで書き込み，読み込みを行う複製の台数を柔軟に変えることができるプロトコルであり，サービスの性質に応じて可用性や応答性を適切に調整することができる．本研究では，応答時間を考慮した Quorum プロトコルの複製の台数を自動設定する機構を提案する．本論文は，提案アルゴリズムについて説明し，その議論を行う．A growing number of Internet services are provided through geographically distributed servers such as edge servers or clusters. In such environments, a certain level of replica consistency must be preserved. A Quorum-based protocol is a kind of replication protocol which can dynamically change the number of replicas that clients write to or read from depending on various circumstances. By changing the number of replicas, each service can satisfy a specific requirements for service availability and latency. In this paper, we present a flexible, latency-aware optimization method for quorum-based protocol. This paper specifically deals with the details of our protocol and discusses basic assumptions and future directions.

仮想機械を利用したサーバ間の協調的バックアップ基盤
大和崎啓, 杉木章義, 加藤和彦情報処理学会研究報告 2008 (35(OS-108)) 1 -8 2008年04月16日 [査読無し][通常論文]

近年，インターネットサービスに高い可用性が求められている．一般的に可用性を高める手法として複数の物理計算機に複製する手法が広く知られている．しかし，この手法は複数の物理計算機を用意する必要がありコストが高く，特に小さなサービスで広域的に複製を行う場合，利用が難しい．本論文では，仮想機械を利用した Peer-to-Peer 型の協調バックアップ基盤を提案する．サービスを提供する物理計算機同士が互いにサービスの複製を行うことで，少ない計算機資源で耐障害性をサービスに持たせている．また，仮想機械を利用することで，サービス間の独立性を高め，アプリケーションに改変を加えることなく複製や移送を行うことができる．本機構のプロトタイプを仮想機械に Xen を利用し，当研究室で開発が進めているサステーナブルサービス基盤の一部として実装および実験を行った．その結果，障害発生時に複製サーバがサービスを再開し，サービスに耐障害性を持たせられることを確認した．Service availability is crucial for today's Internet services. Traditionally, replicating service state on multiple physical hosts is widely used for high availability. But, preparing multiple machines in geographically diverse environment is expensive, especially for small Internet services. In this paper, we present a virtual machine-based cooperative platform for service backup. The advantage of our platform is twofold: First, by enabling many Internet services to back up their services cooperatively, the platform provides high availability with minimum cost. Second, by using virtual machines, the platform encapsulates the complete states of the services. Furthermore services can share a physical host while maintaining a high level of isolation. We have implemented a prototype of our platform and evaluated it by experiments. The results of our experiments show that participating hosts can back up each others, and that services can recover from host failures.

実験計画法を利用したウェブサーバの主要なパラメータ選択手法
杉木章義, 加藤和彦情報処理学会研究報告 2008 (35(OS-108)) 33 -40 2008年04月16日 [査読無し][通常論文]

耐ネットワーク分断性を持つインターネットサービス向け分散オブジェクト
池嶋俊, 品川高廣, 杉木章義, 加藤和彦情報処理学会研究報告 2008 (9(OS-107)) 25 -32 2008年01月30日 [査読無し][通常論文]

インターネット上で提供されるサービスは多様化し，さらにその重要度を増してきている．しかし，そのインターネットに依存しているサービスは，その経路上の全てのホストおよびネットワーク機器が正常に動作していなければ使用できないため，ローカルで実行するアプリケーションに比べ高い可用性を保証する事は難しい．一部のインターネットサービスは信頼性の低いインターネット上でも継続してサービスが提供できるように設計されているが，新しく作るサービスを継続して提供できるようにする事は開発コストがかかったり，開発自体が困難であったりする場合もある．本研究では，継続動作するサービスを提供できるようにするための分散オブジェクトライブラリを提案する．提案するライブラリを用いる事で，インターネットの信頼性に関する問題はライブラリ層以下で隠蔽され，容易に継続して動作するサービスを開発する事ができる．The number and types of Internet services are consistantly growing. Due to unpredictable network outages, it is difficult to make these services highly available. Currently, few highly-available network services exist because the creation of these services require a high development cost. We propose making Internet services highly available through distributed objects. With our system, if a network outage occurs, our library will ensure the concurrency of the distributed objects. Thus, the service author does not need to be concerned about micro-managing objects.

仮想機械のスナップショット機構を利用したサービスの高信頼なパッシブ複製手法
杉木章義, POTTER Richard, 加藤和彦情報処理学会研究報告 2008 (9(OS-107)) 79 -86 2008年01月30日 [査読無し][通常論文]

近年，PCサーバ上で仮想機械を利用したサービス提供が広く行われている．仮想機械はサービスの提供に必要な環境をカプセル化し，環境ごと移送できるため，ディザスタリカバリなどの障害対策にも応用することができる．本論文では，特定のサービスに依存しない仮想機械のスナップショット機構を利用した高信頼なパッシブ複製手法を提案する．本機構はPaxosアルゴリズムを利用し，スナップショットの複製中に障害が発生しても，最新のコミットされたスナップショットから正しく回復させることができる．また，本機構は差分スナップショットとそのマージ機構を利用しており，ネットワーク転送コストと回復時間の削減の両立を行っている．本機構をSBUMLを利用し，Javaで実装を行った．標準的なベンチマークで実験を行ったところ，障害から正しく回復できることを対処できることを確認した．The use of virtualization technology on commodity PCs has become popular recently. Strong encapsulation and migration functionalities of virtualization make it easy to achieve disaster-tolerant systems. This paper presents a cheap and service-independent state replication technique based on virtual machines. Our approach has two notable features. First, it is based on a well-known Paxos consensus algorithm and we use it for passive standly. Second, our mechanism reduces network transfer cost and recovery time by using incremental snapshots and their merge mechanism. We implemented our prototype in Java with SBUML virtual machines. Our experiments show that our mechanism can sufficiently recover from failures for two standard benchmark workloads.

耐ネットワーク分断性を持つインターネットサービス向け分散オブジェクト
池嶋俊, 品川高廣, 杉木章義, 加藤和彦情報処理学会研究報告システムソフトウェアとオペレーティング・システム（OS） 2008 (9) 25 -32 2008年01月30日 [査読無し][通常論文]

インターネット上で提供されるサービスは多様化し，さらにその重要度を増してきている．しかし，そのインターネットに依存しているサービスは，その経路上の全てのホストおよびネットワーク機器が正常に動作していなければ使用できないため，ローカルで実行するアプリケーションに比べ高い可用性を保証する事は難しい．一部のインターネットサービスは信頼性の低いインターネット上でも継続してサービスが提供できるように設計されているが，新しく作るサービスを継続して提供できるようにする事は開発コストがかかったり，開発自体が困難であったりする場合もある．本研究では，継続動作するサービスを提供できるようにするための分散オブジェクトライブラリを提案する．提案するライブラリを用いる事で，インターネットの信頼性に関する問題はライブラリ層以下で隠蔽され，容易に継続して動作するサービスを開発する事ができる．The number and types of Internet services are consistantly growing. Due to unpredictable network outages, it is difficult to make these services highly available. Currently, few highly-available network services exist because the creation of these services require a high development cost. We propose making Internet services highly available through distributed objects. With our system, if a network outage occurs, our library will ensure the concurrency of the distributed objects. Thus, the service author does not need to be concerned about micro-managing objects.

リクエスト待機間隔を考慮したウェブサーバのkeep‐alive時間の自動設定
杉木章義, 河野健二, 岩崎英哉コンピュータソフトウェア 24 (2) 68 -78 2007年04月24日 [査読無し][通常論文]

リクエスト待機間隔を考慮したウェブサーバのkeep-alive時間の自動設定
杉木章義, 河野健二, 岩崎英哉, Akiyoshi Sugiki, Kenji Kono, Hideya Iwasaki, 電気通信大学大学院電気通信学研究科情報工学専攻, 慶應義塾大学理工学部情報工学科, 電気通信大学電気通信学部情報工学科, Department of Computer, Science Graduate School of Electro-Communications The, University of Electro-Communications, Department of Information, Computer Science, Keio University, Department of Computer, Science The, University of Electro-Communications コンピュータソフトウェア = Computer software 24 (2) 68 -78 2007年 [査読無し][通常論文]

インターネットサーバの手動による性能パラメータ調整は,多くの経験や時間を必要とし,管理コストの増大を招くことが知られている.ウェブサーバの主要な性能パラメータであるkeep-alive時間は,適切に設定しない場合,サーバのスループットや応答性を低下させることがある.本論文では,ウェブサーバのkeep-alive時間の自動設定機構を提案する.本機構は管理者の介入を必要とせず,手動設定で求めた値に近いkeep-alive時間に自動設定する.本機構はリクエスト待機間隔を監視しながら,データを送受信していない接続を切断し,データを頻繁に送受信している多くのクライアントからの接続を保つようにkeep-alive時間を設定する.本機構をApacheウェブサーバを対象としたライブラリとして実装し,実験を行った.その結果,異なる2つの負荷に対して,それぞれkeep-alive時間を自動的に設定し,サーバの性能を適切に維持することを確認した.Manual parameter-tuning of Internet servers causes high administrative costs because it requires administrator's expertise and huge amounts of time. The keep-alive parameter, which is one of major parameters in web servers, may cause severe degradation if it is not set properly. In this paper, we present an automatic tuning technique of the keep-alive parameter. Our mechanism adjusts the parameter without administrator's intervention so as to maintain active connections between clients and a server while closing inactive connections by observing request-waiting intervals. We implemented a prototype for Apache web server. Experimental results show that our prototype automatically adjusted the parameter and successfully yielded the nearly optimal server performance on two different workloads.

応答時間の分散を利用したウェブサーバ接続数の自動設定
杉木章義, 河野健二情報処理学会研究報告システムソフトウェアとオペレーティング・システム（OS） 2006 (44) 37 -44 2006年05月13日 [査読無し][通常論文]

インターネットサーバの人手によるパラメータ設定は、管理コストの増大を招くことが知られており、自動化が求められている。本論文では、ウェブサーバを対象に、応答時間の分散を利用したサーバ接続数の自動設定手法を提案する。サーバは高負荷になると応答時間の分散が急激に大きくなるという現象を示す。本機構は応答時間の分散が大きくなったことを検出し、サーバ接続数を自動設定する。2つのワークロードに対して、応答時間の増加を抑えながら、スループットを最大にするサーバ接続数に自動設定することができた。Automatic parameter-tuning of Internet servers is demanded to reduce high administrative costs by manual tuning. In this paper, we present a tuning mechanism for the maximum number of a web server. Our mechanism is based on the detection of server latency deviation because most servers show unstable behavior when it is overloaded. Experimental results show that our prototype achieved high throughput while reducing server latency on two different workloads.

応答時間の分散を利用したウェブサーバ接続数の自動設定
杉木章義, 河野健二情報処理学会研究報告 2006 (44(OS-102)) 37 -44 2006年05月12日 [査読無し][通常論文]

性能パラメータの自動調整によるWebサーバの性能向上
杉木章義, 河野健二情報処理学会研究報告 2005 (48(OS-99)) 29 -36 2005年05月25日 [査読無し][通常論文]

性能パラメータの自動調整によるWeb サーバの性能向上
杉木章義, 河野健二情報処理学会研究報告システムソフトウェアとオペレーティング・システム（OS） 2005 (48) 29 -36 2005年05月25日 [査読無し][通常論文]

インターネット・サーバの性能パラメータ調整は，適切な値を求めるのが難しく，多くの時間や経験を要する作業である．Web サーバの主要な性能パラメータのひとつであるkeep-alive 時間は，適切に調整しない場合，サーバに対するTCP 接続の使用率を低下させ，スループットを低下させることがある．本論文では，Web サーバのkeep-alive 時間の自動調整機構を提案する．本機構では，データを頻繁に送受信しているクライアントからの接続は維持し，データを送受信しない接続は切断するようkeep-alive 時間を適切に調整する．本機構をApache を対象としたライブラリとして実装し，実験を行った．その結果，異なる2 つの負荷に対して，それぞれkeep-alive時間を自動的に設定し，サーバの性能を向上できることを確認した．Tuning performance parameters of Internet servers is a hard and timeconsuming task for administrators. This paper presents an automatic mechanism of tuning the keep-alive timeout, a performance parameter of Web servers. If it is set improperly, it may cause throughput degradation due to poor usage of connections between clients and a server. To yield higher efficiency of connections, our mechanism tries to keep active connections linked and cut off poorly used connections by adjusting the keep-alive timeout. We have implemented a prototype of this mechanism for the Apache Web server. Experimental results show that our mechanism works well on two different workloads.

リクエスト間隔を考慮したウェブサーバのkeep‐alive時間の自動設定
杉木章義, 河野健二, 岩崎英哉日本ソフトウエア科学会大会講演論文集(CD-ROM) 22nd 7C-2 2005年 [査読無し][通常論文]

リクエスト間隔を考慮したWebサーバのkeep-alive時間の自動調整
杉木章義, 河野健二, 岩崎英哉日本ソフトウェア科学会大会講演論文集 22 (0) 618 -627 2005年 [査読無し][通常論文]

インターネット・サーバの性能パラメータ調整は，多くの時間や経験を要する作業である．Web サーバのkeep-alive 時間は，適切に調整しない場合，TCP 接続の使用率を下げスループットを低下させる．本発表では，データを送受信しない接続を切断するように keep-alive 時間を自動的にかつ適切に調整する機構を提案する．本機構を Apache を対象として実装した結果，異なる2 つの負荷に対して適切にkeep-alive 時間を設定し，サーバの性能を向上させることを確認した．

ディペンダブルなインターネットサーバを構築するためのカスタマイズ可能なクラスタ用ツールキット
杉木章義, 河野健二, 岩崎英哉, 益田隆司日本ソフトウエア科学会大会論文集 20th (Pt.1) 230 -234 2003年09月16日 [査読無し][通常論文]

ディペンダブルなインターネット・サーバを実現するクラスタ用ミドルウェアの基本設計
杉木章義, 河野健二, 岩崎英哉, 益田隆司情報処理学会シンポジウム論文集 2003 (8) 267 -274 2003年05月28日 [査読無し][通常論文]

ディペンダブルなインターネットサーバを構築するためのカスタマイズ可能なクラスタ用ツールキット
杉木章義, 河野健二, 岩崎英哉, 益田隆司日本ソフトウェア科学会大会講演論文集 2003 (0) 11 -11 2003年 [査読無し][通常論文]

インターネットサーバでは，提供するサービスに対する高いディペンダビリティが求められている．そのため，可用性・信頼性・管理容易性等，お互いにトレードオフの関係にあるディペンダビリティの構成要因を，アプリケーションの特性や目的に応じて適切に調整する必要がある．既存のアプローチでは，特定のサービスに特化した方法でディペンダビリティを達成したきたが，汎用性に欠け，他のサービスにその方法が転用し難いという問題点があった．この問題点を解決するため，本発表では，サーバシステムをいくつかのステージに分割し，アプリケーションの特性に応じてそれぞれの段階をカスタマイズ可能とすることによりディペンダビリティの達成を可能とするようなツールキットを提案し，その実現を示す．

受賞

2010年03月情報処理学会山下記念研究賞

受賞者: 杉木章義広域分散環境のための仮想機械を利用したサービス協調複製基盤

共同研究・競争的資金等の研究課題

高性能計算技術とマイクロサービス化技術の融合に関する研究
日本学術振興会：科学研究費助成事業
研究期間 : 2020年04月 -2023年03月
代表者 : 杉木章義

研究期間の前半では，従来の仮想マシンやスパコンといったサーバ層ではなく，高水準なマイクロサービス層で複数学術機関の高性能計算サービスを連携する手法に関する研究を実施した．各拠点で動作するコンテナ同士をSPIFFE/SPIREで接続し，mTLSで相互に認証を行いながら，暗号化通信で計算を行なう．実験環境では，北海道大学情報基盤センターが提供するインタークラウドパッケージを活用し，4拠点（北大，東大，阪大，九大）の計算機を連携させたフェデレーション環境を再現した．実験の結果，学術機関を相互に連携させる場合には，接続拠点の数が多く，発行する証明書のスケーラビリティに課題があることが分かった．また，SINET L2VPNサービスを活用しているものの，最大1.6Gbps程度と実験環境の制約により期待した程の性能は得られなかった．次にパブリッククラウドで研究開発を行い，ヘテロジニアスな各拠点のスパコンや大型計算機システムに高性能計算アプリケーションを水平展開するmicroburst方式を提案した．AWSに代表されるパブリッククラウドのクラウドネイティブなサービスを活用しながら，高性能計算アプリケーションの開発を行う自動化パイプラインを構築し，口頭発表を行なった．
研究期間の後半では，データ活用社会創成プラットフォームmdxの試験運用が開始され，計算機環境が自由に手に入るようになった．研究上の制約がなくなり，研究が大幅に進展した．現在，本研究課題の中核となる高性能なKubernetesパッケージの開発を進めている．
総括として，本研究が目標とする姿に関して，十分な青写真を示すことができた．一方で，国際会議や雑誌論文などの査読付き成果化の作業が遅れており，その点は反省すべき点である．特に，手広く研究を進めたものの，一方で個別テーマを深く追求することができなくなっており，今後の大きな課題とする．

ロバストなサーバソフトウェアの運用と設計開発:タグチメソッドを利用したアプローチ
日本学術振興会：科学研究費助成事業
研究期間 : 2010年 -2012年
代表者 : 杉木章義

本研究では,インターネットサービスのサーバソフトウェアの分野に実験計画法の一手法であるタグチメソッドを適用し,環境の変化に対してロバストなサーバソフトウェアの運用管理手法,およびそれらをフィードバックした設計開発手法の構築を目指した.より具体的には,Apache と Hadoop を対象にロバスト性を高めるチューニング手法に関する研究を実施し,またその作業を支援するためのスクリプティング環境の整備も行った.

仮想計算環境のためのプログラミングシステム・フレームワークに関する研究
日本学術振興会：科学研究費助成事業
研究期間 : 2010年 -2012年
代表者 : 加藤和彦, 杉木章義, 長谷部浩二, 品川高廣, 品川高廣

本研究では, 系統的で拡張性に富んだクラウドコンピューティングシステム構築のためのプログラミングシステム・フレームワークの研究開発を実施した.粒度の小さな機能コンポーネントを提供し,それらをスクリプティングで組み合わせることでシステムを構成した.また,仮想マシンにコンポーネントの集合体を封じ込め,迅速かつ大規模で高堅牢性を有するシステム管理を可能とした.さらに,システム監視を含めた自律分散的な管理を可能とした.

教育活動情報

主要な担当授業

情報システム設計学特論
開講年度 : 2021年
課程区分 : 修士課程
開講学部 : 情報科学研究科
キーワード : 進化計算，メタヒューリスティクス

情報システム設計学特論
開講年度 : 2021年
課程区分 : 修士課程
開講学部 : 情報科学院
キーワード : 進化計算，メタヒューリスティクス

情報システム設計学特論
開講年度 : 2021年
課程区分 : 博士後期課程
開講学部 : 情報科学研究科
キーワード : 進化計算，メタヒューリスティクス

情報システム設計学特論
開講年度 : 2021年
課程区分 : 博士後期課程
開講学部 : 情報科学院
キーワード : 進化計算，メタヒューリスティクス

情報理工学演習Ⅰ
開講年度 : 2021年
課程区分 : 学士課程
開講学部 : 工学部
キーワード : コンピュータシステム、ネットワークとクラウド、計算機アーキテクチャ、オペレーティングシステム、コンピュータネットワーク、Web技術、クラウド技術

ネットワークとクラウド
開講年度 : 2021年
課程区分 : 学士課程
開講学部 : 工学部
キーワード : ネットワーク階層化、TCP/IP、カプセル化、経路制御、DNS、ネットワークアプリケーション、クラウド