連載 働くUNIX 4 竹内 渉 新計算機環境のセットアップ はじめに したものです。 新たな物品の購入 前回は、現在構築中の衛星データ処理のための新たな計 算機環境について、導入のきっかけから始動に至るまでの 前号で書いたように、NFS 経由で RAID を接続して 経緯を説明しました。本誌の発行部数がどのくらいかは分 も速度に限界があるため、新たに FC (Fibre Channel) かりませんが、すくなくとも私の周辺にはかなりの読者が スイッチを購入することにしました。購入時の条件として いるようです。2005 年 10 月号に 1 回目の記事が掲載さ は、次のようなものがあります。 れてからたった 1 カ月のあいだに、5 人の方から「原稿を 読んだよ」という連絡をもらいました。計算機の世界に対 する浅学さを露呈しているような文章でしたが、それなり に楽しめたという意見もいただき、ちょっとほっとしてい ます。 その 10 月号の原稿を書いている 8 月初めには、米国の ボルダーに出張していました。2 回目の原稿を書いている 9 月初めには、農業工学関連の学会に参加するために金沢 にいました。そして、前回(3 回目)の原稿を書いている 10 月初めには、NASA の地球観測計画 (EOS) のデータ 受信局会議に出席するため、イタリアにいました。まとま • Xserve G5 および Xserve RAID への対応が確認され ている。 • 2006 年度に Xserve RAID をもう 1 台、追加導入する 予定があるため、そのぶんのポートも含めて最低 16 ポ ートまで拡張できる。 • システム全体の再設計、セットアップ、保守をおこない、 動作の確認まで責任をもっておこなうベンダーから購入 する。 • Mac OS X を 10.4 にアップグレードし、Xsan を新た に導入する。 った時間がなかなかとれないため、出張先のホテルや飛行 スイッチにかぎったことではありませんが、こちらとし 機での移動中、あるいは電車の乗換え時間を使ってなんと ては、費用対効果がもっとも高いベンダーに納入してほし か書き上げたというのが実情です。 いと考えています。今回も、最初にマシンを購入したとき この原稿を書いているのは 11 月初めですが、これまで と同じく競争入札が必要だったため、複数のベンダーに見 と同様、ACRS2005(Asian Conference on Remote 積りをお願いしました。上記の条件のうち、最後の項目に Sensing:アジア・リモートセンシング会議)という学会 挙げたソフトウェアについては、ハードウェアと ``抱合せ´´ に出席するためにベトナムのハノイに来ています。この会 でしか販売しないというベンダーもありました。 議では、森林火災が起こっている状況を衛星データを用い 納入品目は ``FC スイッチ一式´´となっているので、書類 て宇宙から準実時間で情報発信するという内容の発表をお 上はソフトウェアも同じ経費の枠内で購入しなくてはなり こないます。今回お話しする Xserve グリッド計算機シス ません。しかし、私たちの研究所は大学に所属する研究機 テムは、まさにこのプロジェクトでの利用を主たる目的と 関なので、ソフトウェアは別途アカデミック版を購入した 106 ! # 責了 [rsense0601.ps] " $ UNIX MAGAZINE 2006.1 連載/働くUNIX ほうが安価になります。このあたりは、事務局と折衝する ことになりました。さらに、セットアップにかかる費用は、 4 直接の原因は 2 つあり、両方とも浸水を惹き起こしてい ました。 物品購入費である備品費とは別予算の用務費として計上し 1 つ目は、直径 3m 弱のパラボラアンテナの中心部に備 なくてはなりません。これには、備品費の総額の 3 割を超 え付けられているデータの受信部 (LNA) が破損していた えてはいけないという制約があります。ベンダー側からみ ことです。犯人はカラスらしく、LNA が備え付けられてい れば、ひどく納入しづらい条件だったと思います。 る筒の先端を覆う厚さ 5mm 程度のプラスチック板をつつ 紆余曲折はあったものの、アーチシステムズ1 にお願いす いて破ったため、そこから浸水したようでした。バンコク ることに決定しました。最終的な金額はお教えできません のアジア工科大学院 (AIT) で運用中のまったく同じシス が、他社の見積りは落札価格の 1.2∼1.5 倍でしたから、相 テムでも、違う種類の鳥の被害に遭ったという話を担当者 当に勉強してもらったことになるでしょう。 から聞いていましたが、こうなると笑うに笑えません。駒 場リサーチ・キャンパスの近くにある駒場公園をねぐらに セットアップまでの幸運な出来事 しているカラスがたくさん飛来することは知っていました が、まさかアンテナにまでいたずらするとは思いもよりま ベンダーが決定したのは 9 月末ですが、FC スイッチの せんでした(Dundee 大学の研究者たちも、これにはびっ 納入には約 3 週間かかるということでした。そこで、セッ くりしていました) 。けっきょく、LNA は Dundee 大学 トアップ作業は、納入直後の 10 月末から 11 月初めにかけ に送り、先方で製造元の米国のメーカーから部品を調達し ておこなってもらうことにしました。その時期、私自身は たうえで組み立てなおし、日本に送り返してもらいました。 あちこちに出張していたため、10 月中は合計 3 週間ほど不 わざわざこんなことをしたのは、次のような事情があっ 在でした。それがかえってさいわいしたのか、双方にとっ たからです。LNA は特殊な部品なので、当初予定してい てストレスなく時間を過ごせたように思います。 た国内での調達は代理店経由でおこなう必要がありました。 今回の新しいシステムを構築するまでのあいだに、衛星 「部 国内に 1 社しかない代理店に修理を依頼したところ、 データ処理関連のシステムについて、2 つの大きな進展が 品自体の修理は可能だが、アンテナ全般についての動作確 ありました。 認は保証できない」とか、 「修理できるかどうかを判断する アンテナの修理 ために出張の必要があり、それだけで 1 回 10 万円かかる」 といった回答で、お話になりません。代理店の商社に技術 1 つは、2004 年 10 月以来、1 年近くも不調だった衛星デ ータ受信アンテナの修理のメドがついたことです。どこか の会社が納入したものなら修理を依頼することもできます が、このアンテナの場合は経緯が少々複雑でした。アンテ ナ全般の設計をおこなったのはスコットランドの Dundee 大学の研究者たちであり、距離的な問題もあって日本に頻 繁に来ることはできません。そこでまず、破損の状況をこ ちらで調べなければなりませんでした。なんといっても私 のバックグラウンドは社会基盤工学ですから、電源系統の 回路やアンテナを制御するモーターなど、ハードウェアに 関する知識は皆無といってよく、これは大仕事でした。そ れでも、Dundee 大学の研究者たちの知人であるマレーシ アから来た技術者や、インド人の研究員と一緒に悪戦苦闘 しつつもなんとか原因を突き止めました。 1 http://www.archsystem.com/ UNIX MAGAZINE 2006.1 ! # 責了 [rsense0601.ps] " $ 者がいるわけではないので、部品の販売はできても、アン テナ全般に関する問題解決型の提案は出てこないというこ となのでしょう。これでは、私たちの要求を満たすことは できません。結果として、その代理店の見積り価格の約半 分の値段で完全に解決しました。このような問題の場合は ``解決した´´という点が重要で、 ``やってみましたが直りま せんでした´´では、会計上、事務局にも話がとおりません。 もう 1 つは、アンテナを制御するワイーヤードのコント ローラとアンテナとの接続部が水に浸かっていたことです。 通常、アンテナの制御は UNIX マシンからリモートでおこ ないますが、保守用のコントローラがアンテナに直結され ています。これが格納されている箱の内部に水が入り、シ ョートしてしまったようです。 マレーシアから来てくれた技術者はたいへん優秀で、わ ずか 5 日の滞在期間中に上記の 2 つの問題を完全に解決 107 表 1 新たに購入した物品の一覧 写真 1 新計算機システム Q-Logic SANbox 5200(16 ポート、型番:SB5200-16A) Q-Logic SANBox 5200 保守アップググレード(3 年間センドバック保守) SFP (Q-Logic SFP2-SW-03) OpenDirectory セットアップ FC スイッチ設定作業 Macintosh サーバーサポート年間基本料金 Xsan 設定 Apple Fibre Channel PCI-X カード Gigabit Ethernet スイッチ(電源内蔵型、GS2108 (NETGEAR)) Gigabit Ethernet ケーブル Mac OS X Server 10.4 Xsan 1.2 し、しかも浸水に対する改善も提案してくれました。 1台 1件 8 個セット 1式 1件 1年 6件 4枚 1台 6本 5本 6本 図 1 新計算機システムのイメージ ソフトウェアのアップデート Xserve-RAID1 もう 1 つの進展は、データ処理ソフトウェアを大幅にア ップデートし、データの品質が大きく改善されたことです。 Xserve-RAID2 ユーザー Fibre Channel コマンド Fibre Channel アンテナで受信した生データは、アナログの信号をデジ タルに変換して 1 次処理をおこなって画像化します。生デ Xserve-node1 Xserve-Head Xserve-node5 Xserve-node2 Xserve-node3 Xserve-node4 ータの画像化までの段階では、NASA が提供するソフトウ ェアが世界的にひろく使われており、地上受信局をもつ機 関はこれに大きく頼っています。もともと、このソフトウ ェアには、品質は相対的に低いが処理時間やインストール の手間がかからないものと、品質は相対的に高いが処理時 間やインストールの手間がかかるものの 2 種類がありまし たが、相互の長所を補い合うかたちで開発が一元化されま した。しかも、従来の Solaris、HP-UX、IRIX、Linux に加えて Mac OS X での動作も保証されています。基本 部分は C と Fortran で書かれており、C シェルで複数の モジュールをつなぐ設計になっています。おかげで、これ までに蓄積してきたソフトウェア資源をそのまま活かすこ とができ、移行もたいへんスムースにおこなえました。 セットアップ 出張から戻った 10 月終りに、発注していた物品が納入 されました。最終的に納入されたものを表 1 に示します。 この表からも分かるように、セットアップ作業はすべて ベンダーにおこなってもらうことにしました。こちらの要 求を満たすシステムの再構築案が提案され、さらに、動作 の確認まで責任をもつという確約がとれたからです。 今回、構築した計算機システム(写真 1 )は図 1 に示した 108 ! # 責了 [rsense0601.ps] " $ ような構成になっています。従来のシステムとの違いは、 次のような点です。 • Mac OS X Server を 10.3 から 10.4 にバージョンア ップした。 • すべてのマシンを Gigabit Ethernet で接続したため、 通信が格段に高速になった。 • Xsan を用いて、すべてのマシンから Xserve RAID へ のアクセスが可能になった。 • Head(ヘッドノード)と node1 を Xsan の管理用マシ ンとしたため、計算用マシンは実質的に node2∼node5 の 4 台となった。 • シングル・サインオンを導入した(ユーザーは、Head に ログインすれば、ほかのノードにパスワード認証なしで アクセスできる) 。 物品納入の 1 週間後の 11 月初旬に、アーチシステムズ の技術者に出向いてもらい、セットアップをおこなっても らいました。折悪しく、その前の週に衛星データを処理し UNIX MAGAZINE 2006.1 連載/働くUNIX 4 ているほかのマシンが外部から不正侵入され、システムを 始しました。ユーザーのホーム・ディレクトリは、すべて 1 破壊されるという悲惨な状況にありました。私は、そのマ つのパーティションの下に保存されるようにしたので、全 シンの復旧に忙殺されていたこともあり、あまり手伝えな 体の容量に注意するだけでよく、管理作業はたいへん楽に かったのですが、2 日間ですべての設定が完了しました。 なりました。 その際、問題になったことが 2 つありました。 1 つは RAID のフォーマットです。システムを全面的 これまで、Linux マシンでおこなっていたサービスのう ち、新システムに移行したものをいくつか紹介します。 に組みなおすため、今後の運用の安定性確保という観点か 主としておこなっているのは、森林火災の情報を提供す らもフォーマットは欠かせません。当然ですが、その場合 るサービスです。アジア地域において多発している森林火 には保存されているデータをいったん退避させる必要があ 災は、植生の回復過程における土壌栄養の補給源として機 ります。これにすこし手こずってしまいました。 能するなど、生態系のなかでは基本的かつ自然な外乱要因 従来のシステムでも計算をおこなっていたので、約 8TB の 1 つです。同時に、人間の活動によって起こる火災も急 のディスク容量の 90%以上が占有されていました。テー 増しており、自然火災をしのぐ勢いだと報告されています。 プアーカイバに格納されている衛星データについては、ダ 森林の状態や動態の把握は、地球の炭素循環や気候システ ウンロードするだけなのでとくに難しい点はありません。 ムへの知見を深めるうえでもきわめて重要です。アジア地 計算中に生じる中間データがディスクの 50%程度を占有 域の森林の面積は広大なので、効率性、安全性、即時性の観 していましたが、ほかのマシンで使用している RAID に 点から衛星リモート・センシングを用いた監視が有効です。 も保存する領域がなく、涙をのんで削除しました。再計算 新システムでは、Aqua/Terra に載っているセンサー すれば取り戻せますし、新計算機システムなら計算に要す MODIS のデータを用いて森林火災を検知し、アジア全域 る時間も短縮されます。もっとも重要なのはソースコード における火災情報を準実時間でネットワークを介して提供 です。万一、これがなくなると、それまでの努力も水の泡 します。 なので、細心の注意を払って作業をおこないました。さい 衛星から火災を検知する場合、基本的には地表面の温度 わい、ほとんどすべてのソフトウェアはパッケージ化して が周囲よりも高くなっているところをみつけます。メタデ あったため、tar でまとめたうえで、RAID システムやふ ータの例として、2005 年 9 月 5 日の検知結果を表 2 に示し だん使っている PowerBook、外部ディスクなどに分散し ます。それぞれ、火災が起こっている 1km 四方のある地 て保存しました。 点の情報を表しており、LAT が緯度、LON が経度、R2 が もう 1 つの問題は電源容量です。計算機を置いた部屋 近赤外域の反射率、T22 が中間赤外域の温度、T31 が熱赤 は大容量の電源供給が可能なように設計されていましたが、 外域の温度、CONF が ``確からしさ´´を表しています。火 床下に備え付けてある元電源の配置を考慮せずに計算機を 災検知に用いているアルゴリズムの説明は省略しますが2 、 設置してしまったのです。その結果、電源プラグの数が足 その性能は、火災規模、火災温度、衛星観測角、生態系の りず、UPS も不足する事態に陥りました。この問題につい 種類、観測日時、火災煙の種類などに大きく左右されるた ても、アーチシステムズの技術者の方に解決案を出しても め、完全とはいいきれません。 らい、床下の電源配置を勘案して配線をやりなおし、UPS とはいえ、 ``この位置でこういった種類の火災が起きて も 3,000W のものを 3 台用意して接続しました。ある程 いる´´という情報を提供すれば、数時間から数日レベルで 度以上のシステムを作る場合、電源の確保はきわめて基本 の火災の延焼状況を予測したり、あるいは数カ月から数年 的かつ重要なことですが、これまで PC 感覚で計算機を利 レベルでの火災が起こった森林の回復度合いを調べたりと 用してきた私にとっては ``灯台下暗し´´という感じでした。 いった研究に役立てることができます。これらの研究は、 新システムでの仕事 2 興味のある方は、「Aqua/Terra MODIS データを利用したアジア森林 火災の準実時間観測」(http://yasulab.iis.u-tokyo.ac.jp/˜wataru /publication/pdf/rssj2005 autumn paper.pdf) などをご覧 セットアップの終了後、ただちに新システムの使用を開 UNIX MAGAZINE 2006.1 ! # 責了 [rsense0601.ps] " $ ください。 109 表 2 メタデータの例(2005 年 9 月 5 日の検知結果) LAT (deg.) 31.979397 31.939053 31.936943 31.835857 31.476776 29.819904 ...... LON (deg.) 117.255943 117.259239 117.271469 117.318924 118.412544 112.897804 R2 (%) 0.265969 0.270117 0.271943 0.251624 0.270130 0.246956 T22 (K) 320.278168 322.583588 328.083862 321.923523 313.733917 315.107361 T31(K) 295.943878 293.936523 296.270966 294.569916 294.438507 293.052795 CONF (%) 57 73 90 27 55 26 図 2 火災データ配布の Web ページ 図 3 2005 年 9 月 1 日∼10 日に発生した火災の分布 UNIX を中心として構築されてきたデータ観測網を基盤と し、それにいわば ``火災を検知するモジュール´´のようなも 場でどういうふうに UNIX を活用しているかを紹介して のを加えることで実現されています。 分野の紹介から始め、大学の研究機関における研究室レベ 衛星リモート・センシングを用いて検知されたアジアに きました。衛星リモート・センシングという聞き慣れない ルの予算で計算機を購入するまでの経緯、計算機を購入し おける森林火災の情報は、すべて Web ページおよび FTP てから運用開始までの出来事、運用に際しての問題点など、 サーバーを通じて無償で公開されています。図 2 は火災デ 具体例を交えてお伝えしました。これらが、すこしでも皆 3 ータ配布の Web ページ で、クイックルックと火災の分布 さんのお役に立てばさいわいです。 図が 1 日単位で表示されています。図 3 は、このページか 最後になりましたが、ここまでお読みいただいた読者の ら取得したデータをまとめ、2005 年 9 月 1 日∼10 日に 方々、本誌に原稿を書く機会を与えてくださった東京大学 発生した火災を分布図にしたものです。図の右上部の中国 情報基盤センターの安東孝二氏に感謝いたします。ありが 東北部から極東ロシア、下部のカリマンタン島などで大規 とうございました。皆さん、いつの日かまた会うときまで、 模な火災が発生している様子が分かります。 輝きを失わずにがんばりましょう。 (たけうち・わたる 東京大学生産技術研究所) おわりに 4 回にわたり、計算機の専門家ではない私が学術研究の 3 http://webmodis.iis.u-tokyo.ac.jp/FIRE/ 110 ! # 責了 [rsense0601.ps] " $ UNIX MAGAZINE 2006.1 されてしまう。もう 1 つは、制限をなくすと、サーバーに 負荷がかかりすぎるからだ。 1 番目の理由は営利企業に特有のことであり、Wikipedia のように、非営利団体によって運営されていて、かつ ライセンス上、データの複製が許諾されているサービスに はあてはまらない。2 番目の技術的な理由については、既 存の技術を組み合わせれば比較的簡単に解決できる。たと えば、Wikipedia のデータを P2P 的な方法でミラーリン グしておき、頻繁にデータを呼び出す場合にはミラーをア クセスするようにすればよい。検索エンジン・アグリゲー Webサービスの利用制限 本誌の読者なら、仕事で開発中のアプリケーションや研 タ Answers.com5 の例でいえば、Wikipedia のデータを ミラーし(P2P は用いていない) 、自社サービスからはそ れを利用しているので、Wikipedia 本体には負荷をかけな 究、あるいは週末ハックのために、Google API や Ama- い仕組みになっている。つまり、1 番目の問題と根っこは zon Web Services API、Technorati API、Yahoo! 同じで、けっきょくは ``データのオープン性´´が重要という Webservice API など、いろいろな会社が提供している ことになる。Wikipedia ではデータを複製してもかまわ Web サービスを利用することも多いのではないだろうか。 ないので、データをミラーして負荷を下げる方法で技術的 最近、私が買った本のなかでは Software Design 編集部 な制限が取り払えるのである。 のもの1 がよくまとまっていたが、このほかにも Web サー ビスに関する解説書がたくさん出版されている。 企業が提供するこれらの Web サービスに共通している オープンデータ運動 膨大なデータを保有する営利企業が、データを囲い込ん のは、API の利用回数(頻度)に制限があるということだ。 で小出しにすればするほど、本来は可能なはずの革新的な たとえば、Google API は 1 日に 1,000 回という制限2 が サービスの登場が遅れてしまう。データをオープンにしな ある。実際に試した人によると、1 日に数十万回アクセスし いために競争が阻害され、革新が遅れる。この考え方は、ど たら ``403 Forbidden´´となって、Google にアクセスでき こかで見聞きしたことがあるはずだ。そう、オープンソー なくなるそうだ。Amazon Web Services では、ある回 ス運動である。 数以上アクセスしたときは従量制の料金もしくは月額の固 現在、 ``ソース´´を ``データ´´に置き換えた ``オープンデ 定料金を払うことになっている(FAQ3 によれば、1 クエ ータ´´という運動が起こりつつある。Six Apart の共同創 リーあたり 0.1 セントとなっている) 。Yahoo! でも、API 立者である Ben Trott 氏は、自身の Blog ページ6 でオー 4 の利用規約の第 11 条 に、利用回数や利用形態に任意の制 プンソースよりもオープンデータのほうが重要だと述べて 限をかけると明記されている。 いる。次のように、彼の主張は分かりやすい。 このような制限を設ける理由は、大きく分けて 2 つある。 1 つは、それが収益源になるからである。回数制限がな いと、すべてのデータが取り出されてビジネスにただ乗り 「大事なデータをエクスポートできないソフトウェアは、信 頼して使えない」 これは、まさに Google や Amazon のことではないだ 1 Software Design 編集部『最新 Web サービス API エクスプローラ』 、 技術評論社、2005 年 2 http://www.google.com/apis/ 3 http://www.amazon.com/gp/browse.html/ref=sc fe l 1 3435361/002-8263882-5520801?%5Fencoding=UTF8&no de=3434651&no=3435361&me=A36L942TSJ2AJA 4 http://docs.yahoo.com/info/terms/ UNIX MAGAZINE 2006.1 ! # 責了 [smooth0601.ps] " $ ろうか。 Dave Winer 氏は、データのオープン性について、た 5 http://www.answers.com/ 6 http://btrott.typepad.com/typepad/2005/08/open data .html 111
© Copyright 2024 Paperzz