博 士 学 位 論 文 高次 FDTD 法とクラスタを用いた並列計算 による大規模電波伝搬解析に関する研究 園 田 潤 2005 年 9 月 東北大学大学院 環境科学研究科 博 士 学 位 論 文 論文題目 高次 FDTD 法とクラスタを用いた 並列計算による大規模電波伝搬解析 に関する研究 提 出 者 東北大学大学院環境科学研究科 地球システム・エネルギー学 コース 学 籍 番 号 A4GD5202 氏 名 園 田 潤 v 高次 FDTD 法とクラスタを用いた並列計算による大規模電波伝搬解析に関する研究 概 要 近年,携帯電話や無線 LAN 等の通信システムや,合成開口レーダ SAR や地中レーダ GPR 等 のレーダシステムに GHz 帯の高周波電磁波が広く使用されている.これらの通信システムやレー ダシステムにおいて,システム最適設計のための電波伝搬散乱解析が必要とされている.電波伝搬 散乱解析の数値計算法として広く使用されている方法に FDTD (Finite-Difference Time-Domain) 法があるが,波長に対して大きな領域の解析には,計算コストが高くなることや,数値分散誤差が 生じる問題がある.そこで本研究では,大規模電波伝搬散乱解析に適用可能な低コストかつ高精度 な数値計算法を提案した. FDTD 法における計算コストの問題を解決するために,まず,教育用計算機を用いた PC クラ スタによる FDTD 並列計算について,その並列計算特性,並列計算の計算量の定式化を行った. この結果,教育用計算機 80 台を用いた TM 波における FDTD 法では,55 倍の速度向上比と並 列効率 68.6 % を得ることができた.また,より多くの計算資源を得るために,グリッドに着目 し,CD ブート Linux を用いた低コストかつ高セキュリティなグリッド構築手法を提案した.さら に,グリッドにおける FDTD 並列計算の負荷分散法として,領域分割法とマルチプロセス法を提 案し,これらの手法により,計算時間を約 50 % に削減することができた.PC クラスタやグリッ ドを用いた FDTD 並列計算による大規模電波伝搬解析への応用として,UWB パルスの室内電波 伝搬解析と,ランダムな散乱体を含む不均質な地中媒質における地中物体の検出シミュレーション を行った.この結果,計算機 40 台を使用した UWB パルスの室内電波伝搬解析では,使用メモリ は 1/39.9,計算時間は 1/36.4 に削減できることを示した.グリッドにおける地中レーダのシミュ レーションでは,計算機 1 台では 23.0 時間かかった計算が,計算機 20 台のグリッドにより計算時 間は 1.5 時間にすることができた. 大規模解析における FDTD 法の数値分散誤差の問題を解決するために,波動方程式に基づいた vi FDTD 法である WE-FDTD 法の空間高次精度解法とその並列計算による手法を提案した.高次 WE-FDTD 法の分散関係式を導出し,高次 FDTD 法と高次 WE-FDTD 法の数値分散誤差の比較 を行った.また,数値分散関係式より,大規模電波伝搬解析における数値分散誤差を明らかにし, 大規模解析における計算パラメータの決定指針を示した.さらに,大規模な領域を解析するため に,高次 WE-FDTD 法の並列計算を行い,並列計算特性,高次手法の計算コストを示した.この結 果,TM 波における空間 6 次精度の WE-FDTD(2,6) 並列計算では,従来の空間 2 次精度の FDTD 法に比べ使用メモリは 1/1332,計算時間は 1/88,提案されている空間 4 次精度の FDTD(2,4) 法 に比べ使用メモリは 1/13,計算時間は 1/13 に削減することができた.高次 WE-FDTD 並列計算 の大規模電波伝搬解析への応用として,大型キャビティ内の電波伝搬解析を行い,本手法により大 規模電波伝搬解析を低コストかつ高精度で解析できることを示した. 高次手法の 3 次元への拡張として,3 次元高次 FDTD および WE-FDTD 法の数値分散特性や並 列計算コストの検討を行った.この結果,3 次元においても高次手法の数値分散誤差は TM 波と同 様な特性を示すが,計算コストは WE-FDTD 法は FDTD 法に比べ,2 次精度では 1.56 倍,4 次 精度では 2.07 倍計算量が増加し,また並列計算の通信量も増加することを示し,3 次元解析では FDTD 法が有効であることを示した. 本研究で提案した高次 FDTD 法と PC クラスタによる並列計算手法の有効性・妥当性を明らか にするために,光電界センサを用いた室内 UWB 伝搬実験に適用し,実験と計算の比較を行った. FDTD 法における送受信アンテナの簡易モデリング手法を示し,3 次元における FDTD(2,2) 法お よび FDTD(2,4) 法の並列計算を用いた室内 UWB パルス伝搬解析を行った.光電界センサを用 いた実験との比較を行った結果,従来の FDTD 法より本手法の方が実験とよく一致することを示 した. 最後に,本研究の成果をまとめ,今後の展開として,次世代高周波無線通信システムや SAR リ モートセンシングによる環境計測への適用について述べた. キーワード: 大規模電波伝搬解析,高次 FDTD 法,並列計算,クラスタコンピューティング,UWB vii A Study on Large-scale Analysis of Electromagnetic Wave Propagation using Higher-Order FDTD and its Parallel Computation on Cluster Computing System abstract In recent years, high frequency electromagnetic wave is used for wireless communication and radar systems, such as cell phones, WLAN (Wireless Local Area Network), SAR (Synthetic Aperture Radar), GPR (Ground Penetrating Radar) and so on. It is required to know the characteristics of electromagnetic wave scattering and propagation for optimizing designs of these communication and radar systems. Finite-difference time-domain (FDTD) method is widely used to three-dimensional analysis of electromagnetic wave propagation, antenna characteristics and so on. However, the conventional FDTD method requires large computational resources to reduce the numerical dispersion error to a practical degree. The objectives of this thesis is to propose a method that can solve problems of electrically large domain with a high accuracy at low computational cost. To solve the problem of the computational cost of the FDTD method, we have proposed an FDTD parallel computation using a cluster of PCs. The characteristics of an FDTD parallel computation and a theoretical equation of quantity of its parallel computation using a cluster have been found. Further, we have proposed a low-cost and high-security set-up method of grid computing environments by a Linux live CD for the FDTD parallel computation. As an FDTD loadbalancing method on the gird, a region division method and a multi-process method have been proposed. As the application of the method, a problem of indoor propagation of UWB pulse and GPR operation for a inhomogeneous medium have been analyzed on the cluster, and the viii grid computing as well. We have proposed a higher-order Wave Equation based FDTD (WE-FDTD) and its parallel computation to reduce numerical dispersion error for the electrically large domain analysis. The dispersion relations of higher-order WE-FDTD method have been found, and comparisons of dispersion error between conventional FDTD and WE-FDTD were made. The numerical dispersion in the large domain analysis as been shown by the dispersion relation. WE-FDTD parallel computation was performed for a large-scale analysis. We have shown the characteristics of the parallel computation and the computational cost using the higher-order method. Applying to the large-scale analysis using the higher-order WE-FDTD parallel computation, Characteristics of the electromagnetic wave propagation in a large cavity have been analyzed. To evaluate validity of the proposed method, we have conducted a measurement of indoor propagation of a UWB pulse using an optical electric field sensors (OEFS). A simple and effective modeling of the measurement has been shown. The characteristics of of indoor propagation of the UWB pulse has been analyzed using the FDTD(2,2) and FDTD(2,4) parallel computation three-dimensionally on the clusters, which shows that of the proposed method is better agreement with measurement results than conventional FDTD method is. Finally, these results were summarized. As future development, the proposal method is applied to the study of next-generation wireless communication systems and environmental remote sensing using SAR and GPR. Keywords: electromagnetic wave propagation, higher-order FDTD, parallel computation, cluster computing, UWB ix 目次 第1章 1.1 1.2 1.3 緒論 1 研究の背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1 高周波電磁波の利用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.2 無線通信・レーダシステムの最適設計のための電波伝搬解析手法 . . . . . . 4 FDTD 法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.1 基礎方程式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.2 計算コスト . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2.3 数値分散誤差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 FDTD 法を用いた大規模電波伝搬解析に関する研究動向 . . . . . . . . . . . . . . 14 1.3.1 ハイブリッド手法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.3.2 高精度化手法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.3.3 並列計算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.3.4 リモートセンシングや無線通信への応用 . . . . . . . . . . . . . . . . . . . 17 1.4 本研究の目的 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.5 本論文の構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 21 第2章 2.1 緒言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 . . . . 24 2.2.1 FDTD 法の並列計算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 x 目次 2.3 2.4 2.5 2.6 第3章 2.2.2 波動方程式に基づく FDTD 法(WE-FDTD 法)とその並列計算 . . . . . . 28 2.2.3 FDTD 法および WE-FDTD 法の並列計算特性 . . . . . . . . . . . . . . . 33 2.2.4 並列計算の評価および検証 . . . . . . . . . . . . . . . . . . . . . . . . . . 40 UWB パルスの室内電波伝搬特性解析への応用 . . . . . . . . . . . . . . . . . . . 45 2.3.1 解析モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.3.2 FDTD 並列計算による室内 UWB パルス伝搬解析 . . . . . . . . . . . . . . 46 2.3.3 計算コストの評価 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 . . . . 49 2.4.1 グリッド用に最適化した CD ブート Linux の開発 . . . . . . . . . . . . . . 49 2.4.2 キャンパスグリッドの構築とその評価 . . . . . . . . . . . . . . . . . . . . 50 2.4.3 領域分割法を適用した負荷分散 . . . . . . . . . . . . . . . . . . . . . . . . 53 2.4.4 マルチプロセス法を適用した負荷分散 . . . . . . . . . . . . . . . . . . . . 56 2.4.5 負荷分散法の評価および検証 . . . . . . . . . . . . . . . . . . . . . . . . . 57 地中レーダの物体検出シミュレーション . . . . . . . . . . . . . . . . . . . . . . 64 2.5.1 計算環境 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 2.5.2 ランダムな散乱体を含む不均質媒質の解析モデル . . . . . . . . . . . . . . 65 2.5.3 可視化に要する計算時間の短縮 . . . . . . . . . . . . . . . . . . . . . . . . 67 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 結言 高次 FDTD 法とその並列計算による大規模電波伝搬解析 71 3.1 緒言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 . . . . . . . . . . . . . . 72 3.2.1 高次 FDTD 法と分散関係式 . . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.2.2 WE-FDTD 法の高次への展開と分散関係式の導出 . . . . . . . . . . . . . . 74 3.2.3 数値分散誤差特性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.2.4 伝搬距離により蓄積される数値分散誤差の実際 . . . . . . . . . . . . . . . 83 3.2.5 計算精度と計算コスト . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 xi 3.3 3.4 3.5 3.6 3.7 第4章 高次 FDTD および WE-FDTD 法の並列計算 . . . . . . . . . . . . . . . . . . . 86 3.3.1 並列計算アルゴリズムとそのコスト . . . . . . . . . . . . . . . . . . . . . 86 3.3.2 大規模 PC クラスタにおける並列計算特性 . . . . . . . . . . . . . . . . . . 88 3.3.3 高次 WE-FDTD 法の並列計算コストの評価 . . . . . . . . . . . . . . . . . 91 大型キャビティの電波伝搬解析への応用 . . . . . . . . . . . . . . . . . . . . . . 91 3.4.1 解析モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.4.2 大型キャビティ内の電波伝搬解析とその計算精度 . . . . . . . . . . . . . . 93 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 . . . . . 101 3.5.1 3 次元高次 FDTD 法および WE-FDTD 法 . . . . . . . . . . . . . . . . . . 101 3.5.2 数値分散誤差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 3.5.3 マルチパスによる長距離伝搬で生じる数値分散誤差の実際 . . . . . . . . . 113 PC クラスタを用いた 3 次元高次 FDTD 法および WE-FDTD 法の並列計算 . . . 113 3.6.1 3 次元における並列計算とそのコスト . . . . . . . . . . . . . . . . . . . . . 113 3.6.2 PC クラスタにおける FDTD (2,4) 法の並列計算特性 . . . . . . . . . . . . 116 3.6.3 PC クラスタとスーパーコンピュータの計算コストと計算精度の比較 . . . . 118 3.6.4 FDTD 並列計算における Mur の吸収境界条件 . . . . . . . . . . . . . . . . 120 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 結言 光電界センサを用いた室内 UWB パルス伝搬実験への応用 125 4.1 緒言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 4.2 光電界センサを用いた室内 UWB パルス伝搬実験 . . . . . . . . . . . . . . . . . 126 4.3 4.2.1 室内 UWB 伝搬実験モデル . . . . . . . . . . . . . . . . . . . . . . . . . . 126 4.2.2 実験で使用する光電界センサ . . . . . . . . . . . . . . . . . . . . . . . . . 128 4.2.3 UWB パルスの時間波形とスペクトル . . . . . . . . . . . . . . . . . . . . 129 4.2.4 室内 UWB パルス伝搬の測定 . . . . . . . . . . . . . . . . . . . . . . . . . 129 4.2.5 デコンボリューションによる送受信システム係数の除去 . . . . . . . . . . . 132 FDTD(2,4) 並列計算による室内 UWB パルス伝搬解析 . . . . . . . . . . . . . . 136 xii 4.4 目次 4.3.1 解析モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 4.3.2 送受信アンテナのモデリング . . . . . . . . . . . . . . . . . . . . . . . . . 137 4.3.3 TDR 法による壁や床面の比誘電率測定 . . . . . . . . . . . . . . . . . . . . 137 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 . . . . . . . . . . . . . . 139 4.4.1 室内廊下における伝搬実験との比較 . . . . . . . . . . . . . . . . . . . . . 139 4.4.2 マルチパス環境下における伝搬実験との比較 . . . . . . . . . . . . . . . . . 142 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 4.5 結言 第5章 結論 151 5.1 本研究の成果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 5.2 今後の展開 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 謝辞 157 参考文献 159 本研究に関する発表論文 173 付録 A 2 階偏微分に対する空間 n 次精度の中心差分式の導出 179 A.1 2 次精度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 A.2 4 次精度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 A.3 6 次精度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 A.4 8 次精度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 A.5 10 次精度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 ニュートン法による分散関係式からの数値波数 k̃ の計算 187 B.1 ニュートン法による非線形多項式の解の計算 . . . . . . . . . . . . . . . . . . . . 187 B.2 WE-FDTD(2,4) 法の数値波数の計算 . . . . . . . . . . . . . . . . . . . . . . . . 187 付録 B xiii 図目次 1.1 様々な用途で使用される GHz 帯の電磁波 . . . . . . . . . . . . . . . . . . . . . 2 1.2 電磁波を用いた環境計測 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 FDTD 法による波長に比べ大きな領域における電波伝搬解析 . . . . . . . . . . . 5 1.4 FDTD 法における電磁界の各成分の配置 . . . . . . . . . . . . . . . . . . . . . . 7 1.5 セルサイズの大きさにより生じる FDTD 法の数値分散誤差 . . . . . . . . . . . . 11 1.6 FDTD 法を用いた正弦波の伝搬解析において生じる数値分散誤差 . . . . . . . . . 12 1.7 FDTD 法を用いたガウシアンパルスの伝搬解析において生じる数値分散誤差 . . . 13 1.8 本論文の構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.1 FDTD 並列計算における解析領域の分割と計算機間のデータ交換 . . . . . . . . . 26 2.2 FDTD 並列計算のアルゴリズム . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.3 FDTD 並列計算における計算機間の電磁界の送受信 . . . . . . . . . . . . . . . . 27 2.4 WE-FDTD 法における媒質境界付近の扱い . . . . . . . . . . . . . . . . . . . . . 30 2.5 媒質境界における WE-FDTD 法と FDTD 法の比較モデル . . . . . . . . . . . . 30 2.6 媒質境界を含むモデルにおける WE-FDTD 法と FDTD 法の比較 . . . . . . . . . 31 2.7 WE-FDTD 並列計算における解析領域の分割と計算機間のデータ交換 . . . . . . 32 2.8 WE-FDTD 並列計算における計算機間の電磁界の送受信 . . . . . . . . . . . . . 32 2.9 WE-FDTD 並列計算のアルゴリズム . . . . . . . . . . . . . . . . . . . . . . . . 33 2.10 仙台電波高専における教育用計算機システム . . . . . . . . . . . . . . . . . . . . 34 2.11 仙台電波高専における教育用計算機システムのネットワーク図 . . . . . . . . . . 34 xiv 図目次 2.12 FDTD 並列計算の計算精度検証のための自由空間電波伝搬モデル . . . . . . . . . 35 2.13 FDTD および WE-FDTD 並列計算の計算精度 . . . . . . . . . . . . . . . . . . . 36 2.14 FDTD および WE-FDTD 並列計算の計算時間 T (p, N) . . . . . . . . . . . . . . 37 2.15 FDTD および WE-FDTD 並列計算の速度向上比 S(p, N) . . . . . . . . . . . . . 38 2.16 FDTD および WE-FDTD 並列計算の並列効率 E(p, N) . . . . . . . . . . . . . . 38 2.17 FDTD および WE-FDTD 並列計算の通信比 C(p, N) . . . . . . . . . . . . . . . 39 2.18 FDTD 並列計算における計算時間の理論値と測定値の比較 . . . . . . . . . . . . 41 2.19 FDTD 並列計算における速度向上比の理論値と測定値の比較 . . . . . . . . . . . 41 2.20 FDTD 並列計算における速度向上比の推定値 . . . . . . . . . . . . . . . . . . . . 42 2.21 WE-FDTD 並列計算における計算時間の理論値と測定値の比較 . . . . . . . . . . 43 2.22 WE-FDTD 並列計算における速度向上比の理論値と測定値の比較 . . . . . . . . . 44 2.23 WE-FDTD 並列計算における速度向上比の推定値 . . . . . . . . . . . . . . . . . 44 2.24 FDTD 並列計算による室内 UWB パルス伝搬の解析モデル . . . . . . . . . . . . 45 2.25 UWB パルス伝搬で用いる送信波形 . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.26 FDTD 並列計算による室内廊下における UWB パルスの伝搬解析(人体なし) . 47 2.27 FDTD 並列計算による室内廊下における UWB パルスの伝搬解析(人体あり) . 47 2.28 FDTD 並列計算による受信点(送信点)における電界 Ez の時間応答 . . . . . . 48 2.29 CD ブート Linux を用いたキャンパスグリッドの構築 . . . . . . . . . . . . . . . 51 2.30 領域分割法による FDTD 並列計算の負荷分散 . . . . . . . . . . . . . . . . . . . 54 2.31 領域分割法による FDTD 並列計算の最適負荷分散アルゴリズム . . . . . . . . . . 55 2.32 マルチプロセス法による領域分割 . . . . . . . . . . . . . . . . . . . . . . . . . . 56 2.33 マルチプロセス法による FDTD 並列計算の負荷分散アルゴリズム . . . . . . . . 57 2.34 プロセス数増加による計算性能低下 . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.35 領域分割法による負荷分散を評価するためのキャンパスグリッド環境 . . . . . . . 58 2.36 マルチプロセス法による負荷分散を評価するためのキャンパスグリッド環境 . . . 62 2.37 地中レーダのシミュレーションで用いるキャンパスグリッド . . . . . . . . . . . . 65 xv 2.38 グリッドを用いた地中レーダにおける地中物体とランダムな物体を含む不均質媒 質モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 2.39 地中レーダのシミュレーションで用いる送信波形 . . . . . . . . . . . . . . . . . . 66 2.40 FDTD 並列計算により計算された各受信点の受信信号による地中物体の可視化 . . 67 3.1 空間 2 次および 4 次精度の FDTD 法および WE-FDTD 法における位相速度 c の 相対誤差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 79 空間 2 次および 4 次精度の FDTD 法および WE-FDTD 法における 1 波長伝搬あ たりの数値分散誤差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 3.3 高次 WE-FDTD 法の 1 波長伝搬あたりの数値分散誤差 . . . . . . . . . . . . . . 82 3.4 FDTD 法における位相定数 β の周波数特性 . . . . . . . . . . . . . . . . . . . . 83 3.5 FDTD 法における位相定数 β の相対誤差 . . . . . . . . . . . . . . . . . . . . . 83 3.6 高次 FDTD および WE-FDTD 法の伝搬距離による数値分散誤差の蓄積 . . . . . 84 3.7 高次 FDTD および WE-FDTD 並列計算におけるデータ交換 . . . . . . . . . . . 87 3.8 高次 WE-FDTD 並列計算の計算時間 T (p, N) . . . . . . . . . . . . . . . . . . . 89 3.9 高次 WE-FDTD 並列計算の速度向上比 S(p, N) . . . . . . . . . . . . . . . . . . 89 3.10 高次 WE-FDTD 並列計算の通信比 C(p, N) . . . . . . . . . . . . . . . . . . . . 90 3.11 高次 WE-FDTD 並列計算の並列効率 E(p, N) . . . . . . . . . . . . . . . . . . . 90 3.12 大型キャビティモデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.13 大型キャビティの電波伝搬解析で用いる送信波形 . . . . . . . . . . . . . . . . . . 92 3.14 各高次 FDTD 法で生じる数値分散誤差の理論値 . . . . . . . . . . . . . . . . . . 93 3.15 高次 FDTD および WE-FDTD 並列計算による観測点における電界 Ez の時間応 答(CW: f = 1 GHz ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.16 高次 FDTD および WE-FDTD 並列計算による観測点における電界 Ez の時間応 答(ガウシアンパルス: f−10dB = 1.33 GHz) . . . . . . . . . . . . . . . . . . . 3.17 96 97 高次 FDTD および WE-FDTD 並列計算による t = 100 ns 後の電界 |Ez | の空間 分布(ガウシアンパルス: f−10dB = 1.33 GHz) . . . . . . . . . . . . . . . . . . 98 xvi 3.18 図目次 高次 FDTD および WE-FDTD 並列計算による t = 100 ns 後の電界 |Ez | の空間 分布(ガウシアンパルス: f−10dB = 5.33 GHz) . . . . . . . . . . . . . . . . . . 3.19 99 高次 FDTD および WE-FDTD 並列計算による t = 100 ns 後の y = 7.5 m におけ る電界 |Ez | . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 3.20 3 次元における 2 次および 4 次精度 FDTD および WE-FDTD 法の数値分散誤差 110 3.21 高次 FDTD および WE-FDTD 法における伝搬距離による数値分散誤差の蓄積 (クーラン数 0.3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 3.22 3 次元高次 FDTD 法において伝搬距離により生じる数値分散誤差の実際 . . . . . 112 3.23 マルチパス環境化により生じる数値分散誤差 . . . . . . . . . . . . . . . . . . . . 114 3.24 3 次元 FDTD 並列計算における計算機間の電磁界の送受信 . . . . . . . . . . . . 115 3.25 教育用計算機を用いた PC クラスタ(Pentium 4 3.0 GHz,512 Mbyte × 16 台) 116 3.26 PC クラスタにおける FDTD (2,4) 法の並列計算の計算時間 . . . . . . . . . . . . 117 3.27 PC クラスタにおける FDTD (2,4) 法の並列計算の速度向上比 117 3.28 スーパーコンピュータと PC クラスタとの FDTD(2,4) 並列計算結果の比較 . . . 119 3.29 Mur 2 次吸収境界条件におけるデータ通信(xz 面) . . . . . . . . . . . . . . . . 122 4.1 室内 UWB パルス伝搬実験 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.2 実験風景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 4.3 送信アンテナとして用いるビバルディアンテナ . . . . . . . . . . . . . . . . . . . 128 4.4 光電界センサ(NEC-TOKIN 製) . . . . . . . . . . . . . . . . . . . . . . . . . 129 4.5 光電界センサの構造 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 4.6 室内電波伝搬解析で用いる UWB パルス . . . . . . . . . . . . . . . . . . . . . . 130 4.7 室内 UWB パルス伝搬実験で観測された光電界センサの受信波形 . . . . . . . . . 131 4.8 レイトレーシング法による伝搬経路の計算 . . . . . . . . . . . . . . . . . . . . . 132 4.9 デコンボリューションによる送受信システム係数の除去 . . . . . . . . . . . . . . 133 4.10 電波暗室で測定したデコンボリューションで用いる参照信号 V (ω) . . . . . . . . 133 4.11 デコンボリューションによる送受信システム係数の除去 (R = 2 m) . . . . . . . . 134 . . . . . . . . . . xvii 4.12 デコンボリューションによる送受信システム係数の除去 (R = 4 m) . . . . . . . . 135 4.13 FDTD (2,4) 並列計算による室内 UWB 伝搬の解析モデル . . . . . . . . . . . . 136 4.14 送受信アンテナのモデル化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 4.15 FDTD(2,4) 法で計算されたモデル化したアンテナの放射指向性 . . . . . . . . . . 138 4.16 TDR 法による壁や床面の比誘電率測定 . . . . . . . . . . . . . . . . . . . . . . . 139 4.17 FDTD 並列計算と室内伝搬実験との比較 (R = 2.0 m) . . . . . . . . . . . . . . . 140 4.18 FDTD 並列計算と室内伝搬実験との比較 (R = 4.0 m) . . . . . . . . . . . . . . . 141 4.19 伝搬方向(z 軸とのなす角)θ による数値分散誤差 . . . . . . . . . . . . . . . . . 142 4.20 マルチパス環境の実験モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 4.21 周囲を金属板で囲んだマルチパス環境化における観測波形 . . . . . . . . . . . . . 144 4.22 周囲に金属板がない場合の観測波形とデコンボリューション . . . . . . . . . . . . 145 4.23 マルチパス環境下における観測波形と FDTD(2,4) 並列計算との比較 . . . . . . . 147 4.24 電波暗室におけるビバルディアンテナの放射パターン測定 . . . . . . . . . . . . . 148 4.25 測定したビバルディアンテナの放射パターン . . . . . . . . . . . . . . . . . . . . 148 4.26 測定した時間領域におけるビバルディアンテナの放射パターン . . . . . . . . . . 149 xix 表目次 1.1 波長に比べ大きな領域の解析における FDTD 法の使用メモリ . . . . . . . . . . . 10 1.2 FDTD 法を用いた大規模電磁波散乱伝搬解析の研究動向 . . . . . . . . . . . . . . 14 2.1 仙台電波高専における教育用計算機の仕様 . . . . . . . . . . . . . . . . . . . . . 35 2.2 自由空間電波伝搬解析における解析パラメータ . . . . . . . . . . . . . . . . . . . 36 2.3 FDTD および WE-FDTD 法の計算コストの比較 (N = 1200, p = 80) . . . . . . 39 2.4 複数のネットワークスイッチを経由する場合の通信遅延時間 . . . . . . . . . . . . 42 2.5 室内 UWB 伝搬解析における解析パラメータ . . . . . . . . . . . . . . . . . . . . 46 2.6 FDTD 並列計算による大規模計算における計算コストの削減 . . . . . . . . . . . 48 2.7 作成したグリッド用 CD Linux と各 OS のポート開閉・起動サービスの比較 . . . 51 2.8 作成したグリッド用 CD Linux と各 OS における使用メモリ . . . . . . . . . . . 52 2.9 作成したグリッド用 CD Linux と各 OS のセキュリティホール . . . . . . . . . . 52 2.10 CD ブート Linux により構築された並列計算環境における並列計算性能 . . . . . . 53 2.11 キャンパスグリッドを構成する計算機の仕様 . . . . . . . . . . . . . . . . . . . . 58 2.12 グリッドにおける FDTD 並列計算の計算条件 . . . . . . . . . . . . . . . . . . . 59 2.13 領域分割法による最適負荷分散パラメータ(領域分割比)の出力結果 . . . . . . . 59 2.14 最適負荷分散パラメータを適用した FDTD 並列計算の計算時間 . . . . . . . . . . 60 2.15 グリッドを構成する各計算機の計算性能 . . . . . . . . . . . . . . . . . . . . . . 61 2.16 グリッドのネットワーク性能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 2.17 キャンパスグリッドを構成する計算ホストの性能 . . . . . . . . . . . . . . . . . . 63 xx 表目次 2.18 負荷分散法による各計算ホストへの解析領域の割当結果 . . . . . . . . . . . . . . 63 2.19 プロセス割当数を出力するまでの時間 . . . . . . . . . . . . . . . . . . . . . . . . 64 2.20 負荷分散を適用した FDTD 並列計算の計算時間 . . . . . . . . . . . . . . . . . . 64 2.21 グリッドを構成する計算ホストの仕様 . . . . . . . . . . . . . . . . . . . . . . . . 65 2.22 ランダム媒質地中モデルの解析パラメータ . . . . . . . . . . . . . . . . . . . . . 66 2.23 キャンパスグリッドを用いた地中レーダの物体検出シミュレーションにおける計 算時間の削減 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.1 100λ 伝搬を数値分散誤差 約 1◦ で解析するための各高次 FDTD 法の計算コスト . 85 3.2 高次 WE-FDTD 法の並列計算コスト(解析領域 N × N ) 86 3.3 各高次 FDTD 並列計算の計算時間(解析領域 1200 × 1200,時間 1000 ステップ) 3.4 従来の方法と比較した WE-FDTD(2,6) 並列計算の計算コスト比 (1200 × 1200, . . . . . . . . . . . . 88 p = 80) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.5 大型キャビティの伝搬解析で用いる送信波形の周波数と波長 . . . . . . . . . . . . 92 3.6 伝搬距離による数値分散誤差の理論値 . . . . . . . . . . . . . . . . . . . . . . . . 94 3.7 160 × 160× 160 セルのキャビティモデルとパラメータ . . . . . . . . . . . . . . 113 3.8 3 次元高次 FDTD 法および WE-FDTD 並列計算の計算コスト . . . . . . . . . . 115 3.9 使用するスーパーコンピュータと PC クラスタの仕様 . . . . . . . . . . . . . . . 118 3.10 スーパーコンピュータと PC クラスタによる FDTD 並列計算の計算時間の比較 . 119 3.11 並列計算における Mur の吸収境界条件のデータ通信 . . . . . . . . . . . . . . . . 122 4.1 室内 UWB パルス伝搬実験の実験パラメータ . . . . . . . . . . . . . . . . . . . . 127 4.2 マルチパスにより観測される反射波の観測時間の理論値 (R = 1 m) . . . . . . . . 130 4.3 R = 2 m, 4 m において観測されるマルチパスによる反射波の観測時間の理論値 . 133 4.4 FDTD 並列計算の計算パラメータ . . . . . . . . . . . . . . . . . . . . . . . . . . 136 4.5 室内 UWB パルス伝搬における数値分散誤差の理論値 (R = 2, 4 m) . . . . . . . 142 5.1 航空機 SAR の電波伝搬散乱解析に FDTD 法を適用した場合の計算コスト . . . . 156 xxi 5.2 GPR の電波伝搬散乱解析に FDTD 法を適用した場合の計算コスト . . . . . . . . 156 1 第1章 緒論 1.1 研究の背景 1.1.1 高周波電磁波の利用 近年,無線通信やレーダシステムにおいて GHz 帯以上の電磁波の利用が増加しており [1]∼ [6], 使用する電磁波の高周波化やシステムの高度化が進んでいる.図 1.1 に様々な分野で使用される GHz 帯の電磁波とその周波数を示す.例えば,通信の分野では,携帯電話では 900 MHz 帯や 1.5 GHz 帯,PHS (Personal Handy-phone System) では 1.9 GHz 帯が使用されている.さらに,携 帯電話では IMT-2000 と呼ばれる第 3 世代の携帯電話で 2.0 GHz 帯が使用されており,第 4 世 代の次世代携帯電話サービスでは 4 – 5 GHz 帯の使用が検討されている.また,2.4 GHz や 5.0 GHz 帯を使用する無線 LAN,900 MHz 帯や 2.4 GHz を利用した無線タグシステム RFID (Radio Frequency IDentification),高速道路に設置されている ETC (Electronic Toll Collection system) システムでは 5.8 GHz 帯が使用されている.レーダシステムにおいては,2005 年度に打ち上げ 予定の日本の陸域観測技術衛星 ALOS (Advanced Land Observing Satellite) では L バンド(1.3 GHz 帯)を使用した合成開口レーダ SAR (Synthetic Aperture Radar) である PALSAR (Phased Array type L-band Synthetic Aperture Radar) が,また,図 1.2 (a) に示すような情報通信研究機 構 (NiCT) や宇宙航空開発機構 (JAXA) の航空機搭載合成開口レーダ Pi-SAR (Polarimetric and Interferometric Airborne Synthetic Aperture Radar) では,L バンド(1.3 GHz 帯)や X バンド (9.5 GHz 帯)が地震や水害等の自然災害調査や熱帯雨林伐採の調査等の環境計測に用いられてい 2 第 1 章 緒論 wavelength [m] 0.3 0.1 SAR (L-band) radar MASAT SAR (S-band) 0.06 SAR (C-band) weather space control ship radar MLS 0.03 SAR (X-band) PAR UWB RFID GPS communication cell cell 1.0 RFID ETC WLAN WLAN PHS IMT-2000 2.0 4G ? 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 frequency [GHz] 図 1.1 様々な用途で使用される GHz 帯の電磁波 る.また,数百 MHz から 数 GHz 帯を利用した地中レーダ [7] [8] やボアホールレーダ [9] [10] で は,土壌汚染モニタリングや資源調査等に使用されている.以上のように,電磁波を用いた無線通 信やレーダシステムは様々な分野で使用されており,今後さらに広範囲に利用されていくものと予 想される. 特に,UWB (Ultra Wide Band) と呼ばれる 3.1 – 10.6 GHz の帯域を使用するシステム [11] [12] が 2002 年に FCC (Federal Communications Commission) により民間利用が許可されている. UWB では帯域幅 500 MHz 以上,時間幅 数 ns 以下の超高帯域,短パルスを利用するものであ り,高速無線通信や高分解能レーダへの応用が期待されている.例えば,高帯域性を利用した通信 への応用として,室内の情報家電間を 100 – 480 M bit/s で通信する WPAN (Wireless Personal Area Network) が IEEE 802.15.3 TG3a で標準化が行われている.また,超短パルスを用いる高分 3 1.1 研究の背景 解能レーダへの応用として,図 1.2 (b) に示すような地中数 cm 程度の深さに埋設された地雷を探 査する地雷探査レーダ [13] や,地上に設置されたレーダで植生や災害状況の観測を行う GB-SAR (Ground Based SAR) [14] 等が提案されている. (a) (b) 図 1.2 電磁波を用いた環境計測 (a) 航空機 SAR によるリモートセンシング Pi-SAR (b) 地中レーダ GPR 4 第 1 章 緒論 1.1.2 無線通信・レーダシステムの最適設計のための電波伝搬解析手法 このような高周波の電磁波を用いた無線通信・レーダシステムにおいては,電磁波は構造物の形 状や表面の凹凸等の影響を受けるため,複雑な伝搬散乱特性を示す.このことから,送受信アンテ ナの設計・設置位置や受信可能エリアの推定 [15] [16] [17],他の送受信システムや人体への影響等 EMC / EMI 問題 [18] [19] [20] 等システム最適設計のための電波伝搬解析が必要とされている. 電波伝搬解析には,実験による手法と数値シミュレーションによる手法がある.実験による手 法は,ネットワークアナライザを用いた周波数領域における測定 [21] や,パルスジェネレータと ディジタルオシロスコープによる時間領域の測定 [22] [23] があるが,様々なパラメータで実験を 行うには測定コストが高くなる場合があり,また実験自体が困難な場合がある.一方,数値シミュ レーションでは,統計的手法や数値計算による方法がある.統計的手法では,電波伝搬分野におい て,レイリーモデルや仲上−ライスモデル等のマルチパス伝搬の統計モデルがある [15] [16] [27] が,実際の複雑な環境や高周波になるほど精度は低下する.数値計算による手法では,モーメント 法 [24] [25] [26],レイトレーシング法 [27] [28],FDTD (Finite-Difference Time-Domain) 法 [29] ∼ [32] 等がある.モーメント法は積分方程式に基づく方法であり,任意形状の線状アンテナ等の解 析には適しているが,周波数領域の解法であることや,不均質媒質の扱いが困難になる等の問題が ある.レイトレーシング法は幾何光学理論に基づく方法であり,原理は単純であるが,モデルが複 雑になると計算量が増大することや計算精度が低下する問題がある.さらに,時間領域の解法では ないため,レーダ等の時間領域の現象に直接適用することは困難である.これに対し,FDTD 法 はマクスウェルの方程式を直接時間領域で差分化する方法であり,原理が単純であり,任意形状や 不均質媒質に適用可能な時間領域の解法であることから,近年,アンテナ解析や電波伝搬問題等の 電磁界解析で広く用いられている.FDTD 法では比較的精度よく計算することができるが,図 1.3 (a) に示すような地中レーダ GPR や衛星・航空機によるリモートセンシング SAR や,図 1.3 (b) の高周波の屋内外無線通信等波長に比べ大きな領域を解析する場合には,使用メモリが増大し,計 算時間も増加するため計算コストが非常に高くなる問題がある.さらに,FDTD 法では空間を 2 次 √ 精度で差分化するため,位相速度が 1/ ε µ とならずに数値分散誤差や位相誤差と呼ばれる誤差が 5 1.1 研究の背景 satellite forest antenna Tx Rx arban area ground target crops GPR SAR (Ground Penetrating Radar) (Synthetic Aperture Radar) (a) WLAN WLAN Cell Phone Cell Phone Outdoor propagation Indoor propagation (b) 図 1.3 FDTD 法による波長に比べ大きな領域における電波伝搬解析 (a) GPR や SAR によるリモー トセンシング (b) 室内外における高周波無線通信 生じる問題がある [31]. FDTD 法には以上のような問題があるが,時間領域解法である FDTD 法は,図 1.3 に示すよう な地中レーダ GPR や人工衛星・航空機によるリモートセンシング SAR において,シミュレー ションによる電磁波散乱伝搬の現象理解,実験のキャリブレーション,システム最適設計等に適用 することができる.GPR や SAR は,環境計測の手法として,地中の汚染状況調査,災害状況調 査,自然環境調査等に用いられており,FDTD 法の大規模解析における問題を解決することは重要 である.さらに,この問題を解決することは,環境計測等のレーダ応用に限らず,無線通信システ 6 第 1 章 緒論 ムの受信エリア推定や EMC / EMI 問題への応用等にも適用することが可能であり,電磁波を用い た諸技術に広く貢献することができる. 1.2 FDTD 法 FDTD 法では,波長に比べ大きな領域を解析する場合に計算コストと数値分散誤差の問題があ る.ここでは,FDTD 法の基礎方程式について述べ,大規模解析における計算コストと数値分散誤 差の問題を具体的に示す. 1.2.1 基礎方程式 FDTD 法は,式 (1.1),(1.2) のマクスウェルの方程式を,式 (1.3),(1.4) の空間および時間の 2 次精度中心差分で差分方程式に変換する.ここで,∆x は x 方向の空間ステップ(セルサイズ)で あり,∆t は 時間ステップである. ∇×E = − B ∂B ∂t ∇×H =J + (1.1) D ∂D ∂t (1.2) F n (i + 12 , j, k) − F n (i − 12 , j, k) ∂F (i, j, k, t) = + O(∆x2 ) ∂x ∆x 1 (1.3) 1 F n+ 2 (i, j, k) − F n− 2 (i, j, k) ∂F (i, j, k, t) = + O(∆t2 ) ∂t ∆t (1.4) ここで,FDTD 法では図 1.4 (a) に示す Yee 格子と呼ばれる xyz 空間の格子上に電磁界の各成 分を配置する.例えば,電界 Ex は Ex (i + 12 , j, k) ,電界 Hx は Hx (i, j + 12 , k + 12 ) のように互い 1 に 1/2 セルずれた点に配置する.時間についても同様に,電界と磁界は E n ,H n+ 2 のように 1/2 時間ずれた時間で定義される. 式 (1.1),(1.2) のマクスウェルの方程式を式 (1.3),(1.4) により差分方程式に変換すると,式 (1.5)∼(1.10) のように表される.ここで,式 (1.5)∼(1.10) の係数 Cn (i, j) は式 (1.11) のような空 間の媒質定数 ε(i, j, k),µ(i, j, k),σ(i, j, k) と時間ステップ ∆t で与えられる. 7 1.2 FDTD 法 Ex Hz Ey (i, j, k+1) Ey Ex Ez Hy ∆z Hx Ez Ez Ey z Ex y ∆y (i, j, k) (i+1, j, k) x ∆x (a) n-1 E n E n+1 E ∆t ∆t (n-1/2) ∆t (n-1) ∆t H (n+1/2) ∆t n ∆t (n+1) ∆t t n+1/2 H n-1/2 (b) 図 1.4 FDTD 法における電磁界の各成分の配置 (a) 空間配置(Yee 格子) (b) 時間配置 Exn+1 (i + 1 , j, k) 2 + − C2 (i, j, k) · Jxn (i + 12 , j, k) + Jxn+1 (i + 12 , j, k) 1 1 n+ n+ 1 1 1 1 1 2 2 + C3 (i, j, k) · (i + 2 , j + 2 , k) − Hz (i + 2 , j − 2 , k) Hz ∆y 1 1 n+ n+ 1 − (1.5) Hy 2 (i + 12 , j, k + 12 ) − Hy 2 (i + 12 , j, k − 12 ) ∆z = C1 (i, j, k) · Exn (i 1 , j, k) 2 8 第 1 章 緒論 Eyn+1 (i, j + 12 , k) = C1 (i, j, k) · Eyn (i, j + 12 , k) − C2 (i, j, k) · Jyn (i, j + 12 , k) + Jyn+1 (i, j + 12 , k) 1 1 n+ n+ 1 1 1 1 1 2 2 Hx (i, j + 2 , k + 2 ) − Hx (i, j + 2 , k − 2 ) + C3 (i, j, k) · ∆z 1 1 n+ n+ 1 − (1.6) Hz 2 (i + 12 , j + 12 , k) − Hz 2 (i − 12 , j + 12 , k) ∆x Ezn+1 (i, j, k + 12 ) = C1 (i, j, k) · Ezn (i, j, k + 12 ) − C2 (i, j, k) · Jzn (i, j, k + 12 ) + Jzn+1 (i, j, k + 12 ) 1 1 n+ n+ 1 1 1 1 1 2 2 (i + 2 , j, k + 2 ) − Hy (i − 2 , j, k + 2 ) Hy + C3 (i, j, k) · ∆x 1 1 n+ n+ 1 − (1.7) Hx 2 (i, j + 12 , k + 12 ) − Hx 2 (i, j − 12 , k + 12 ) ∆y n+ Hx n+ Hy n+ Hz 1 2 1 2 1 2 n− (i, j + 12 , k + 12 ) = Hx 1 2 (i, j + 12 , k + 12 ) 1 n + C4 (i, j, k) · Ez (i, j + 1, k + 12 ) − Ezn (i, j, k + 12 ) ∆y 1 n 1 1 − Ey (i, j + 2 , k + 1) − Eyn (i, j + 2 , k) ∆z n− (i + 12 , j, k + 12 ) = Hy 1 2 (i + 12 , j, k + 12 ) 1 n 1 1 n Ex (i + 2 , j, k + 1) − Ex (i + 2 , j, k) + C4 (i, j, k) · ∆z 1 − Ezn (i + 1, j, k + 12 ) − Ezn (i, j, k + 12 ) ∆x n− (i + 12 , j + 12 , k) = Hy (1.8) (1.9) 1 2 (i + 12 , j + 12 , k) 1 n 1 1 n Ey (i + 1, i + 2 , k) − Ey (i, i + 2 , k) + C4 (i, j, k) · ∆x 1 − Exn (i + 12 , j + 1, k) − Exn (i + 12 , j, k) ∆y (1.10) 9 1.2 FDTD 法 ⎧ 2 ε(i, j, k) − σ(i, j, k) ∆t ⎪ ⎪ C1 (i, j, k) = ⎪ ⎪ ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ∆t ⎪ ⎪ ⎪ ⎨ C2 (i, j, k) = 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ 2 ∆t ⎪ ⎪ C3 (i, j, k) = ⎪ ⎪ ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ∆t ⎪ ⎪ ⎩ C4 (i, j, k) = µ(i, j, k) (1.11) セルサイズ ∆x,∆y ,∆z と時間ステップ ∆t は,式 (1.12) の CFL (Courant-Friedrich-Levy) 安定条件を満足する必要がある.ここで,v は伝搬速度である. ∆t ≤ v 1 (1.12) 1 1 1 + + ∆x2 ∆y 2 ∆z 2 また,セルサイズ の決め方は,小さいほど精度は良いが使用メモリの増加を伴うので,一般には波 長の 1/10 程度以下に設定する. 1.2.2 計算コスト FDTD 法では,図 1.4 に示したように,空間の格子上に電磁界と媒質定数を配置する.また,セ ルサイズを一般には波長の 1/10 程度以下に設定するため,波長に比べ大きな領域を解析するには 使用メモリや計算時間の計算コストが高くなる.ここで,使用メモリと計算量を FDTD 法の差分 方程式の式 (1.5)∼(1.10) から算出する. 使用メモリは,式 (1.5)∼(1.10) より電磁界の各成分を前後の時間で必要とするので Ni × Nj × Nk の配列を計 12 個必要とし,また,誘電率,透磁率,導電率の Ni × Nj × Nk の定数配列を 3 個必要 とする.ここで,解析領域の大きさを Lx = Ly = Lz = L m,セルサイズを波長 λ の 1/n である ∆x = ∆y = ∆z = ∆s = λ/n とし,倍精度配列を使用するとすれば,使用メモリ Ncells byte は式 (1.13) で求められる. 3 Ncells = 15 × 8 N = 120 L ∆s 3 = 120 nL λ 3 (1.13) 表 1.1 にセルサイズを ∆s = λg /20 とした場合の式 (1.13) から算出した FDTD 法の使用メモリ を示す.式 (1.13) より,10 × 10 × 10 m の自由空間において,f = 1 GHz の正弦波の電波伝搬を計 10 第 1 章 緒論 表 1.1 波長に比べ大きな領域の解析における FDTD 法の使用メモリ (∆x = ∆y = ∆z = ∆s = λg 20 ) computational memory [byte] 2 D (10m2 ) frequency ε0 [GHz] 3 D (10m3 ) εr = 10 ε0 εr = 10 1.0 32 M 320 M 36 G 1T 5.0 800 M 8G 4T 140 T 算するためには,35.6 Gbyte のメモリを必要とし,比誘電率 εr = 10 の媒質中では 1124 Gbyte の メモリが必要になる.さらに,周波数が 5 GHz になると使用メモリは自由空間では 4444 Gbyte, 比誘電率 εr = 10 の媒質中では 140 Tbyte ものメモリが必要になる.以上のように,3 次元で高周 波の電波伝搬を計算するには膨大なメモリを必要とする.なお,表 1.1 に示した使用メモリは,式 (1.5)∼(1.10) から算出したものであり,実際には配列使用の工夫等によりこれより少なくて済む が,オーダーは同程度である.また,セルサイズを ∆s = λg /20 としたが,次に述べるように波長 に比べ数十以上の大きさの領域を解析する場合には数値分散誤差が生じるため,精度を確保するに はセルサイズをさらに小さくする必要があり,大規模解析ではさらに使用メモリが増加する. 計算量は,式 (1.5)∼(1.10) より,電界,磁界の各成分の計算で行う時間 1 ステップ 1 セルあたり の浮動小数点演算数 (floating point number operations) nE ,nH は nE = 75,nH = 21 であるか ら,時間 1 ステップあたりの浮動小数点演算数 Ncalc flop / step は式 (1.14) で求められる.ここ で,∆s = λ/n とする. 3 Ncalc = 96 N = 96 nL λ 3 (1.14) 式 (1.14) より,使用する計算機の浮動小数点演算性能 FLOPS (FLoating point number Operations Per Second) nf lops が分かれば,時間 1 ステップの計算に必要な計算時間は tcalc は式 (1.15) で求め られる. tcalc Ncals 96 = = nf lops nf lops nL λ 3 (1.15) 例えば, nf lops = 10 GFlops 程度のコンピュータを使用した場合の計算時間は,f = 1 GHz, ∆s = λ/20,10 × 10 × 10 m の領域を解析で時間 1 ステップあたり 2.8 s 程度の計算時間になる. 11 1.2 FDTD 法 1.2.3 数値分散誤差 FDTD 法では,式 (1.3) に示したように空間を 2 次精度で差分することから,自由空間中に おいても位相速度 vp が光速とならず数値分散誤差や位相誤差と呼ばれる誤差を生じる.これは 伝搬距離が長くなるごとに蓄積されるため,波長に比べ大きな領域の解析では数値分散誤差の 影響が大きくなる.図 1.5 に 1 波長の伝搬で生じる数値分散誤差を示す.図 1.5 は,セルサイズ ∆x = ∆y = ∆z = ∆s を変化させた場合の数値分散誤差であり,一般によく知られているように セルサイズ ∆s を波長の 1/20 にしても 1 波長伝搬あたり約 1 50 λ の伝搬では約 50 ◦ ,100 λ の伝搬では約 100 ◦ ◦ の誤差が生じる.このことから, の誤差を生じる. 図 1.6,1.7 に実際に FDTD 法において生じる数値分散誤差の例として,自由空間中の電波伝搬 問題を FDTD 法を用いて解析した結果を示す.図 1.6,1.7 は,∆s を波長の 1/20 にした場合の (a) R = 15 m,(b) R = 30 m 離れた観測点における時間応答であり,図 1.6 は周波数 f = 1GHz の正弦波,図 1.7 は半値幅 0.6 ns のガウシアンパルスの伝搬解析である.図 1.6 より,R = 15 m (50λ) の観測点では 54.6◦ の誤差を,R = 30 m (100λ) の観測点では 104.8◦ の誤差を生じており, 図 1.5 で示したように数値分散誤差が伝搬距離が長くなるにつれ蓄積され大きくなることが分か dispersion error per wavelength [deg] る.また,図 1.7 のガウシアンパルスの結果から,高帯域を含むパルス波形の場合には高い周波数 10 1 0.1 0.01 0 10 20 30 40 50 60 70 80 90 100 cells per wavelength 図 1.5 セルサイズの大きさにより生じる FDTD 法の数値分散誤差 12 第 1 章 緒論 0.10 0.08 FDTD exact electric field Ez [V/m] 0.06 0.04 0.02 0.00 -0.02 -0.04 -0.06 -0.08 -0.10 56.0 56.5 57.0 time [ns] 57.5 58.0 109.5 110.0 (a) 0.08 0.06 FDTD exact electric field Ez [V/m] 0.04 0.02 0.00 -0.02 -0.04 -0.06 -0.08 108.0 108.5 109.0 time [ns] (b) 図 1.6 FDTD 法による正弦波の伝搬解析において生じる数値分散誤差 (f = 1 GHz,セルサイズ ∆s = λ/20) (a) R = 15 m (50 λ) (b) R = 30 m (100 λ) 成分で誤差が生じるためパルス波形が崩れることが分かる. 数値分散誤差を軽減するには,図 1.5 よりセルサイズ ∆s を波長の 1/100 にすると 1 波長伝搬あ たり約 5 ◦ の誤差になるが,セルサイズ 1/100 にすると使用メモリは 3 次元解析では 106 倍にも なり,またこれに伴い計算時間も増加するため,セルサイズを小さくすることは現実的ではない. 13 1.2 FDTD 法 0.04 FDTD exact 0.03 electric field Ez [V/m] 0.02 0.01 0.00 -0.01 -0.02 -0.03 -0.04 -0.05 -0.06 52.0 52.5 53.0 53.5 time [ns] 54.0 54.5 55.0 (a) 0.03 FDTD exact electric field Ez [V/m] 0.02 0.01 0.00 -0.01 -0.02 -0.03 -0.04 102.0 102.5 103.0 103.5 time [ns] 104.0 104.5 105.0 (b) 図 1.7 FDTD 法によるガウシアンパルスの伝搬解析において生じる数値分散誤差(f−10dB = 1.35 GHz, 半値幅 0.6 ns,セルサイズ ∆s= λ/20) (a) R = 15 m (67.5 λ) (b) R = 30 m (135 λ) 14 第 1 章 緒論 1.3 FDTD 法を用いた大規模電波伝搬解析に関する研究動向 FDTD 法の大規模解析における計算コストと数値分散誤差の問題を解決するための研究がいく つか行われているが,本節では,(1) ハイブリッド手法,(2) 高精度化手法,(3) 並列計算,(4) リ モートセンシングや無線通信等の大規模解析への応用に関する研究動向について説明する.表 1.2 に FDTD 法を用いた大規模電磁波散乱伝搬解析の研究動向をまとめる. 表 1.2 FDTD 法を用いた大規模電磁波散乱伝搬解析の研究動向 年 ハイブリット法 高精度手法 並列計算 大規模解析への応用 WS cluster [68] SAR, rough surface [83] super computer [69] SAR, rough surface [84] 1990 near to far [43] 1992 1994 + Ray-tracing [49] FDTD(2,4) [65] near to far [83] FDTD(2,4) [52] near to far [84] 1996 + MoM [46] near to far [85] 1998 課題 GPR 3D [89] super computer [72] FDTD(2,4) [54] GPR 2D rough [88] + Ray-tracing [50] GPR 3D antenna [90] near to far [86] FDTD(2,4) subgrid [59] super computer [70] SAR, forest [86] near to far [87] NS FDTD 3D [58] super computer [71] SAR, sea ice [87] super computer [74] broadcast wave [94] FDTD(2,4) subgrid [60] PC cluster [76] [77] [79] MIMO [95] FDTD(2,4) 3D [61] super computer [75] car antenna [74] gird [80] [81] [82] cell phone in train [75] 2002 2004 FDTD(2,4) [53] NS FDTD [57] + MoM [47] 2000 SAR, stratified [85] FDTD(2,4) [55] [56] + MoM + FEM [51] FDTD 法との結合 より大規模問題への適用 高次手法の適用 低コスト高精度手法 時間領域の解析 並列計算特性 スーパークラスタの検証 高次 FDTD 法の適用 実験との比較 (時間領域) FDTD 法の負荷分散 実験との比較 (時間領域) 1.3 FDTD 法を用いた大規模電波伝搬解析に関する研究動向 15 上記以外の代表的な計算コスト軽減の手法として,解析領域内の不連続部分を含むセルで異なる 差分式を用いるサブセル法 [31] や,グリッドの大きさを変えるサブグリッド法 [37] [38],また CFL 安定条件によらず無条件安定とすることで計算時間の削減を目的とした ADI FDTD 法 [39] [40] があるが,いずれも計算コストの削減できるが,数値分散誤差の問題は残されている.さらに, FDTD 法以外にも,PSTD (Pseudo-Spectral Time-Domain) 法 [41] や MRTD (Multi-Resolution Time-Domain) 法 [42] 等の大規模向けの時間領域解法も提案されているが,FDTD 法に比べやや 複雑になる問題がある. 1.3.1 ハイブリッド手法 FDTD 法を用いて大規模な問題を解析するために,FDTD 法と他の手法を組み合わせたハイブ リッド手法が提案されている.例えば,近傍の小さな解析領域を FDTD 法で解析し,その結果を グリーン関数を用いて遠方界に変換する遠方界変換が提案されており [43] [44],アンテナ特性を計 算する場合 [43] や,人工衛星等によるリモートセンシングにおける電磁波散乱特性の解析に適用さ れている [45] [83].また,線状のアンテナ解析を精度よく計算できるモーメント法 [24] [25] との結 合法として,不均質媒質を含む地中レーダのアンテナ解析において,アンテナ部をモーメント法で 精度よく解析し,アンテナ部以外を FDTD 法で計算する手法 [46] [47] が提案されている.さらに, 電波伝搬解析に広く用いられるレイトレーシング法 [27] [48] と FDTD 法を組み合わせた手法が屋 内外の電波伝搬解析で提案されている [49] [50].他にも,FDTD 法,モーメント法,有限要素法を 結合した時間領域の解法も提案されている [51]. これらのハイブリットな手法は,FDTD 法の大規模解析における問題点を解決することが可能で あるが,FDTD 法との結合部の扱いの煩雑さや,時間領域の解析が困難になる等の FDTD 法の特 長が失われる問題がある. 1.3.2 高精度化手法 高精度化による手法は,FDTD 法で用いる式 (1.3) のような空間 2 次精度中心差分に対して,よ り高次の中心差分を用いる高次 FDTD (Higher-Order FDTD) 法 [31] [52]∼ [56] や,3 種類の差分 16 第 1 章 緒論 オペレータを用いて分散誤差の補正を行う NS FDTD (Nonstandard FDTD) 法 [57] [58] 等が提案 されており,これらの手法により波長に比べ数十程度の領域における電波伝搬解析が従来の FDTD 法に比べ精度よくできる [53] [58].さらに,空間 4 次精度と従来の 2 次精度のサブグリッド法を組 み合わせた手法 [56] [59] [60],3 次元における空間 4 次精度 FDTD 法 [61],新しい差分オペレー タやフィルタを組み合わせた手法 [62] [63] 等も提案されている. また,これらの各種高精度 FDTD 法の精度比較が行われている [64]∼ [67] が,FDTD 法の特長 である時間領域解法とアルゴリズムの簡便さを保った高精度解法が必要とされ,この観点からは空 間で高次中心差分を用いる手法 [31] が適していると思われる.時間領域解法は地中レーダや SAR 等のレーダ応用で必要であり,アルゴリズムの簡便さは大規模な解析で必要になる並列計算では メッセージ通信プログラム開発の観点から必要とされる. このように高次 FDTD 法に関する様々な研究が行われているが,(1) 波長に比べ数十,数百程度 の大規模な問題における解析やその数値分散誤差の検討,(2) 高次 FDTD 法の並列計算による大 規模電波伝搬解析とその並列計算特性の検討,(3) 時間領域における実験との比較等がまだ解決さ れていない重要な問題として残されている. 1.3.3 並列計算 FDTD 法は領域分割型の計算手法であり並列計算に適していることから,様々なアーキテクチャ で並列計算が行われている.例えば,ワークステーションを複数台ネットワーク接続し並列計算を 行うワークステーションクラスタを用いた FDTD 並列計算 [68] や,スーパーコンピュータ等の並 列計算専用機を用いた FDTD 並列計算 [69]∼ [71] が提案されている.これらは計算機導入のコス ト等の問題があるが,計算性能の高さや搭載メモリの多さ等の大型計算機の特長を生かすことによ り,携帯電話による人体全身の SAR (Specific Absorption Rate) 分布解析 [72] [73] や,自動車全 体を含めた自動車搭載用アンテナの解析 [74],複数携帯電話による電車内の電界分布解析 [75] 等に 用いられている. これに対して,近年,性能向上の著しいパーソナルコンピュータ(以下 PC)をネットワークを 介して複数台用いる並列計算環境の PC クラスタが提案されており [100],低コストで並列計算が 1.3 FDTD 法を用いた大規模電波伝搬解析に関する研究動向 17 行えることから近年急速に利用されている.PC クラスタにおいても FDTD 並列計算が行われて おり,例えば,スーパーコンピュータ等でしか解析が行えなかった携帯電話による人体全身の SAR 分布解析 [76] や室内電波伝搬解析 [77] [79] が行われている,さらに,複数の異機種 PC を用いる 場合の FDTD 法の負荷分散に関する手法 [78] や,現有の教育用計算機システムを利用した FDTD 並列計算による UWB 伝搬解析 [79] が提案されている.PC クラスタでは,一般に計算用として 複数台の PC を新規導入するが,周囲にある PC を有効に利用する技術としてグリッドコンピュー ティング(グリッド)[81] [108] [109] が近年急速に広がっており,グリッドにおける FDTD 法が 提案されている [80]∼ [82]. FDTD 並列計算に関する研究では,(1) 並列計算における大規模計算においても,数値分散誤差 を考慮していない,(2) 複数の PC クラスタを接続したクラスタであるスーパークラスタにおける 並列計算とその検証,(3) グリッドにおける FDTD 並列計算の負荷分散やグリッドの簡易構築法, (4) 実験との比較による並列計算の有効性の検証等が重要な課題として残されている. 1.3.4 リモートセンシングや無線通信への応用 このような波長に比べ大きな問題になる場合の電波伝搬散乱解析は,人工衛星によるリモートセ ンシング等の分野で多く用いられており,3 次元のランダム地表面 [83] [84],多層地中 [85],VHF 帯における森林 [86],海氷 [87] からの電磁波散乱解析が報告されている.また,地中レーダにおい √ ては地中では波長が自由空間に比べ 1/ εr になることや,地中の不均質媒質をモデル化するには セルサイズ ∆s を小さくする必要があり大規模問題となる.このような地中レーダにおいて,地表 面のランダム性を考慮した 2 次元地中レーダにおける物体検出特性解析 [88],アンテナを含めた地 中レーダの 3 次元解析 [89] [90],損失性不均質媒質における解析 [91] [92] ,また,ボアホールレー ダでは,ランダム表面を考慮した電波散乱特性解析 [93] 等が行われている.さらに,通信の分野で は,複数の送受信アンテナを用いる MIMO (Multi-Input Multi-Output) における伝送容量やビッ ト誤り率の計算 [95] や,デジタル放送波の室内伝搬特性解 [94] 等に FDTD 法が用いられている. このようなリモートセンシングや無線通信における電磁波伝搬散乱解析の研究では,(1) より低 コストな解析法の提案,(2) 大規模解析における数値分散誤差を考慮した高次 FDTD 法による解 18 第 1 章 緒論 析等の重要な問題がまだ未解決である. 1.4 本研究の目的 本研究は,表 1.2 に示したような FDTD 法による大規模電波伝搬解析の問題解決を試みた様々 な研究においてまだ解決されていない重要な問題である,大規模電波伝搬解析を低コストかつ高精 度で行うための手法を提案し,その有効性を実験との比較により明らかにすることを目的とするも のである. 本論文では,まず,FDTD 法を用いた大規模解析における計算コストの問題を,既存の教育用計 算機を用いた大規模 PC クラスタシステムやグリッドによる並列計算により解決する手法を提案す る.ここでは,これまでの研究でまだ解決されていない問題である,(1) より大規模問題への適用, (2) 現有の教育用計算機を用いたスーパークラスタにおける FDTD 並列計算特性,(3) グリッドに おける FDTD 並列計算の負荷分散法,(4) CD ブート Linux によるグリッドの簡易構築法につい ての検討を行う.次に,大規模解析における数値分散誤差と計算コストの問題を,高次 FDTD 法 と大規模 PC クラスタシステムによる並列計算により解決する手法を提案する.ここで,既存研究 で未解決の問題である,(1) より大規模問題への適用,(2) 高次手法の並列計算特性,(3) 低コスト かつ高精度な高次手法についての検討を行う.最後に,本研究で提案した手法の有効性を明らかに するために,金属系を用いないため高精度な測定が可能な新しい測定系である光電界センサ [130] を電波伝搬測定に適用し,電波伝搬実験と本研究の手法を比較する.これにより,従来行われてい なかった時間領域における実験との比較を行い,本研究で提案する高次手法と現有計算機を用いた PC クラスタによる並列計算の有効性を示す. 1.5 本論文の構成 本論文は,5 章から構成される.図 1.8 に本論文の構成と各章間の関係を示す. 第 1 章では,(1) 研究の背景となる近年の無線通信およびレーダシステムの高周波化・高度化を 実例を挙げて述べ,さらに,(2) 無線通信およびレーダシステム最適設計のための手法として用い られる FDTD 法の基礎方程式と大規模解析における計算コストと数値分散誤差の問題を定量的に 1.5 本論文の構成 19 明らかにする.また,(3) FDTD 法を用いた大規模解析に関する研究動向を示し,本研究の目的を 述べる. 第 2 章では,FDTD 法の大規模解析における計算コストの問題を解決するために,(1) 教育用計 算機システムを利用したスーパークラスタによる FDTD 並列計算特性と大規模電波伝搬解析への 適用について述べる.また,より多くの計算資源を得るためにグリッドに着目し,(2) グリッドの 簡易構築法と,(3) グリッドにおける FDTD 並列計算の負荷分散法の提案および評価について述 べる. 第 3 章では,FDTD 法の大規模解析における数値分散誤差の問題を解決するために,空間 n 次 精度の高次 FDTD 法の大規模電波伝搬解析への適用について,(1) 波動方程式に基づく FDTD 法 である WE-FDTD 法の高次への展開と数値分散誤差特性,長距離伝搬における数値分散誤差の実 際,(2) 大規模 PC クラスタにおける高次手法の並列計算特性,(3) 高次 WE-FDTD 並列計算によ る大型キャビティ内の電波伝搬解析への適用,(4) 3 次元への拡張とその数値分散誤差の評価,並 列計算特性について述べる. 第 4 章では,第 2 章および第 3 章で提案した PC クラスタを用いた高次 FDTD 並列計算によ る大規模電波伝搬解析手法に対する評価検証を行うことを目的とし,(1) 光電界センサによる室内 UWB パルス伝搬実験,(2) 室内廊下とマルチパス環境下における実験と PC クラスタを用いた高 次 FDTD 並列計算の比較について述べる. 第 5 章では,研究の総括として,本論文で得られた知見や今後の展開について述べる. 20 第 1 章 緒論 研究背景・目的(問題とその解決法の提案) 第1章 諸論 ○ 研究背景(無線通信システムやレーダシステムの高周波化・高度化) ○ FDTD法を用いた大規模解析の問題(計算コスト・数値分散誤差) ○ FDTD法を用いた大規模解析の既存研究とその問題点 ○ 研究の目的と論文の構成 クラスタを用いた並列計算による計算コストの問題解決 第2章 クラスタを用いたFDTD並列計算による 大規模電波伝搬解析 ○ 教育用PCによる大規模クラスタを用いた FDTD並列計算 高次差分法とその並列計算による数値分散誤差の問題解決 第3章 高次FDTD法とその並列計算による 大規模伝搬解析 ○ 空間高次精度のFDTD / WE-FDTD 法 ○ 伝搬距離による位相誤差特性 ○ 波動方程式に基づくFDTD法(WE-FDTD) ○ 並列計算特性 ○ グリッドによるFDTD並列計算 ○ 大型キャビティにおける電波伝搬解析への適用 ○ 室内電波伝搬解析への適用 ○ 3次元への拡張 提案手法の評価(実験との比較) 第4章 高次FDTD法の並列計算による大規模電波伝搬解析と 光電界センサを用いた室内UWB伝搬実験との比較 ○ 光電界センサを用いた室内UWB伝搬実験 ○ 高次FDTD並列計算と実験との比較 得られた結論 第5章 結論 各章のまとめ,結論,今後の課題・展開 図 1.8 本論文の構成 21 第2章 PC クラスタを用いた FDTD 並列計算による大 規模電波伝搬解析 2.1 緒言 FDTD 法は,マクスウェルの方程式を時間と空間で差分化し,時間ごとに解析領域内の電磁界 を逐次計算する方法であり,電磁界の過渡応答を直接解析可能なことが特長である.しかしなが ら,波長に比べ大きな領域の問題を解析する場合には,多くのメモリを必要とし計算時間がかか ることが問題であった.これらの問題について,使用メモリに関する研究は,Green 関数を用い た遠方界変換による大規模な領域の計算 [43] [83], 空間微分を 2 次近似から 4 次近似にすること により分散誤差を小さくする高次 FDTD 法 [31] [53] 等がある.計算時間に関する研究は,陰解法 を適用することで時間ステップに対して無条件安定になる ADI FDTD 法 [39] [40] がある.また, FDTD 法は領域分割型の計算手法であるため並列計算に適していることから,ワークステーション (WS) HP-735 × 8 台を 10Base-T で接続した WS クラスタによる並列計算 [68] や,Cray T3E や HITACHI SR8000 等の並列型スーパーコンピュータを用いた並列計算 [69] [70] [71] 等の並列計算 により計算時間の問題を解決する研究が行われている. これらの並列計算に関する研究で,並列型スーパーコンピュータは,共有・分散メモリ型アーキ テクチャが最近の主流であり,プロセッサ間で高速な通信が可能であり並列効率も高いが,(1) 設 置するためのコストが高い,(2) 並列計算に特化した専用のアーキテクチャであるため維持管理が 22 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 容易ではない,(3) 多数の利用者で共有しているために実行時間や使用メモリの制限がある等の問 題がある.これに対して,近年,市販のパーソナルコンピュータ (PC) の性能が急速に向上し,PC と WS との性能差はほとんどなくなってきている.WS クラスタに比べ 2.5∼4 倍ほど低コストに 並列計算環境を構築できる [100] ことから,PC を多数台接続する PC クラスタが用いられるよう になっている [100]∼ [104].PC クラスタや WS クラスタは,いずれも多数台の PC や WS をネッ トワーク接続する分散メモリ型アーキテクチャであり,接続台数を容易に増加させることができる ため,メモリを多く必要とする大規模問題の解析が可能であるが,PC や WS 間の通信として現状 ではまだ 100 Base-T Ethernet が広く用いられているため,多数台接続した場合や複数のネット ワークを経由する場合には,通信遅延が生じる等により並列計算の効率が低下することが問題に なってくる.しかしながら,PC クラスタを用いることにより,他の並列計算アーキテクチャに比 べ,(1) 並列型スーパーコンピュータに比べ安価に並列計算が行える,(2) 市販の PC やパーツ類を 用いるので管理が容易になる,(3)WS に比べ低コストであるため大規模クラスタを構築できメモリ を多く必要とする大規模問題にも対応できる等の利点がある. また,教育機関には教育用のコンピュータルームがあり,数十台以上の PC が設置されているが, 夜間や休日には使用されておらず,余剰資源の有効活用は重要な問題である.仙台電波高専にも, 市販 PC (Celeron 900 MHz) による教育用計算機室が 2 部屋あり,計 96 台の PC が設置されてい るが,夜間や休日には使用されていない.これらを用いて PC クラスタを構築し並列計算を行え ば,高速な計算や大規模問題に使用できる可能性がある.PC クラスタには以上のような利点があ るが,PC クラスタを用いた FDTD 並列計算の詳細な検証や,波長に比べ大きな領域の解析に関す る検討はほとんど行われていない.特に,異なるネットワークにある複数の PC クラスタを接続す る PC クラスタのクラスタ(スーパークラスタ [100])を FDTD 並列計算へ適用することや,多数 のネットワークを経由する際に生じる通信遅延による FDTD 並列計算への影響の評価および検証 は行われていない. そこで本章では,教育機関の教育用計算機を利用したスーパークラスタを用いた FDTD 並列 計算を提案する.実際に,仙台電波高専に設置されている 1000 Base-SX/T および 100 Base-T Ethernet や多数のネットワークスイッチで構成される教育用計算機 2 システム 80 台を用いてスー 2.1 緒言 23 パークラスタを構築し,スーパークラスタによる FDTD 並列計算の詳細な検証および評価を行っ た.また,スーパークラスタの利点である多数台の接続による大規模解析への適用例として,室内 廊下における UWB パルス伝搬のような計算機 1 台では計算困難な波長に比べ非常に大きな領域 の電波伝搬解析を行い,スーパークラスタを用いた大規模解析の評価および検討を行う. さらに,仙台電波高専では教育用計算機システムの他にも,学科や研究室単位で計算機を多数保 有しており,これらの計算機を並列計算に有効利用することを考える.この思想は,グリッドコン ピューティング(グリッド)と呼ばれる組織的・地理的に離れた場所にある計算機を複数台使用す ることにより並列計算環境を構築する技術である.グリッドと同じクラスタ型の PC・WS クラス タは,一般に同一ネットワーク内にある同機種の PC や WS を複数台用いるのに対し,グリッド は,異なるネットワーク上の異機種の計算機を複数台用いることが特徴である.グリッドを用いる ことにより,PC・WS クラスタに比べ,より多くの計算資源を得ることができる利点があるが,問 題点として,(1) 異機種の計算機を用いるため各計算機の性能ごとに負荷分散をする必要があるこ と,(2) 使用する計算機ごとに OS が異なるためプラットフォームに依存しないプログラミングを 行う必要があること,(3) 複数の計算機やネットワークを使用するためセキュリティを考慮する必 要があること等がある.グリッドのヘテロ環境における FDTD 法に関する研究として,(1) の負荷 分散の問題に関する研究は,同一ネットワーク上にある 3 種類の異機種計算機を用いたヘテロ PC クラスタの負荷分散に関する研究が行われている [78].また,(2) のプラットフォームに依存しな いプログラミングに関しては,Java を用いた FDTD 並列計算プログラムに関する研究が行われて いる [80].しかしながら,グリッド上の FDTD 並列計算に関する実証実験や,負荷分散法に関す る研究は行われていない [81]. そこで本研究では,FDTD 法の計算コストの問題をグリッドを用いて解決することを目的とす る.これを実現するために,(1) グリッドで使用する計算機を保護するために CD のみで起動する Linux (CD ブート Linux)に着目し,グリッド用に最適化した CD ブート Linux の開発および作 成と,作成した CD ブート Linux による夜間や休日等に使用されていない遊休計算機群を用いた キャンパスグリッドの構築,(2) グリッドで生じるヘテロな計算性能およびネットワーク性能にお ける FDTD 並列計算の負荷分散に関する検討を行う.グリッドに CD ブート Linux を用いること 24 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 により,(1) 使用する計算機の OS に関わらずに Linux を起動できるため文献 [80] のようなプラッ トフォームに依存しないプログラミング言語で既存のプログラムを書き直す必要がない,(2) 最新 のパッケージの使用や並列計算に必要なポートのみを開ける設定をあらかじめ行うことによりグ リッド内のセキュリティを統一的に高めることができる,(3) ハードディスクを使用しないため使 用する計算機のデータを保護できる,(4) グリッド構築コストを削減することができる等の利点が ある.また,グリッドにおける FDTD 並列計算の負荷分散では,各計算機の計算性能だけなく,複 数の多種ネットワークを使用するためネットワーク性能も考慮する必要があるが,使用する計算機 すべての計算性能とネットワーク性能を測定し最適な負荷分散を行うことは現実には困難である. そこで,グリッドにおける FDTD 並列計算の負荷分散手法として,並列計算に使用する計算機の 性能毎に割当る領域を変える領域分割法と,計算機 1 台に複数のプロセスを実行することにより計 算機の性能毎に領域を割当るマルチプロセス法を提案する.実際に 3 種類のキャンパスグリッドに おいて FDTD 並列計算の負荷分散実験を行い,様々な機種の計算機を用いたグリッドにおいても 本研究で提案する負荷分散が有効であることを示す. 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 2.2.1 FDTD 法の並列計算 FDTD 法は,マクスウェルの方程式を時間と空間で差分方程式に離散化し,時間ごとに解析領域 内の電磁界を逐次計算する方法である.ここでは,多数台の計算機による並列計算の効果を詳細に E = Ez k, H = Hx i + Hy j) を考える.TM 波では式 (1.1),(1.2) のマク 検討するために TM 波 (E スウェルの方程式は,式 (2.1)∼(2.3) で表される. 1 ∂Hy ∂Hx ∂Ez 1 σ = − − Ez − Jy ∂t ε ∂x ∂y ε ε 1 ∂Ez ∂Hx =− ∂t µ ∂y 1 ∂Ez ∂Hy = ∂t µ ∂x (2.1) (2.2) (2.3) 式 (2.1)∼(2.3) を式 (1.3),(1.4) の時間および空間の 2 次精度中心差分より差分方程式に変形す ると,式 (2.4)∼(2.6) のような電界と磁界に関する差分方程式を得ることができる. 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 25 Ezn+1 (i, j) = C1 (i, j) · Ezn (i, j) − C2 (i, j) · Jzn (i, j) 1 1 1 1 n+ n+ n+ n+ 1 1 1 1 + C3 (i, j) · Hy 2 (i + 2 , j) − Hy 2 (i − 2 , j) − Hx 2 (i, j + 2 ) + Hx 2 (i, j − 2 ) (2.4) n+ 21 Hx n+ 21 Hy n− 21 (i, j + 12 ) = Hx n− 21 (i + 12 , j) = Hy (i, j + 12 ) − C4 (i, j) · (Ezn (i, j + 1) − Ezn (i, j)) (2.5) (i + 12 , j) + C4 (i, j) · (Ezn (i + 1, j) − Ezn (i, j)) (2.6) ここで,式 (2.4)∼(2.6) の Cn (i, j) は,解析空間の媒質定数 ε(i, j),µ(i, j),σ(i, j) やセルサイズ ∆s(= ∆x = ∆y),時間ステップ ∆t からなる式 (2.7) で表される定数である. ⎧ 2ε(i, j) − σ(i, j)∆t ⎪ ⎪ C1 (i, j) = ⎪ ⎪ ⎪ 2ε(i, j) + σ(i, j)∆t ⎪ ⎪ ⎪ ⎪ ⎪ 2∆t ⎪ ⎪ C2 (i, j) = ⎪ ⎨ 2ε(i, j) + σ(i, j)∆t 2∆t ⎪ ⎪ C3 (i, j) = ⎪ ⎪ ∆s(2ε(i, j) + σ(i, j)∆t) ⎪ ⎪ ⎪ ⎪ ⎪ ∆t ⎪ ⎪ C4 (i, j) = ⎪ ⎪ ⎩ µ(i, j)∆s (2.7) セルサイズ ∆s と時間ステップ ∆t の値は,∆t については式 (1.12) の CFL (Courant-Friedrich- Levy) 安定条件により決定され,∆s は一般に波長の 1/20 以下に設定する必要がある.このため, 高周波で高誘電率の物質を扱う場合には,真空中に比べ波長が短くなるので,解析に必要なメモリ が多くなり,計算時間も増加する. PC クラスタのような分散メモリ型の並列計算機における FDTD 法の並列計算では,図 2.1 に 示すように使用する各計算機に解析領域を分配し,各計算機で電磁界の計算を行い,時間ステップ ごとに計算結果を計算機間で交換する.この FDTD 並列計算のアルゴリズムを図 2.2 に示す.並 列型スーパーコンピュータは,共有メモリ型や分散共有メモリ型の構造となっているが,PC クラ スタは完全な分散メモリ型であるので,各計算機間で電磁界成分の通信が行われる.また,各計算 機に解析領域を分配する際には図 2.3 に示すように割当られた電磁界の他に隣接する計算機から電 磁界を受信できるようにメモリを多く確保する必要がある.計算機間の境界におけるデータ送受信 26 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 analysis region antenna scatterer PC 1 PC 2 Hy Ez PC n Hy Ez 図 2.1 FDTD 並列計算における解析領域の分割と計算機間のデータ交換 MPI_Initialize(); Dis_model(); {Parameter, E_init, H_init} for t=0 to Te do for i:=0 to Ni do for j:=0 to Nj do begin E_calc(); E_Exchange(); {MPI_Send(), MPI_Recv()} E_Update(); H_calc(); H_Exchange(); {MPI_Send(), MPI_Recv()} H_Update(); end; MPI_Finalize(); 図 2.2 FDTD 並列計算のアルゴリズム は,図 2.3 に示すように,p 番目の計算機における電界 Ez の計算では,p − 1 番目の計算機が持つ 磁界 Hy を必要とし,p − 1 番目の計算機における磁界 Hy の計算では,p 番目の計算機が持つ電界 Ez を必要とするので,計算機間では,電界 Ez と磁界 Hy の交換を行う必要がある. ここで,FDTD 法と FDTD 並列計算の 1 ステップ時間の計算量を定式化する.解析領域の大き さは N × N とし,使用する計算機の台数を p とする.FDTD では TM 波の場合,Ez , Hx , Hy の 3 成分を N × N の全領域で計算を行うので,計算量は N 2 + 2N(N − 1) となる.FDTD 並列計算 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 27 analysis region PC: p-1 PC: p y z x PC: p-1 Ez(i,j+1) Hy(i+1/2,j+1) Hx(i,j+1/2) send Ez to PC:p-1 Ez(i,j) Hy(i+1/2,j) PC: p send Hy to PC:p Ez(i+1,j+1) Ez(i+1,j) 図 2.3 FDTD 並列計算における計算機間の電磁界の送受信 では p 台使用より,計算機間のデータ交換で 1 台あたり Ez と Hy の送受信が接続された計算機の 両境界領域で必要となるので,データ交換で 4N(p − 1) の計算量増加となり,1 台あたりの計算量 OF (p, N) は式 (2.8) のようになる. OF (p, N) = N 2 + 2N(N − 1) 4N(p − 1) + p p (2.8) 次に,式 (2.8) の計算量より FDTD 並列計算における計算時間の理論式を導出する.使用する計 算機の浮動小数点演算性能を F Flops,ネットワークの帯域幅を B bit/s,通信遅延時間を Tdelay s で表すと,p 台使用時の時間 1 ステップの計算時間の理論式 TF (p, N) s/step は,式 (2.9) のように なる. TF (p, N) = nE N 2 + nH N(N − 1) nC N(p − 1) + + Tdelay pF pB (2.9) ここで,nE , nH は電界および磁界の計算における時間 1 ステップ 1 セルあたりの浮動小数点演算 数,nC は通信に要するビット数である. 28 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 式 (2.9) から分かるように,PC クラスタで並列計算を行う場合には,並列型スーパーコンピュー タとは異なり,ネットワーク性能が大きな影響を及ぼすので,高い並列効果を得るには,帯域幅 B を大きく,遅延時間 Tdelay を小さくする必要がある.特に,複数のネットワークを経由するスー パークラスタにおいては,遅延時間 Tdelay が並列計算に影響を及ぼす. 2.2.2 波動方程式に基づく FDTD 法(WE-FDTD 法)とその並列計算 2.2.2.1 WE-FDTD 法 電波伝搬解析のような電界強度を求める問題において,FDTD 法を用いた場合には電界と磁界 の両方を計算するため,出力値として使用しない磁界も計算しなければならず,メモリが余計に必 要であった.この問題を解決するために波動方程式を直接計算する手法である WE-FDTD (Wave Equation FDTD) 法 [96]∼ [99] が提案されている.WE-FDTD 法では,電界(または磁界)のみ を計算すればよいので,使用メモリが半分で済むこと,また,磁界を計算しないため計算時間も短 くできる利点がある.さらに,並列計算のデータ送受信においても,電界あるいは磁界だけで済む のでアルゴリズムは単純になる.しかしながら,電界と磁界を両方得たい場合には,電界から磁界 を得るにはアンペールの法則を新たに計算する必要があり,FDTD 法より計算量は増加する欠点が あるため,電界か磁界のどちらか一方を求める場合に有効である. FDTD 法がファラデーの法則とアンペール−マクスウェルの法則を計算するのに対して,WEFDTD 法は式 (1.1) のファラデーの法則と式 (1.2) のアンペール−マクスウェルの法則より導かれ る波動方程式を計算する.式 (1.1),(1.2) より電界に関する波動方程式は式 (2.10) で表される. ∂ 2E (rr , t) ∂t2 E (rr , t) J (rr , t) ∂E ∂J − σ(rr , t) µ(rr , t) + ∇ ∇ · E (rr , t) = µ(rr , t) ∂t ∂t ∇2E (rr , t) − ε(rr , t) µ(rr , t) (2.10) TM 波では式 (2.10) は,式 (2.11) で表される. 1 ∂ 2 Ez = ∂t2 εµ ∂ 2 Ez ∂ 2 Ez + ∂x2 ∂y 2 − σ ∂Ez 1 ∂Jz − ε ∂t ε ∂t (2.11) WE-FDTD 法では,式 (2.11) の波動方程式を FDTD 法と同様の原理で式 (2.12),(2.13) の 2 階偏 微分における時間および空間の 2 次精度中心差分により差分方程式に変形し,時間ごとに全解析領 29 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 域で電界分布を求める. ∂F 2 (i, j, t) 1 n n n = F (i + 1, j) − 2F (i + 1, j) + F (i − 1, j) + O(∆x2 ) ∂x2 ∆x2 ∂F 2 (i, j, t) 1 n+1 n n−1 = (i, j) − 2F (i, j) + F (i, j) + O(∆t2 ) F ∂t2 ∆t2 (2.12) (2.13) 式 (2.11) は式 (2.12),(2.13) より,式 (2.14) の差分方程式に変形される. Ezn+1 (i, j) = C1 (i, j) · Ezn (i, j) − C2 (i, j) · Ezn−1 (i, j) − C3 (i, j) · Jzn+1 (i, j) − Jzn−1 (i, j) n n n n n (2.14) + C4 (i, j) · Ez (i + 1, j) + Ez (i − 1, j) + Ez (i, j + 1) + Ez (i, j − 1) − 4Ez (i, j) ここで,式 (2.14) の Cn (i, j) は,式 (2.15) で表されるような解析空間の媒質定数 ε(i, j),µ(i, j), σ(i, j) やセルサイズ ∆s(= ∆x = ∆y),時間ステップ ∆t からなる定数である. ⎧ 4 ε(i, j) ⎪ ⎪ C1 (i, j) = ⎪ ⎪ ⎪ 2 ε(i, j) + σ(i, j) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ 2 ε(i, j) − σ(i, j) ∆t ⎪ ⎪ ⎪ ⎨ C2 (i, j) = 2 ε(i, j) + σ(i, j) ∆t ⎪ ∆t ⎪ ⎪ C3 (i, j) = ⎪ ⎪ ⎪ 2 ε(i, j) + σ(i, j) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ 2∆t ∆t 1 ⎪ ⎪ ⎩ C4 (i, j) = 2 ε(i, j) + σ(i, j) ∆t µ(i, j) ∆s2 (2.15) 2.2.2.2 WE-FDTD 法における媒質境界の扱い WE-FDTD 法において,図 2.4 のような媒質境界付近の電界の扱いは,FDTD 法の媒質境界の 処理 [32] と同じように扱うことができる.図 2.4 において,境界付近の電界 Ez の位置における誘 電率を求めるために,図 2.4 の閉曲線 C に対してアンペールの法則を適用すると式 (2.16) のよう になる. H · dll = σ C E · n dS + ε S S E ∂E · n dS ≈ ∂t σ1 L1 + σ2 L2 ε1 L1 + ε2 L2 ∂Ez Ez + ∆x∆y ∆y ∆y ∂t (2.16) 式 (2.16) より,等価誘電率 εeq と等価導電率 σeq は式 (2.17),(2.18) で求めることができる. ε1 L1 + ε2 L2 ∆y σ1 L1 + σ2 L2 σeq = ∆y εeq = (2.17) (2.18) 30 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 Hx C Ez ε1 σ1 Hy Hy ε2 σ2 S L1 ∆y L2 Hx ∆x 図 2.4 WE-FDTD 法における媒質境界付近の扱い 特に,電界が境界上にある場合,すなわち, L1 = L2 = ∆y/2 では,等価誘電率 εeq と等価導電率 σeq は式 (2.19),(2.20) のように平均として求めることができる. ε1 + ε2 2 σ1 + σ2 σeq = 2 εeq = (2.19) (2.20) 媒質境界を含む場合の WE-FDTD 法の取り扱いを確認するために,図 2.5 に示す解析モデルで 観測点における電界 Ez の時間応答を FDTD 法と比較する.図 2.5 の解析モデルにおいて,媒質 1 を自由空間とし εr = 1.0,σ = 0 S/m ,媒質 2 を εr = 4.0,σ = 0.01 S/m とする.波源とし てガウシアンパルス(半値幅 1.6 ns)の直線状電流源 Jz を媒質境界面から 1.0 m 離れた位置に, 観測点 を 0.5 m の位置に設定し,観測点における電界 Ez を WE-FDTD 法と FDTD 法で計算す る.ここで,媒質境界はセル上,すなわち,媒質定数 εeq ,σeq は式 (2.19),(2.20) として計算し Jz 1.0m Obs. ε0 σ=0 0.5m 0.5m εr=4.0 σ=0.01 図 2.5 媒質境界における WE-FDTD 法と FDTD 法の比較モデル 31 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 0.10 electric field Ez [V/m] FDTD WE-FDTD 0.05 0.00 -0.05 -0.10 -0.15 -0.20 0 2 4 6 8 time [ns] 10 12 14 図 2.6 媒質境界を含むモデルにおける WE-FDTD 法と FDTD 法の比較 た.図 2.6 に WE-FDTD 法と FDTD 法で計算した観測点における電界 Ez の時間応答を示す.図 2.6 より,ふたつの計算結果はよく一致しており,媒質境界の取り扱いは WE-FDTD 法においても FDTD 法と同様に扱えることが確認できる. 2.2.2.3 WE-FDTD 法の並列計算 WE-FDTD 法の並列計算では,図 2.7 に示すように使用する各計算機に解析領域を分配し,各 計算機で電界あるいは磁界の計算を行い,時間ごとに計算結果を計算機間で交換する必要がある. WE-FDTD 法でも FDTD 法のデータ交換と同様に図 2.8 (b) に示す計算機間の境界において,p 番の計算機が行う電界 Ez (i, j) の計算では p − 1 番の計算機が持つ電界 Ez (i − 1, j) を,p − 1 番 目の電界 Ez (i − 1, j) の計算では p 番目の電界 Ez (i, j) を必要とするので,計算機間では,Ez (i, j) と Ez (i − 1, j) の送受信を行えばよい. WE-FDTD 並列計算アルゴリズムを図 2.9 に示す.WE-FDTD 法では,電界 Ez の計算後に図 2.8 (b) に示すような電界 Ez の交換が行われる.FDTD 並列計算では次に,磁界 Hx , Hy の計算を 行い,さらに計算機間で磁界 Hy を交換するが,WE-FDTD 並列計算では,磁界に関する計算と データ交換の部分は行わなくてよいため,並列計算におけるアルゴリズムは簡便になる. WE-FDTD と WE-FDTD 並列計算の時間 1 ステップあたりの計算量を定式化する.解析領域 32 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 analysis region antenna scatterer PC 1 PC 2 Ez Ez PC n Ez Ez 図 2.7 WE-FDTD 並列計算における解析領域の分割と計算機間のデータ交換 Send to Processor p Send to Processor p Hy(i-1/2,j+1) Ez(i-1,j+1) Ez(i,j+1) Hx(i-1,j+1/2) Hy(i+1/2,j+1) Ez(i+1,j+1) Hx(i,j+1/2) Ez(i-1,j) Hy(i-1/2,j) Ez(i,j) Ez(i-1,j+1) Ez(i,j+1) Ez(i+1,j+1) Ez(i-1,j) Ez(i,j) Ez(i+1,j) Hx(i+1,j+1/2) Hy(i+1/2,j) Ez(i+1,j) Send to Processor p-1 Send to Processor p-1 Processor: p-1 Processor: p Processor: p-1 Processor: p (b) (a) 図 2.8 WE-FDTD 並列計算における計算機間の電磁界の送受信 (a) FDTD 法 (b) WE-FDTD 法 の大きさは N × N とし,使用する計算機の台数を p とする.WE-FDTD では TM 波の場合,Ez を N × N の全領域で計算を行うので,計算量は N 2 となる.WE-FDTD 並列計算では,p 台使用 により,計算機間のデータ交換で 1 台あたり Ez の送受信が接続された計算機の両境界領域で必要 となるので,データ交換で 2N(p − 1) の計算量増加となり,1 台あたりの計算量 OW (p, N) は式 (2.21) のようになる. OW (p, N) = N 2 2N(p − 1) + p p (2.21) 次に,式 (2.21) の計算量より WE-FDTD 並列計算における計算時間の理論式を導出する.使用 33 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 MPI_Initialize(); Dis_model(); {Parameter, E_init, H_init} for t=0 to Te do for i:=0 to Ni do for j:=0 to Nj do begin E_calc(); MPI_Initialize(); Dis_model(); {Parameter, E_init, H_init} for t=0 to Te do for i:=0 to Ni do for j:=0 to Nj do begin E_calc(); E_Exchange(); {MPI_Send(), MPI_Recv()} E_Update(); H_calc(); H_Exchange(); {MPI_Send(), MPI_Recv()} E_Exchange(); {MPI_Send(), MPI_Recv()} E_Update(); end; MPI_Finalize(); H_Update(); end; MPI_Finalize(); (a) (b) 図 2.9 WE-FDTD 並列計算のアルゴリズム (a) FDTD 法 (b) WE-FDTD 法 する計算機の浮動小数点演算性能を F Flops,ネットワークの帯域幅を B bit/s,通信遅延時間を Tdelay s で表すと,p 台使用時の時間 1 ステップあたりの計算時間の理論式 TW (p, N) s/step は, 式 (2.22) のようになる. n E N 2 nC N(p − 1) + + Tdelay TW (p, N) = pF pB (2.22) ここで,nE は電界の計算における時間 1 ステップ 1 セルあたりの浮動小数点演算数,nC は通信に 要するビット数である. 2.2.3 FDTD 法および WE-FDTD 法の並列計算特性 2.2.3.1 計算環境 仙台電波高専には,図 2.10,2.11 に示すように校内 LAN に 1000 Base-SX で接続された教育 用計算機システムが 2 システムあり,計 96 台の同一機種の計算機が設置されている.これらの 計算機のうち 80 台を使用してスーパークラスタを構築し,FDTD 並列計算を行う.各計算機の仕 様は,表 2.1 に示すように CPU は Celeron 900 MHz,搭載メモリは 128 Mbyte,NIC は Intel PRO 100 (100 Mbit/s) であり,上流のネットワークスイッチとは 1000 Base-SX/T で接続されて いる.OS は Windows 2000 と Linux (kernel 2.4.5-3) が搭載されているが,ここでは,長時間の 計算における安定性とセキュリティの観点から Linux を用いた.並列計算において計算機間の通 34 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 図 2.10 仙台電波高専における教育用計算機システム Computer Room 2 12PCs 12PCs 8224XL 8224XL 12PCs 8224XL 12PCs 8224XL 9006T Campus Network File Server 1000Base-SX 1000Base-T 100Base-T 9006T 8224XL 8224XL 24PCs 24PCs Computer Room 1 図 2.11 仙台電波高専における教育用計算機システムのネットワーク図 信を行うライブラリとして,フリーの MPI (Message Passing Interface) [105] [106] の実装である mpich-1.2.4 [107] を用いた. 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 35 表 2.1 仙台電波高専における教育用計算機の仕様 CPU, cache Celeron 900 MHz, 128 Kbyte memory 128 Mbyte network, NIC Fast Ether 100 Mbit/s, Intel PRO/100 network switch CentreCom 9006T, 8224XL OS Linux kernel 2.4.5-3 MPI mpich-1.2.4 compiler mpicc (gcc version 2.95.3) 2.2.3.2 解析モデル FDTD および WE-FDTD 並列計算の計算精度を確認するために,図 2.12 の自由空間の電波伝搬 モデルを考え,並列計算と解析解の比較を行った.計算パラメータを表 2.2 に示す.並列計算では, 解析領域を 1000 × 1000,セルサイズ ∆s,時間ステップ ∆t をそれぞれ ∆s = 5 mm,∆t = 0.01 ns とし,使用する計算機の台数 p を p = 5 とした.波源は直線状電流源とし,式 (2.23) のガウシ アンパルス (α = 1.0 × 10−3 , β = 30.0, t0 = 2.5 ns, T = 5 ns) とした. Iz (t) = α exp −β t − t0 T 2 (2.23) 解析解として,式 (2.24) で表される自由空間の波動方程式の解 [33] を用いた. µ0 Ez (rr , t) = − 2π ∞ 0 |rr − r s |2 + ξ 2 ∂ 1 Iz t − dξ · ∂t c0 |rr − r s |2 + ξ 2 (N, N) free space Jz rs y z (0, 0) Obs. r x 図 2.12 FDTD 並列計算の計算精度検証のための自由空間電波伝搬モデル (2.24) 36 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 表 2.2 自由空間電波伝搬解析における解析パラメータ total cells 1000 × 1000 source point current source (gaussian pulse) f−10dB , λ 529 MHz, λ=0.57 m space increment ∆s ∆s = 5 mm time increment ∆t ∆t = 0.01 ns time step 1000 2.2.3.3 並列計算における計算精度 図 2.13 に自由空間の電波伝搬について,5 台の計算機を使用した場合の FDTD および WE- FDTD 並列計算の計算結果と解析解の比較を示す.いずれも,観測点を波源から 0.1m 離れた点に 設定した場合の観測点における電界 Ez の時間応答である.図 2.13 より,FDTD および WE-FDTD 並列計算の結果は解析解とよく一致しており,並列計算の妥当性を確認できる.なお,ここでは p = 5 の結果を示したが,解析領域 N と台数 p が N mod p = 0 のとき,すなわち,解析領域が使 用する計算機に余りなく分配されたとき同様な結果になる. 0.006 parallel WE-FDTD parallel FDTD 0.004 exact electric field Ez [V/m] 0.002 0.000 -0.002 -0.004 -0.006 -0.008 -0.010 0 2 4 6 8 time [ns] 図 2.13 FDTD および WE-FDTD 並列計算の計算精度 10 37 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 2.2.3.4 並列計算特性 スーパークラスタによる FDTD および WE-FDTD 並列計算の効果を評価するために,解析領域 N × N ,p 台の計算機を使用した場合の計算時間 T (p, N),速度向上比 S(p, N),並列効率 E(p, N), 通信比 C(p, N) を図 2.14∼2.17 に示す.ここで,計算時間 T (p, N) とは,並列計算の計算および 通信の時間を含んだ wall clock time である.wall clock time は,MPI 関数の MPI Wtime() を用 いて 10 回測定し,その平均値より求めた.また,速度向上比 S(p, N),並列効率 E(p, N),通信比 C(p, N) の定義を式 (2.25)∼(2.27) に示す. T (1, N) T (p, N) (2.25) E(p, N) = T (1, N) S(p, N) = p pT (p, N) (2.26) C(p, N) = pT (p, N) − T (1, N) pT (p, N) (2.27) S(p, N) = 図 2.14 の計算時間 T (p, N) の結果より,使用台数 p を増すごとに高速な計算が行われること が分かる.並列計算の効率を示す図 2.15,2.16 の S(p, N),E(p, N) においては,p の増加によ 1000 N= 400, WE-FDTD calculation time T(p,N) [s] N=1200, WE-FDTD N= 400, FDTD 100 N=1200, FDTD 10 1 1 10 number of PCs 100 図 2.14 FDTD および WE-FDTD 並列計算の計算時間 T (p, N ) 38 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 80 N= 400, WE-FDTD speed-up ratio S(p,N) 70 N=1200, WE-FDTD 60 N= 400, FDTD N=1200, FDTD 50 ideal 40 30 20 10 0 0 10 20 30 40 50 number of PCs 60 70 80 図 2.15 FDTD および WE-FDTD 並列計算の速度向上比 S(p, N ) 1.0 parallel efficiency E(p,N) 0.8 0.6 0.4 N= 400, WE-FDTD N=1200, WE-FDTD N= 400, FDTD 0.2 N=1200, FDTD 0.0 0 10 20 30 40 50 number of PCs 60 70 80 図 2.16 FDTD および WE-FDTD 並列計算の並列効率 E(p, N ) り,また N が小さくなるにつれ低下している.これは,式 (2.28),(2.29) に示す FDTD および WE-FDTD 法の全計算に占める通信量の比 CRF (p, N),CRW (p, N) から,また図 2.17 の通信比 C(p, N) に示すように,N が小さく,p が大きくなるほど通信比が増大するためである.このこと から,並列効果を上げるには,全体の計算に占める通信比を小さくすればよいので,解析領域 N を 大きく,使用台数 p を小さくすればよい. 39 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 1.0 N= 400, WE-FDTD communication ratio C(p,N) N=1200, WE-FDTD 0.8 N= 400, FDTD N=1200, FDTD 0.6 0.4 0.2 0.0 0 10 20 30 40 50 number of PCs 60 70 80 図 2.17 FDTD および WE-FDTD 並列計算の通信比 C(p, N ) 表 2.3 FDTD および WE-FDTD 法の計算コストの比較 (N = 1200, p = 80) method time [s] memory FDTD 907.02 6N 2 WE-FDTD 722.51 3N 2 Parallel FDTD 16.49 6N 2 /p Parallel WE-FDTD 13.83 3N 2 /p 1 OF (p, N) − OF (1, N) 3N OF (p, N) 1 + 4p 2 (2.28) 1 OW (p, N) − OW (1, N) OW (p, N) 1 + 4pN2 (2.29) CRF = CRW = 表 2.3 に FDTD 法と WE-FDTD 法による並列計算の計算コストを示す.表 2.3 の計算時間は, 解析領域 1200 × 1200 を 1000 ステップ実行したときの計算時間(10 回測定の平均値)である. FDTD 法と WE-FDTD 法を比較すると,計算時間は約 20% 程度 WE-FDTD 法が高速である. また,使用メモリついては,FDTD 法は Ez ,Hx ,Hy を n∆t,(n − 1)∆t で(前後の時間分)保 持する必要があるので,6N 2 個の配列が必要であり,WE-FDTD 法は Ez を n∆t,(n − 1)∆t, 40 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 (n − 2)∆t だけ保持する必要があるので,3N 2 個の配列を必要とする.なお,この使用メモリは理 論上の数値であるが,配列使用の工夫により,FDTD 法では 3N 2 個,WE-FDTD 法では 2N 2 個 の配列が必要であり,WE-FDTD 法は FDTD 法に比べ使用メモリは 2/3 でよい. 以上まとめると,今回の計算環境においては,1200 × 1200 の解析領域を 80 台の計算機によ り計算した場合には,FDTD 法では速度向上比 S(p, N) は 55.0, 並列効率 E(p, N) は 68.8%, WE-FDTD 法では速度向上比 S(p, N) は 52.2, 並列効率 E(p, N) は 65.3% が得られた.使用台 数 p が一定の場合には,解析領域 N が大きいほど並列効率が高くなる. 2.2.4 並列計算の評価および検証 2.2.4.1 FDTD 並列計算特性の評価および検証 ここで,式 (2.9) で示した計算時間 TF (p, N) の理論式と実測値の比較を行い,並列計算の計算時 間の検証を行う.式 (2.9) の各パラメータのうち,nE , nH , nC については,FDTD の差分方程式 の式 (2.4)∼(2.7) と並列計算の計算量の式 (2.8) より nE = 36,nH = 12,nC = 256 とした.計算 機の浮動小数点演算性能 F は,109 回の浮動小数点演算の計算時間の測定結果から F = 69.10 M Flops,バンド幅 B は,ネットワーク性能測定アプリケーションの netperf [116] による測定結果よ り B = 94.13 Mbit/s とした.通信遅延時間 Tdelay は,Tdelay = RT T /2 + Latency で表されるの で,RTT (Round Trip Time) を Linux コマンドの ping により,Latency は netperf を用いて測定 した.測定結果は,Latency が 1.160 µs,RT T /2 は N=400,1200 のときそれぞれ RT T /2=0.640 ms,1.189 ms であった.これより Tdelay は N = 400,1200 のとき,それぞれ Tdelay =0.641 ms, 1.190 ms とした. 図 2.18 に N = 400,1200 における計算時間の理論値と実測値の比較を示す.図 2.18 より式 (2.9) の理論式は実測値とよく一致しており,並列計算は理論どおりに行われていることが確認で きる.また,速度向上比 S(p, N) の理論値と実測値の比較を図 2.19 に示す.図 2.18,2.19 の結果 より,式 (2.9) を用いて並列計算の計算時間を正確に求めることができるので,事前に並列計算の 効果を精度よく推定することができる.図 2.20 に N=2500,5000 とした場合の速度向上比の予測 値を示す.解析領域を大きく取った場合の効果が図 2.20 により予測でき,N = 5000 では,p = 80 41 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 1.000 exp. N=400 calculation time T(p,N)[s/step] calc. N=400 exp. N=1200 calc. N=1200 0.100 0.010 0.001 1 10 number of PCs 100 図 2.18 FDTD 並列計算における計算時間の理論値と測定値の比較 80 exp. N=400 calc. N=400 exp. N=1200 calc. N=1200 ideal speed-up ratio S(p,N) 70 60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 80 number of PCs 図 2.19 FDTD 並列計算における速度向上比の理論値と測定値の比較 の場合に S(p, N) が約 72 であることが推測される. 図 2.11 のような複数のネットワークに接続された PC クラスタどうしをクラスタするスーパー クラスタでは,多数のネットワークスイッチを経由するため,通信遅延の影響が出るものと予測さ れる.表 2.4 に複数のネットワークスイッチを経由する場合の通信遅延の測定結果を示す.表 2.4 は,ネットワークスイッチ経由数を 1,3,4 台とした場合について,通信遅延 RTT を ping を用い 42 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 80 N=1200 N=2500 N=5000 ideal speed-up ratio S(p,N) 70 60 50 40 30 20 10 0 0 10 20 30 40 50 number of PCs 60 70 80 図 2.20 FDTD 並列計算における速度向上比の推定値 表 2.4 複数のネットワークスイッチを経由する場合の通信遅延時間 # of network switches RTT [ms] 3200 [byte] (N =400) 9600 [byte] (N =1200) 1 1.076 2.174 3 1.223 2.137 4 1.280 2.378 て 100 回測定した平均時間である.ここで,ping で送受信する通信量は,FDTD 並列計算で実際 にデータ送受信を行う通信サイズ 3200 byte (N=400),9600 byte (N=1200) とした.表 2.4 の結 果より,ネットワークスイッチを多数通過するほど遅延時間は大きくなっているが,1 台と 4 台の 遅延時間の差は,N=400,1200 とも 0.2 ms であり,遅延時間に対するネットワークスイッチ経由 で生じる遅延時間の差の割合は,N=400 で 15.6%,N=1200 で 5.3% となり,通信サイズが大きい ほど多数のスイッチを経由する場合の遅延時間の影響が少なくなっていることが分かる.以上の結 果から,スーパークラスタを用いた FDTD 並列計算では,スイッチを多数経由する通信遅延の影 響が通信サイズが小さい場合,すなわち,解析領域が小さいほど大きくなり,大規模な問題ほど並 列計算の効率が向上する. 43 2.2 教育用計算機を用いた大規模 PC クラスタシステムによる FDTD 並列計算 2.2.4.2 WE-FDTD 並列計算特性の評価および検証 FDTD 法の場合と同様に,式 (2.22) で示した WE-FDTD 並列計算の計算時間 TW (p, N) の理 論式と実測値の比較を行い,並列計算の計算時間の妥当性を検討する.式 (2.22) の各パラメータ は,nE = 37, nC = 256,計算機の浮動小数点演算数性能 F は F = 69.10 M Flops,バンド幅 B は B = 94.13 Mbit/s,通信遅延時間 Tdelay は N = 400 の場合 Tdelay = 0.641 ms,N = 1200 の 場合 Tdelay = 1.190 ms とした. 図 2.21 に N = 400,N = 1200 における計算時間 TW (p, N) の理論値と実測値の比較を示す. 図 2.21 より TW (p, N) の理論式は実測値とよく一致しており,並列計算は理論どおりに行われて いることが確認できる.また,速度向上比 S(p, N) の理論値と実測値の比較を図 2.22 に示す.図 2.22 の結果より,式 (2.22) を用いて並列計算の計算時間を正確に求めることができるので,事前に 並列計算の効果を精度よく推定することができる.図 2.23 に N=2500 (約 250 Mbyte),5000 (約 1000 Mbyte) とした場合の WE-FDTD 法の速度向上比の予測値を示す.使用した計算機のメモリ は 128 Mbyte であるので,1 台では N=1500 以上の計算はできないが,実際にメモリを増設した 場合の並列効果が図 2.23 により予測でき,N = 5000,p = 80 の場合には,速度向上比 S(p, N) が 約 72 であることが推定される. 1.000 exp. N=400 calculation time T(p,N)[s/step] calc. N=400 exp. N=1200 calc. N=1200 0.100 0.010 0.001 1 10 number of PCs 100 図 2.21 WE-FDTD 並列計算における計算時間の理論値と測定値の比較 44 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 80 exp. N=400 calc. N=400 speed-up ratio S(p,N) 70 exp. N=1200 calc. N=1200 ideal 60 50 40 30 20 10 0 0 10 20 30 40 50 number of PCs 60 70 80 図 2.22 WE-FDTD 並列計算における速度向上比の理論値と測定値の比較 80 N=1200 N=2500 N=5000 ideal speed-up ratio S(p,N) 70 60 50 40 30 20 10 0 0 10 20 30 40 50 number of PCs 60 70 図 2.23 WE-FDTD 並列計算における速度向上比の推定値 80 45 2.3 UWB パルスの室内電波伝搬特性解析への応用 2.3 UWB パルスの室内電波伝搬特性解析への応用 2.3.1 解析モデル PC クラスタによる FDTD 並列計算では,計算機 1 台の搭載メモリ以上の解析領域を扱えるの で,大規模解析の例として,図 2.24 に示す校内廊下 (L = 30.0 m × W = 2.7 m) における UWB パルスの電波伝搬時間応答を解析した.表 2.5 に解析パラメータを示す.図 2.24 の解析モデルに おいて,壁を厚さ 0.1m のコンクリートとし,コンクリートの比誘電率 εrc を εrc = 4.0 − j0.2 とし た.扉と壁中の鉄筋を完全導体(PEC: perfectly electrically conductor),室内は自由空間とし,最 右端に Mur の吸収境界条件を用いた.また,人体のモデルとして,波源 Tr から 5m の位置に比誘 電率 εrh = 30.0 − j1.5 の楕円柱 (1.0m × 0.3m) A,B を 2 体,A,B から 10m 離れた位置に C を 設定した.波源 Tr を扉から 1m の位置に設定し,図 2.25 のような半値幅 0.16 ns のガウシアンパ ルスを電流源とした.ここで,ガウシアンパルスの最大周波数 fmax を– 10 dB の周波数で定義す れば,図 2.25 (b) より fmax = 5.29 GHz となる.解析領域を波長で表せば,530λ × 48λ である. FDTD 並列計算におけるセルサイズ ∆s は,最大周波数 fmax = 5.29 GHz と比誘電率 εr = 30.0 の人体モデルにおいて λg /10 となるように ∆s = 1 mm とし,時間ステップ ∆t は CFL 安定条件 から ∆t = 0.02 ns とした.これより,図 2.24 の解析モデルの解析には,30000 × 2700 個の配列を 使用し,総メモリ約 4 Gbyte を要することになる.使用する計算機の台数 p は並列計算の効率を考 慮し,計算機 1 台の搭載メモリに近い分配になるように 40 台とし,計算機 1 台あたり 750 × 2700 個(約 100 Mbyte)を割当てた. A Tr B y z C PEC Concrete W=2.7m=48 λ Human body x L = 30.0m = 530 λ 図 2.24 FDTD 並列計算による室内 UWB パルス伝搬の解析モデル 46 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 表 2.5 室内 UWB 伝搬解析における解析パラメータ analysis region L = 30.0 m, W = 2.7 m concrete εrc = 4.0 − j0.2 human body elliptical cylinder (1.0m × 0.3 m) , εrh = 30.0 − j1.5 UWB pulse τ = 0.16 ns (fmax =5.3 GHz, λ0 =0.06 m) space increment ∆s ∆s = 0.001 m (∆s = λ0 /57 = λg /10) time increment ∆t ∆t = 0.02 ns total cells 30000 × 2700 required memory 3.89 Gbyte number of PCs 40 memory per a PC 97.2 Mbyte 1.0 0 -10 -20 0.6 power [dB] amplitude [a.u.] 0.8 0.4 -30 -40 0.2 -50 0.0 -60 0 0.2 0.4 0.6 0.8 1 time [ns] (a) 0 5 10 15 frequency [GHz] (b) 図 2.25 UWB パルス伝搬で用いる送信波形 (a) 時間波形 (b) スペクトル 2.3.2 FDTD 並列計算による室内 UWB パルス伝搬解析 図 2.26,2.27 に UWB パルス送信後 20 ns,60 ns 後の解析領域内の電界分布 |Ez | を示す.図 2.26 は人体が存在しない場合,図 2.27 は人体が存在する場合の電界分布 |Ez | であり,各計算機が もつ電界 Ez の計算結果を 1 台の計算機に集めて出力したものである.これより,複数台の計算機 メモリを使用する FDTD 並列計算を用いることにより,波長より大きな任意形状散乱体の時間応 答を解析することが可能になる.図 2.27 (b) より,人体が存在する場合には電界分布 |Ez | が複雑 に乱されることが確認できる. 47 2.3 UWB パルスの室内電波伝搬特性解析への応用 (a) (b) 図 2.26 FDTD 並列計算による室内廊下における UWB パルスの伝搬解析 (|Ez | の空間分布,人体な し) (a) 20 ns 後 (b) 60 ns 後 (a) (b) 図 2.27 FDTD 並列計算による室内廊下における UWB パルスの伝搬解析 (|Ez | の空間分布,人体あ り) (a) 20 ns 後 (b) 60 ns 後 48 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 0.20 with human body without human body 0.15 electric field Ez [V/m] 0.10 0.05 0.00 -0.05 -0.10 -0.15 -0.20 10 20 30 40 time [ns] 50 60 70 図 2.28 FDTD 並列計算による受信点(送信点)における電界 Ez の時間応答 図 2.28 に受信点(送信点)における電界 Ez の時間応答を示す.図 2.28 から,人体の存在によっ て電界の時間応答は変化し,UWB を用いた通信システムの設計においては人体の存在や室内環境 を考慮する必要があることが分かる. 2.3.3 計算コストの評価 表 2.6 に FDTD と FDTD 並列計算の計算時間と使用メモリの比較結果を示す.FDTD 法では, 搭載メモリ以上の 4 Gbyte の領域の解析は困難であるので,計算時間は式 (2.9) により,解析領域 750 × 2700 の計算時間と使用台数 40 台における速度向上比の積から算出した.この結果,計算機 を 40 台使用することにより,計算時間は 1/36.4,使用メモリは 1/39.9 に削減することができる. 以上のように,計算機 1 台の FDTD 法では波長に比べ大きな領域の解析は困難であったが,現有 の余剰教育用計算機を利用したスーパークラスタを用いた並列計算により低コストで解析可能にな 表 2.6 FDTD 並列計算による大規模計算における計算コストの削減 FDTD Parallel FDTD calculation time [s/step] memory [Gbyte] 290.47 3.89 7.98 0.097 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 49 ることを示した. 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 2.4.1 グリッド用に最適化した CD ブート Linux の開発 仙台電波高専では,さらに複数台の計算機を所有しており,これらを並列計算に使用することを 考える.このような遊休計算機を利用する技術はグリッド [81] [108] と呼ばれ,近年急速に利用さ れ始めている.グリッドでは,複数のネットワーク上にある複数台の異機種計算機を使用するた め,使用する計算機の OS も異なる場合が多く,OS に依存しないプログラムを書く必要がある. OS に依存しないプログラミング言語として, 例えば,Java があるが,並列計算アプリケーション の多くは,Fortran や C 言語で書かれており,これらを Java に書き直すのは時間のかかる問題で ある.さらに,各計算機は,並列計算が行われている間起動しネットワークに接続されているので, 使用する各計算機のセキュリティも考慮する必要があるが,計算機 1 台ごとにセキュリティを確認 し,改善するのは困難である. 以上のような問題を解決するために,本研究では,CD ブート Linux により起動した夜間や休日 に使用されていない遊休計算機群を用いてキャンパスグリッドを構築する.CD で起動する計算機 を用いることにより,(1) 使用する計算ホストすべてを同じ OS や計算環境に統一できる,(2) 最新 のパッケージの使用や並列計算に必要なポートのみを開ける等の設定をあらかじめ行うことにより グリッド内のセキュリティを統一的に高めることができる,(3) CD で起動するため使用する計算機 のハードディスクを保護できる,(4) グリッド構築コストを削減することができる等の利点がある. CD ブート Linux とは,CD のみで起動する Linux のことであり,ハードディスクに Linux OS をインストールする必要がなく手軽に Linux を扱えることから近年急速に用いられている [114]. 特に,Klaus Knopper により開発された Debian ベースである KNOPPIX は,cloop という圧縮 ループバックファイルシステムを採用し,ハードウェアの自動認識機能に優れていることや,改変 や再配布が自由な GPL (GNU General Public License) であり,ユーザがそれぞれの用途にあわせ た再構成が容易であることから,様々な用途の KNOPPIX が作成されている [111]. 本研究のような並列計算用の CD ブート Linux として,BCCD (Bootable Cluster CD) [112] や 50 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 ClusterKNOPPIX [113] 等がある [114].BCCD は,LNX-BBC をベースにした教育用の PC ク ラスタを構築するものであり,MPI や PVM 等の並列計算用のパッケージの他に 1400 のアプリ ケーションを収録している.BCCD では,教育目的であるため PC クラスタの計算ホストとして 必要のない様々なアプリケーションを扱うことから,CD 作成の際に容量が大きくなることや,多 くのポートを開けるため実際並列計算で用いるにはセキュリティの問題がある等の欠点がある. ClusterKNOPPIX は,KNOPPIX と OpenMosix をベースに作成されており,OpenMosix により MPI 等を用いて並列計算用にプログラムを書き直す必要がない利点があるが,複数のスレッドを生 成するため並列計算の効果が出ない場合がある. 以上のように,既存の並列計算用の CD ブート Linux は,計算ホストとしての機能だけに限定し ておらず,また,構築した PC クラスタの並列計算性能やセキュリティ評価が十分に行われていな い.そこで本研究では,KNOPPIX 3.3 と Red Hat Linux 9 をベースにグリッドの計算ホストに特 化した CD ブート Linux を開発および作成と,その評価を行う. 2.4.2 キャンパスグリッドの構築とその評価 構築するキャンパスグリッドの概要を図 2.29 に示す.PC クラスタやグリッド等のクラスタ型 並列計算機において並列計算環境を構築するためには,NIS,NFS,SSH のネットワークサービ スの他に,並列計算で計算機間の通信を行う MPI 等のメッセージ通信ライブラリが必要となる. 図 1 のサーバにおいて,NIS や NFS のサービスを起動し,SSH によりサーバと各計算ホスト間で セキュアな通信を行う.また,サーバにはフリーの MPI の実装である mpich-1.2.5.2 [107] と,フ リーのクラスタ管理ツールの C3 をインストールした.計算ホストでは,NIS,NFS,SSH のみ起 動し,セキュリティや使用メモリ削減の観点から X11 や wnn 等の不要なサービスは停止する. 表 2.7 に nmap を用いて評価したポート開閉数を示す.KNOPPIX 3.3 では,デスクトップ用 であるため初期設定として wnn や X11 が起動している.また,DHCP も起動しており,ネット ワーク内に DHCP サーバがあれば起動後に自動的にネットワーク接続される.KNOPPIX 3.3 を ベースに作成した CD Linux では,X11 や wnn 等の不要なサービスは停止し,並列計算で必要な SSH を起動し,NIS や NFS で使用する rpc も起動している.ここで,DHCP が起動しているの 51 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 network 1 grid server client 1 network 2 client 2 network n client 3 client m 図 2.29 CD ブート Linux を用いたキャンパスグリッドの構築 表 2.7 作成したグリッド用 CD Linux と各 OS のポート開閉・起動サービスの比較 OS KNOPPIX 3.3 port No. 68/tcp 111/tcp our KNOPPIX Red Hat Linux 9 dhcpclient sunrpc 6000/tcp X11 22273/tcp wnn 32772/tcp sometimes-rpc7 32774/tcp sometimes-rpc11 68/tcp dhcplient 111/tcp sunrpc 221/tcp sshd 32772/tcp sometimes-rpc7 32774/tcp sometimes-rpc11 22/tcp 111/tcp 6000/tcp 32768/tcp our Red Hat Linux services 22/tcp 111/tcp ssh sunrpc X11 unknown ssh sunrpc は,DHCP サーバを利用したローカルネットワークにおける PC クラスタ構築も行えるようするた めである.Red Hat Linux 9 をベースに作成した CD Linux では,不要な X11 と unknown ポート を閉じ,必要最小限のサービスのみを起動している. 表 2.8 に free コマンドを用いて評価したメモリ使用量を示す.KNOPPIX 3.3 や Red Hat Linux 9 では,起動時に様々なサービスが起動するため,メモリ使用量はそれぞれ 296 Mbyte,194 Mbyte となっている.CD ブート Linux ではハードディスクを使用しないため,すべてメモリ上で展開さ 52 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 表 2.8 作成したグリッド用 CD Linux と各 OS における使用メモリ OS memory [Mbyte] KNOPPIX 3.3 296 our KNOPPIX 88 Red Hat Linux 9 194 our Red Hat Linux 56 表 2.9 作成したグリッド用 CD Linux と各 OS のセキュリティホール OS security holes KNOPPIX 3.3 0 our KNOPPIX 0 Red Hat Linux 9 1 our Red Hat Linux 0 Vine Linux 2.6r4 1 turbolinux 7 2 れる.このことから,OS の他に並列計算のアプリケーションを起動させることも考えれば,使用 メモリは最小限にとどめる必要がある.今回作成した KNOPPIX 3.3 や Red Hat Linux 9 をベー スにした CD Linux では,いずれも 88 Mbyte,56 Mbyte と使用メモリを 100 Mbyte 以下に削減 することができ,128 Mbyte 以上のメモリを搭載した計算機で起動することができる. 表 2.9 にセキュリティ探索ソフトである Nessus を用いて評価したセキュリティ [115] について示 す.表 2.9 の結果より,KNOPPIX 3.3 では比較的新しいソフトウェアが収録されているためにセ キュリティホールは 0 であった.同様に,KNOPPIX 3.3 をベースに作成した CD Linux において もセキュリティホールは 0 であった.Red Hat Linux 9 では,セキュリティホールが 1 個見つかっ たが,作成した開発・作成した Red Hat Linux 9 をベースの CD Linux では,最新のパッケージ を利用することにより,セキュリティホールを削減することができる. 参考のために,仙台電波高専校内で多く利用されている Vine Linux 2.6r4 と turbolinux 7 につ いてセキュリティの評価を行った.Vine Linux 2.6r4 は最新版であるが,セキュリティホールが 1 個発見され,turbolinux 7 については,セキュリティホールが 2 個発見された.このことから,計 算ホストとして周囲の計算機をそのまま利用する方法では,セキュリティホールがあるまま利用す 53 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 表 2.10 CD ブート Linux により構築された並列計算環境における並列計算性能 N calculation time of FDTD parallel computation [s] HD boot our KNOPPIX our Red Hat 500 39.59 11.57 35.61 10.19 35.68 10.94 1000 158.72 42.10 143.85 39.15 143.71 39.09 ることになるため,計算データや計算機内のデータ保護に問題がある.本研究で作成した CD ブー ト Linux では,セキュリティホールを 0 に削減し,またハードディスクもマウントしないため,よ り安全に並列計算の計算ホストとして計算機を使用することができる. 表 2.10 に作成した CD ブート Linux を用いた並列計算環境における計算性能の結果を示す.表 2.10 は,解析領域 N × N における FDTD 並列計算の計算時間であり [45],Vine Linux 2.5 がイ ンストールされた計算機で起動した(ハードディスク起動)場合と,作成した CD で起動した場 合の計算時間の比較である.表 2.10 より,CD で起動した方がハードディスクで起動した場合よ りも計算時間は約 10% 程度短縮されている.これはハードディスクとメモリのデータ転送速度の 差によるものと思われる.ハードディスクが使用している IDE インターフェイスでは転送速度は 100 Mbyte/s,今回使用した PC2100 の転送速度は 2133 Mbyte/s であり,メモリ上で動作する CD ブート Linux ではデータ転送が高速になる. 以上の結果より,使用メモリを低減し,セキュリティホールは 0 個,並列計算における計算速度 も高速であることから,本研究で作成した CD ブート Linux を用いた並列計算環境は,十分に実用 的であることを示した. 2.4.3 領域分割法を適用した負荷分散 一般に,PC・WS クラスタでは,使用する複数台の計算機は同機種であり,同一ネットワーク 内にある場合がほとんどである.しかしながら,異なるネットワーク内にある異機種の計算機を複 数台使用するグリッドでは,各計算機の計算性能とネットワーク性能が同一でないため,効率的な 計算を行うには,計算性能やおよびネットワーク性能差に応じた負荷分散を行う必要がある [110]. FDTD 法の並列計算においても,例えば,図 2.30 に示すように計算性能や通信性能の高い計算機 には多くの計算領域を割当て,性能の低い計算機には計算領域を少なく割当てることが必要にな 54 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 analysis region y z x PC1 PC2 PC3 PC4 図 2.30 領域分割法による FDTD 並列計算の負荷分散 る.このような性能に応じた負荷分散を行う場合,計算性能やネットワーク性能を事前に測定して 割当てる計算領域を決めることも可能であるが,グリッドのように複数のネットワークにまたが り,また,使用台数も多くなると使用するすべての計算機の性能を測定することは現実的ではなく, 自動で負荷分散を行う方法が効率的である.本研究では,各計算機への領域分割比を変え,FDTD 並列計算の時間 1 ステップの実行を n 回くり返し,最小計算時間となる分割比から出現確率の最も 高い分割比を出力する方法を提案する. 図 2.31 に領域分割法によるアルゴリズムを示す.例えば,3 種類の計算機で構成されるグリッド を例に説明する.ここで,各計算機の名前を fast,mean,slow とする.各計算機に解析領域を割 当てる分割比 rf,rm,rs を 1 から順に変化させていき,解析領域がすべての計算機に割当てられ る場合,すなわち,Nx mod (rf+rm+rs)=0 のときのみ FDTD 並列計算が実行される.各計算機は ホスト名で区別され,各計算機の計算開始点 sp および解析領域 N が各計算機ごとに決まり,各解 析領域で FDTD 並列計算の時間 1 ステップを行い,計算時間が最小になる領域分割比を出力する. グリッドでは,多くのネットワークを使用することから,ネットワーク内のトラフィックは常に一 定であるとは限らないため,これを n 回くり返し,最も出現確率の高い分割比を最適負荷分散の分 割比とする. 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 for i:=1 to n do for rs:=1 to Rs do for rm:=1 to Rm do for rf:=1 to Rf do begin if (Nx mod (rs+rm+rf)=0) then begin if PC_name=slow then begin sp:=0; Ns:=Nx/rs; N:=Ns; end; if PC_name=mean then begin sp:=Ns; Nm:=Nx/rm; N:=Nm; end; if PC_name=fast then begin sp:=Ns+Nm; Nf:=Nx/rf; N:=Nf; end; ts:=gettime(); for i:=sp to N do for j:=1 to Ny do begin E_calc(); Ez_exchange(); E_update(); H_calc(); Hy_exchange(); H_update(); end; calc_time:=gettime()-ts; if min_time>calc_time then begin out[i][1]:=rs; out[i][2]:=rm; out[i][3]:=rf; out[i][4]:=calc_time; end; end; end; for i:=1 to n do for j:=1 to n do if ( out[i][1]=out[j][1] and out[i][2]=out[j][2] and out[i][3]=out[j][3] ) then out[i][5]:= out[i][5]+1; for i:=1 to n do if out[i][5]>max then begin max:=out[i][5]; im:=i; end; write(out[im][1], out[im][2], out[im][3]); 図 2.31 領域分割法による FDTD 並列計算の最適負荷分散アルゴリズム 55 56 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 analysis region p1 p2 p3 p4 p5 p1 p2 p3 p4 p1 p2 p3 p1 p2 p3 p4 y z x PC1 PC2 PC3 PC4 図 2.32 マルチプロセス法による領域分割 2.4.4 マルチプロセス法を適用した負荷分散 負荷分散の方法として,図 2.30 のように各計算機毎に解析領域の割当量を変える方法があるが, この方法では負荷分散の割当比を出力するのに時間がかかることや,グリッドの構成が変わる毎に プログラムを書き換える必要がある等の問題がある.この問題を解決するために,本研究では,図 2.32 に示すように計算機の性能毎に複数のプロセスを起動し実行することで各計算機毎に解析領域 の割当てを行うマルチプロセス法を提案する.各計算機の計算性能を取得する方法として,Linux の起動プロセスにある Bogomips を参考に計算機起動時に各計算機で FDTD 計算を行い,その計 算時間を測定し各計算機に保存する手法を用いる.提案するマルチプロセス法による FDTD 並列 計算の負荷分散アルゴリズムを図 2.33 に示す.手順は,(0) 計算機起動時に FDTD 計算時間 ti を ,(1) 各計算機から (1) の計算時間 ti を収集する,(2) 自動測定する(/proc/fdtdinfo として保存) (1) の計算時間 ti ,解析領域の大きさ N ,使用計算機台数 n,起動総プロセス数(解析領域の総分 割数) m から各計算機毎の起動プロセス数(領域割当比) npi を式 (2.30) より求める. npi = m · ti n (2.30) ti i=1 ここで,起動総プロセス数 m は,計算機 1 台あたりの起動プロセス数 np が 5 以下になるように m ≤ 5n とする.これは,図 2.34 に示すように計算機 1 台あたりで起動するプロセス数 np が多い 場合には計算機内でオーバーヘッドが生じ,解析領域が小さい場合に計算性能が低下するのを防ぐ ためである. 57 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 1 2 3 4 5 6 7 8 9 10 11 12 13 for i=1 to n do begin ti := get_fdtdtime(); ti_sum := ti_sum + ti; end; for i := 1 to n do begin npi := m * ti / ti_sum; npi_sum := npi_sum + npi; if( npi <= 5 and ( sum_npi mod N = 0) ) then write(ti); end; 図 2.33 マルチプロセス法による FDTD 並列計算の負荷分散アルゴリズム 1.00 normalized calculation time [a.u.] 0.98 0.96 np = 2 0.94 np = 5 0.92 np = 10 0.90 0.88 0.86 0.84 0.82 0.80 0 200 400 600 800 1000 analysis size N 図 2.34 プロセス数増加による計算性能低下 2.4.5 負荷分散法の評価および検証 2.4.5.1 領域分割法による負荷分散の評価および検証 図 2.35 に領域分割法による負荷分散を評価するために構築したキャンパスグリッドの構成を示 す.図 2.35 (a) は,3 つのネットワークにある 3 種類の計算機を 4 台ずつ P1 ∼P12 の計 12 台を用 いて構成したグリッド 1 である.図 2.35 (b) は,5 つのネットワーク内のすべて機種の異なる計算 機計 8 台を用いて構成したグリッド 2 である.なお,NIS や NFS のサービスを行うグリッドサー バは,グリッド 1 およびグリッド 2 ともにネットワーク 1 内にある.表 2.11 にグリッド 1 および 58 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 network 1 network 2 P1 P2 P3 P4 P5 P6 P7 P8 network 3 P9 P10 P11 P12 (a) network 1 P1 P2 P3 network 2 network 3 P4 P5 P6 network 4 P7 network 5 P8 (b) 図 2.35 領域分割法による負荷分散を評価するためのキャンパスグリッド環境 (a) グリッド 1 (b) グリッド 2 表 2.11 キャンパスグリッドを構成する計算機の仕様 (a) グリッド 1 (b) グリッド 2 (a) PC CPU [Hz] P1 , P2 , P3 , P4 Celeron 900M P5 , P6 , P7 , P8 Duron 1.3G P9 , P10 , P11 , P12 Pentium 4 1.8G cache [Kbyte] memory [Mbyte] 128 128 64 128 512 512 (b) PC CPU [Hz] cache [Kbyte] memory [Mbyte] P1 Pentium 4 2.4G 512 512 P2 Duron 1.3G 64 128 P3 Celeron 1.0G 128 256 P4 Celeron 2.0G 128 256 P5 Pentium III 900M 512 512 P6 Pentium III 1.1G 512 512 P7 Pentium 4 1.8G 512 512 P8 Celeron 900M 128 128 2 を構成する各計算機のハードウェアの仕様を示す.また,並列計算において計算機間の通信を行 うライブラリとして,フリーの MPI (Message Passing Interface) の実装である mpich-1.2.5 [107] を用いた. 59 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 表 2.12 グリッドにおける FDTD 並列計算の計算条件 case analysis size N × N grid a grid 1 600 × 600 b grid 1 1200 × 1200 c grid 2 600 × 600 d grid 2 1200 × 1200 表 2.13 領域分割法による最適負荷分散パラメータ(領域分割比)の出力結果 case P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 a 2 2 2 2 4 5 5 4 6 6 6 6 b 1 1 1 1 2 2 2 2 3 3 3 3 c 5 2 1 2 2 1 5 2 - - - - d 5 3 1 5 2 2 5 2 - - - - 図 2.35 および表 2.11 のグリッド 1 および 2 において,表 2.12 に示す case a,b,c,d を考え, FDTD 並列計算の最適負荷分散パラメータ(領域分割比)を求める.さらにこのパラメータによる 負荷分散の評価および検証を行う.FDTD 並列計算を行う解析領域は N × N の自由空間とする. case a は図 2.35 (a) のグリッド 1 で N = 600,case b はグリッド 1 で N = 1200,case c は図 2.35 (b) のグリッド 2 で N = 600,case d はグリッド 2 で N = 1200 とする.これら case a,b,c,d において,図 2.31 のアルゴリズムを用いて FDTD 並列計算の最適負荷分散を行った結果を表 2.13 に示す.表 2.13 は出力された最適負荷分散の領域分割比である.表 2.13 より,case a および b の 3 種類の同機種計算機を 4 台ずつ使用するグリッド 1 においては,case b ではネットワーク内の同 機種計算機に均等な分割比が割当てられているが,case a では case b と比べると,ネットワーク 2 内の計算機の P5 および P8 で同一ネットワーク内の他の計算機とは異なる分割比となっている.す べて異機種の計算機を用いた case c,d では,複雑な分割比になっている. ここで,表 2.13 に示した最適負荷分散の領域分割比ついての評価を行う.表 2.14 に表 2.13 で得 られた最適負荷分散の分割比で負荷分散をした場合と,負荷分散を行わない,すなわち,すべて同 一の割合で分割した場合の FDTD 並列計算の時間 1000 ステップの計算時間を示す.表 2.14 より, いずれの場合においても計算時間の短縮がはかられており,計算時間の短縮率は,case a は 38.6%, case b は 45.2%,case c は 29.2%,case d は 46.5% であり,解析領域が大きくなるほど効果が大き 60 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 表 2.14 最適負荷分散パラメータを適用した FDTD 並列計算の計算時間 case calculation time [s] without load balance with optimized load balance a 13.45 8.26 b 47.43 25.97 c 28.65 20.27 d 88.43 47.29 くなることが分かる. 次に,表 2.13 の最適負荷分散の分割比の検証を行う.グリッド 1 およびグリッド 2 を構成する 各計算機の計算性能とネットワーク性能の測定結果を表 2.15 と表 2.16 に示す.表 2.15 の計算性能 は,各計算機における解析領域 600 × 600 の FDTD 法の時間 1000 ステップの計算時間を示し,ま た,FDTD ratio は,計算時間の最も遅い計算機を基準とした場合の FDTD 計算時間の比を意味す る.表 2.16 のネットワーク性能は,解析領域 600 × 600 の FDTD 並列計算で実際に送受信を行う 通信量 4800 byte を Linux コマンドの ping で送信した場合の遅延時間 RTT (Round Trip Time) である.なお,表 2.15,表 2.16 のグリッド 1 の同機種および同一ネットワーク内の計算性能およ びネットワーク性能は,ほぼ等しい値であったため省略している. グリッド 1 においては,表 2.15 (a) より,グリッド 1 を構成する各計算機の計算性能の整数比 は,おおよそ P1 : P5 : P9 = 1 : 2 : 4 であり,ネットワーク性能比は,表 2.16 (a) より,ネット ワーク内とネットワーク間ではおおよそ 1 : 2 であることが分かる.計算性能の整数比より,おお よそ P1 : P5 : P9 = 1 : 2 : 4 で解析領域を分割してもよいことがわかるが,1 : 2 : 4 では,解析領域 すべてを割当てられずに割当られない解析領域が生じるため割当てることはできない.表 2.13 の 最適負荷分散の結果より,case a および b ともに各ネットワーク内の計算機の分割比は,おおよそ 1 : 2 : 3 であることから,妥当な分割比であるといえる.しかしながら,case a では,ネットワー ク間の境界にある P5 および P8 では,同一ネットワークの他の同機種計算機より分割比が小さく なっている.これは,FDTD 並列計算では,解析領域中の計算量に対する通信量の比は,おおよそ 1/N になるため,解析領域が小さいほど通信比が大きくなり,ネットワーク性能の影響が大きくな るためである.case b では,case a よりも解析領域は大きいため,ネットワーク性能の影響は少な 61 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 表 2.15 グリッドを構成する各計算機の計算性能 (a) グリッド 1 (b) グリッド 2 (a) PC CPU [Hz] P1 Celeron 900M P5 P9 calculation time[s] FDTD ratio 134.95 1.0 Duron 1.3G 60.07 2.3 Pentium 4 1.8G 35.21 3.8 calculation time[s] FDTD ratio (b) PC CPU [Hz] P1 Pentium 4 2.4G 33.25 5.0 P2 Duron 1.3G 60.07 2.7 P3 Celeron 1G 164.89 1.0 P4 Celeron 2G 35.47 4.6 P5 Pentium III 450 dual 154.24 1.1 P6 Pentium III 1.1G 122.04 1.4 P7 Pentium 4 1.8G 35.21 4.7 P8 Celeron 900M 134.95 1.2 表 2.16 グリッドのネットワーク性能 (a) グリッド 1 (b) グリッド 2 (a) ping from Pi to Pi+1 RTT [ms] P1 → P2 1.14 P4 → P5 1.73 P5 → P6 1.18 P8 → P9 2.28 P9 → P10 1.13 (b) ping from Pi to Pi+1 RTT [ms] P1 → P2 1.72 P2 → P3 8.52 P3 → P4 8.56 P4 → P5 1.44 P5 → P6 1.84 P6 → P7 2.56 P7 → P8 2.23 62 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 く,各ネットワーク内の計算機の分割比は,おおよそ 1 : 2 : 3 と均等になる. グリッド 2 においては,各計算機の計算性能の整数比は表 2.15 (b) より,おおよそ P1 : P2 : P3 : P4 : P5 : P6 : P7 : P8 = 5 : 3 : 1 : 5 : 1 : 1 : 5 : 1 であり,ネットワーク性能は表 2.16 (b) よ り,P2 → P3 および P3 → P4 間で他のおおよそ 4 倍の遅延が生じている.この遅延の影響によ り,case c において最適負荷分散の分割比は,表 2.13 より P1 : P2 : P3 : P4 : P5 : P6 : P7 : P8 = 5 : 2 : 1 : 2 : 2 : 1 : 5 : 2 になっており,遅延の大きい,すなわち,ネットワーク性能の低いとこ ろでは分割比は小さくなっている.表 2.13 の case d では,ネットワーク性能の影響は小さくなる ので,最適負荷分散の分割比は,P1 : P2 : P3 : P4 : P5 : P6 : P7 : P8 = 5 : 3 : 1 : 5 : 2 : 2 : 5 : 2 であ り,ほぼ計算性能比に近い分割比になっている. 以上の結果から,本論文の最適負荷分散法は,グリッドを構成する各計算機の計算性能および ネットワーク性能を考慮でき,グリッド上の FDTD 並列計算の最適負荷分散として有効であると いえる. 2.4.5.2 マルチプロセス法による負荷分散の評価および検証 図 2.36 に示すネットワーク 1∼8 にある 12 種類の計算機を用いて構築したグリッドにおいて, マルチプロセス法の負荷分散の評価および検証を,領域分割法による負荷分散と比較することで行 う.表 2.17 に図 2.36 のグリッドを構成する各計算機のハードウェア性能を示す.表 2.17 におい て,FDTD ratio は,計算時間の最も遅い計算機を基準とした場合の FDTD 計算時間の比を意味 する.FDTD 法の計算は,600 × 600 の解析領域において中心に電流源がある場合の自由空間電波 伝搬問題である. 表 2.18 に領域分割法とマルチプロセス法により得られた各計算機への領域分割比(プロセス起 campus network network 1 P1 P2 network 2 P3 network 3 P4 P5 network 4 P6 P7 network 5 P8 network 6 P9 P10 network 7 P11 図 2.36 マルチプロセス法による負荷分散を評価するためのキャンパスグリッド環境 network 8 P12 63 2.4 キャンパスグリッドの構築とグリッドにおける FDTD 並列計算の負荷分散 表 2.17 キャンパスグリッドを構成する計算ホストの性能 PC CPU [GHz] FDTD ratio P1 Pentium 4 2.80 5.3 P2 Pentium III 1.13 1.3 P3 Pentium III 1.00 1.3 P4 Pentium 4 2.40 4.6 P5 Celeron 2.60 4.6 P6 Pentium III 0.45 1.0 P7 Sempron 1.50 3.3 P8 Celeron 0.90 1.3 P9 Celeron 2.40 4.3 P10 Pentium 4 1.80 4.1 P11 Celeron 2.00 4.0 P12 Duron 1.60 3.9 表 2.18 負荷分散法による各計算ホストへの解析領域の割当結果 method P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 multi process 4 1 1 4 4 0 3 1 3 3 3 3 region division 4 1 0 4 2 0 2 0 3 3 3 2 FDTD ratio 5.3 1.3 1.3 4.6 4.6 1.0 3.3 1.3 4.3 4.1 4.0 3.9 動数)を示す.表 2.18 の結果は,FDTD 計算時間比とほぼ同一比となっていることが確認できる. ここで,領域分割法により得られた割当比は,ネットワーク境界において FDTD 計算時間比より低 くなっているが,これは領域分割法による負荷分散法ではすべての CPU,メモリ,ネットワーク性 能等すべての構成要素を考慮するため,ネットワーク境界における通信性能差が出ているものと思 われる.しかしながら,領域分割法による負荷分散法は,考えられるすべての割当比で FDTD 法 の時間 1 ステップを実行するため,グリッドの規模や構成が複雑になるほど領域割当比を得る時間 が増大する問題がある.表 2.19 に領域割当比を出力するまでの時間を示す.表 2.19 より,領域分 割法では 153.30 s の時間がかかるが,本研究で提案するマルチプロセス法では計算機起動時に測定 した FDTD 計算時間を使用するため,3.36 s と約 1/50 の時間で領域割当比を得ることができる. 表 2.18 の領域割当比による FDTD 並列計算の負荷分散の検証を行うために,負荷分散を行わな い場合と,表 2.18 の領域割当比により負荷分散を行った場合の FDTD 並列計算の 1000 ステップ 64 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 表 2.19 プロセス割当数を出力するまでの時間 method output time [s] multi process 3.36 region division 153.10 表 2.20 負荷分散を適用した FDTD 並列計算の計算時間 without with shortening load balance [s] load balance [s] rate [%] multi process 13.30 7.31 45.0 region division 13.30 6.56 49.3 method の計算時間を表 2.20 に示す.ここで計算時間は 10 回の試行の平均である.表 2.18 より,いずれ の方法においても負荷分散を行わない場合に比べ,おおよそ 1/2 に計算時間を短縮することができ る.ふたつの方法の結果を比較すると,領域分割法の方が計算時間はより短縮されるが,表 2.18 で 示した領域割当比を出力するまでの時間とグリッドの構成に合わせてプログラムを書き換える必要 があることを考えれば,マルチプロセス法による手法は短時間で領域割当比を得ることができ,ま た従来の PC クラスタ等で用いられる均等割当てのプログラムをそのまま使用できるためグリッド 用にプログラムを書き変える必要がなく,効率的よく負荷分散を行うことができる. 2.5 地中レーダの物体検出シミュレーション 2.5.1 計算環境 本研究で提案した CD ブート Linux によるグリッドを用いて,地雷探査や土壌汚染調査等に広 く用いられている地中レーダの地中物体検出シミュレーション [117] を行う.地中レーダのシミュ レーションでは,FDTD 法がよく用いられるが,計算時間や使用メモリが膨大になる問題があっ た.この問題をグリッドによる FDTD 並列計算により解決し,地中レーダシミュレーションにお いてもグリッドが有効性であることを示す. 図 2.37 および表 2.21 に地中レーダのシミュレーションで用いるキャンパスグリッドの構成を示 す.使用した表 2.21 の計算機は仙台電波高専の教育用計算機であり,Pentium 4 2.8 GHz を 8 台, 65 2.5 地中レーダの物体検出シミュレーション network 1 NIS NFS SSH MPI C3 server network 2 PC 1 network 3 PC 8 PC 9 PC 20 図 2.37 地中レーダのシミュレーションで用いるキャンパスグリッド 表 2.21 グリッドを構成する計算ホストの仕様 PC CPU [GHz] cache [Kbyte] memory [Mbyte] P1 ∼ P8 Pentium4 2.80 512 1024 P9 ∼ P20 Celeron 2.40 8 256 Celeron 2.4 GHz を 12 台 を使用した.これらの計算機の OS は,Windows XP や Vine Linux で あり,ユーザやファイル管理も統一されていないが,CD ブート Linux によりすべてを統一的に扱 うことができる. 2.5.2 ランダムな散乱体を含む不均質媒質の解析モデル 図 2.38 に解析モデルを示す.解析モデルの大きさは 6 m ×6 m の 2 次元モデルとし,地中を 4.0 m,地上を 2.0 m とする.ランダム媒質地中モデルの解析パラメータは表 2.22 示すように,地中 の比誘電率を εrg = 16.0,導電率を σg = 10−4 S/m とし,地上は比誘電率 εr = 1.0,導電率 σ = 0 S/m とする.探査目標として,深さ 1.0 m の位置にある 1.0 m ×1.0 m の空洞 (εr = 1.0,σ = 0 S/m) を設定する.また,地中に大きさ 0.01∼0.1 m,比誘電率 εro = 1.0∼40 の散乱体(石や瓦礫 等)を 1000 個配置する.送信波として,図 2.39 に示す半値幅 1.6 ns のガウシアンパルスを用い た.ここで,このガウシアンパルスの最大周波数 fmax を – 10 dB で定義すれば,図 2.25 (b) より fmax = 529 MHz となる.FDTD 法のセルサイズ ∆s は,最大周波数 fmax = 529 MHz と比誘電 率 εr = 40.0 の散乱体において λg /20 となるように ∆s = 0.005 m とし,∆t は CFL 安定条件から ∆t = 0.01 ns とした.送信アンテナを (1.0, 5.0)∼(5.0, 5.0) の間で 0.05m 間隔で走査し,地上の観 測点における受信電界を FDTD 並列計算により計算した. 66 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 図 2.38 グリッドを用いた地中レーダにおける地中物体とランダムな物体を含む不均質媒質モデル 表 2.22 ランダム媒質地中モデルの解析パラメータ analysis region 6m × 6m ∆s, ∆t ∆s = 0.005 m, ∆t = 0.01 ns εrg , σg εrg = 16.0, σg = 10−4 S/m εog , σo εro = 1.0 − 40.0, σg = 10−4 S/m number of scatterers 1000 scanning range 1.0 ≤ x ≤ 5.0 m, ∆x = 0.05 m time step 5000 1.0 0 0.9 0.8 -10 0.6 power [dB] amplitude [a.u.] 0.7 0.5 0.4 -20 -30 0.3 0.2 -40 0.1 0.0 0 1 2 3 time [ns] (a) 4 5 6 -50 0.0 0.2 0.4 0.6 0.8 frequency [GHz] 1.0 (b) 図 2.39 地中レーダのシミュレーションで用いる送信波形 (a) 時間波形 (b) スペクトル 1.2 67 2.5 地中レーダの物体検出シミュレーション 図 2.40 FDTD 並列計算により計算された各受信点の受信信号による地中物体の可視化 表 2.23 キャンパスグリッドを用いた地中レーダの物体検出シミュレーションにおける計算時間の削減 number of PCs calculation time [h] 1 23.0 20 1.5 2.5.3 可視化に要する計算時間の短縮 図 2.40 に各受信点において観測した電界の時間応答波形を示す.図 2.40 より,地中の空洞付近 で電界が変化しており,地中物体の有無を確認できる. 表 2.23 に解析に要した計算時間を示す.表 2.23 より,計算機 1 台では 23 時間かかっていた計 算が,計算機 20 台を用いたキャンパスグリッドにより計算時間が 1/15.6 に短縮されることがわ かる.計算時間は,キャンパスグリッドの規模を大きくすることでさらに短縮できる.この結果よ り,キャンパスグリッドを用いた FDTD 並列計算を地中レーダのシミュレーションに応用するこ とは計算時間を大幅に短縮にできるため有効な手法である. 68 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 2.6 結言 本章では,FDTD 法の計算コストの問題を解決することを目的に,校内に設置された教育用計 算機群を互いに接続したスーパークラスタによる FDTD 並列計算の詳細な評価および検証と,多 くのメモリを必要とする波長に比べ大きな領域の電波伝搬解析の評価および検討を行った.異なる ネットワーク上にある教育用計算機 80 台を用いた結果,1200 × 1200 の解析領域では,55.0 倍の 速度向上比と並列効率 68.8% が得られた.また,並列計算の計算時間の理論式を導出し,並列計算 の効果をあらかじめ推定できることを示した.さらに,スーパークラスタで問題となる多数のネッ トワークスイッチを経由することにより生じる通信遅延の FDTD 並列計算への影響を調べた.こ の結果,ネットワークスイッチ経由数による影響,すなわち,全遅延時間に対するネットワークス イッチ経由による遅延時間の割合は,4 台のネットワークスイッチを経由する場合には,N = 400 で 15.6 %,N = 1200 で 5.3 % となり,ネットワークスイッチを多数経由する通信遅延の影響が 通信量が小さい場合,すなわち,解析領域が小さいほど大きくなることを示した.大規模解析への 適用の例として,大きさ 530 λ × 48 λ の解析モデルにおける UWB パルスの室内電波伝搬解析を 行い,計算機 1 台ではメモリが約 4 Gbyte 必要となり解析困難な問題を,計算機 40 台を用いるこ とによりメモリは 1/39.9,計算時間は 1/36.4 に削減でき,異なるネットワークに接続された多数 の計算機によるスーパークラスタを用いた並列計算により大規模な問題を低コストで解析できるこ とを示した. また,FDTD 法より低コストな方法として,波動方程式を元にした FDTD 法である WE- FDTD(Wave Equation based FDTD) の並列計算を行った.WE-FDTD 法では,電界あるいは磁 界に関する波動方程式を計算するため計算量あるいは使用メモリの削減でき,また,並列計算の アルゴリズムも簡便になる利点がある.教育用計算機 80 台を用いた WE-FDTD 法の並列計算を 行った結果,FDTD 並列計算に比べ,通信量は同一であるが,時間 1 ステップあたりの浮動小数点 演算数は 1/1.3 程度であり,80 台を使用した並列計算の計算時間は 16% 程度短縮されることが分 かった.使用メモリについては,WE-FDTD 法は FDTD 法に比べ 2/3 にでき,WE-FDTD 法に より計算コストを軽減できることを示した. 2.6 結言 69 さらに多くの計算資源を得るために,複数のネットワークにある異機種計算機を利用するグリッ ドに着目し,グリッドにおける FDTD 並列計算の検討を行った.FDTD 法の計算コストの問題を グリッドを用いて解決することを目的に,(1) グリッド用 CD ブート Linux の開発および作成と CD ブート Linux を用いた遊休計算機群によるキャンパスグリッドの構築,(2) グリッドにおける FDTD 並列計算の負荷分散法について提案した.CD ブート Linux を用いることにより,(1) 周囲 にある計算機を並列計算に使用できるため,(2) より多くの計算資源を得ることができる,(3) グ リッドを構成する各計算機で OS が統一できる,(4) グリッド内のセキュリティを高めることがで きる,(5) 使用する計算機のハードディスクを保護できる,(6) グリッド構築コストの削減ができ る等の利点がある.今回開発・作成したグリッド用 CD ブート Linux は,使用メモリが 56 Mbyte であり,搭載メモリの少ない計算機においても起動できる.また,最新のパッケージの使用と並列 計算に必要なポートのみを起動することにより,セキュリティホールは 0 個に削減でき,セキュリ ティの高いキャンパスグリッドを構築することができる.さらに,通常の形態であるハードディス クに OS 等をインストールした並列計算環境と比較した結果,今回実行した FDTD 並列計算にお いては,約 6∼9% 程度計算時間が短縮されることを示した.グリッドにおいて問題になる負荷分散 について,本研究では,(1) 各計算機への領域分割比を変え,FDTD 並列計算の時間 1 ステップを n 回実行し,出現確率の最も高い最小計算時間となる分割比を出力する領域分割型の方法と,(2) 1 台の計算機に計算機の性能に応じた複数のプロセスを起動することで,領域分割を行うマルチプロ セス法による方法を提案した.この結果,領域分割型の方法では,解析領域が大きいほど負荷分散 の効果は大きく,今回の構築したキャンパスグリッドの構成では,計算時間を約 30∼50% 短縮する ことができた.本手法では,計算性能およびネットワーク性能を考慮できるので,グリッドの負荷 分散法として有効であるといえる.しかしながら,領域分割型の方法では,グリッドの規模が大き く構成が複雑になる場合には負荷分散を行うための領域割当比を出力する時間がかかることや,グ リッドの構成が変わるごとにプログラムを書き換える必要があった.この問題を解決するために, マルチプロセス法による負荷分散を提案し,領域分割型の方法と比較した結果,調べたグリッド構 成において,負荷分散の領域割当比を出力するまでの時間は約 1/50 にまで短縮でき,また負荷分 散の性能も同程度であることを示した.マルチプロセス法は,短時間で負荷分散を行うことができ 70 第2章 PC クラスタを用いた FDTD 並列計算による大規模電波伝搬解析 ることや,グリッド用にプログラムを書き換える必要がないことから,簡易な負荷分散法として有 効であることを示した. 71 第3章 高次 FDTD 法とその並列計算による大規模電波 伝搬解析 3.1 緒言 通常の FDTD 法は,空間および時間の 2 次精度中心差分を用いるため,FDTD(2,2) 法と呼ばれ る.FDTD 法の重要な問題として,FDTD 法では空間を 2 次精度で差分化するため,波長に比べ 大きな領域の問題を解析する場合には数値分散誤差が生じ,伝搬距離が長くなるにつれ誤差が蓄積 され大きくなる問題がある.この問題について,空間に対して 4 次精度で差分化する FDTD(2,4) 法 [52] [53] や,3 種類の 2 次精度 FD Laplacian を用いて誤差補正を行う NS (Non-Standard) FDTD 法 [57] [58] 等が提案されており,FDTD (2,4) 法は広帯域解析に,NS FDTD 法は狭帯域 解析に有効である [64]. FDTD 法を用いた電波伝搬解析の既存研究として,FDTD(2,2) 法と FDTD(2,4) 法のハイブリッ ト法によるのも [53] [59] があるが,解析領域はそれぞれ 22λ0 × 33λ0 [53],22λ0 × 6λ0 × 4λ0 [59] であり,大規模電波伝搬の数値分散誤差および計算コストに関する検討は行われていない.大規 模な領域を解析した例として,100λ0 × 100λ0 の室内空間における電波伝搬特性解析が行われてい る [95] が,FDTD(2,2) 法を用いており数値分散誤差は考慮されていない.また,FDTD 法の並列 計算による電波伝搬解析に関する研究も行われている [76]∼ [78] が,いずれも FDTD(2,2) 法であ り,数値分散誤差の影響が大きくなる大規模な問題の低コストな解析や検討は行われていない. 72 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 一方,電界および磁界を計算する FDTD 法に対して,電界あるいは磁界に関する波動方程式 を FDTD 法と同様に空間および時間の 2 次精度中心差分で差分化する WE-FDTD 法が提案され ている [96]∼ [98].WE-FDTD 法では,電界または磁界を扱うため,FDTD 法に比べ計算コス トを軽減できる利点がある.しかしながら,空間をより高次で中心差分する空間 n 次精度の高次 WE-FDTD 法やその数値分散誤差の検討,高次 WE-FDTD 法を用いた大規模電波伝搬解析,さら に並列計算に関する検討は行われていない. そこで本研究では,大規模な電波伝搬解析に適用可能な数値分散誤差や計算コストの低い解析方 法として,高次 FDTD 法および電界の波動方程式に対する高次 WE-FDTD 法とその並列計算によ る解析手法を提案する.本章では,(1) 空間 10 次精度までの高次 WE-FDTD 法における差分方程 式の導出,(2) 高次 WE-FDTD 法の分散関係式の導出と,(3) 長距離伝搬による高次 FDTD およ び WE-FDTD 法の数値分散誤差の実際,(4) 校内の教育用計算機 80 台を用いた高次 WE-FDTD 並列計算特性,(5) 高次 WE-FDTD 並列計算による 45 m × 15 m (150λ0 × 50λ0 ) の大型キャビ ティ内における電波伝搬解析について示し,本研究で提案する高次 WE-FDTD 並列計算による手 法は,TM 波では従来の手法に比べ低コストで大規模電波伝搬解析が可能であることを明らかにす る.さらに,3 次元への拡張を行い,3 次元解析における高次 FDTD および WE-FDTD 法とその 数値分散誤差,並列計算特性,3 次元大規模伝搬解析について述べる. 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 3.2.1 高次 FDTD 法と分散関係式 従来の FDTD 法は,式 (1.3),(1.4) の時間および空間で 2 次精度中心差分を用いるため,長距 離伝搬では数値分散誤差の蓄積が問題になる.この問題に対して,空間を 4 次精度で中心差分する FDTD(2,4) 法が提案されている [31] [52]∼ [56].ここで,空間 4 次および 6 次精度の中心差分は それぞれ式 (3.1),(3.2) のようになる. n n 1 ∂F (i, j, t) 1 1 3 3 n n = 27 F (i + 2 , j) − F (i − 2 , j) − F (i + 2 , j) − F (i − 2 , j) + O(∆x4 ) ∂x 24∆x (3.1) 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 73 1 ∂F (i, j, t) = 2250 F n (i + 12 , j) − F n (i − 12 , j) − 125 F n (i + 32 , j) − F n (i − 32 , j) ∂x 1920∆x n 5 5 n (3.2) + 9 F (i + 2 , j) − F (i − 2 , j) + O(∆x6 ) 例えば,式 (3.1) に示した空間 4 次精度の中心差分より,TM 波(E = Ez k, H = Hx i + Hy j ) における FDTD(2,4) 法の電界および磁界に関する差分方程式は式 (3.3)∼(3.5) のようになる.こ こで,Cn (i, j) は式 (3.6) に示す媒質定数,時間ステップ,セルサイズからなる定数である. Ezn+1 (i, j) = C1 (i, j) · Ezn (i, j) − C2 (i, j) · Jzn (i, j) n+ 21 n+ 21 C3 (i, j) n+ 21 n+ 1 1 1 · 27 Hy + (i + 2 , j) − Hy (i − 2 , j) − Hy (i + 32 , j) − Hy 2 (i − 32 , j) 24 n+ 21 n+ 21 n+ 12 n+ 21 1 1 3 3 − 27 Hx (i, j + 2 ) − Hx (i, j − 2 ) − Hx (i, j + 2 ) − Hx (i, j − 2 ) (3.3) n+ 21 (i, j + 12 ) = Hx n+ 21 (i + 12 , j) = Hy Hx Hy n− 21 (i, j + 12 ) n n C4 (i, j) n n · 27 Ez (i, j + 1) − Ez (i, j) − Ez (i, j + 2) − Ez (i, j − 1) − (3.4) 24 n− 21 (i + 12 , j) n n C4 (i, j) n n · 27 Ez (i + 1, j) − Ez (i, j) − Ez (i + 2, j) − Ez (i − 1, j) + (3.5) 24 ⎧ 2 ε(i, j) − σ(i, j) ∆t ⎪ ⎪ C1 (i, j) = ⎪ ⎪ ⎪ 2ε(i, j) + σ(i, j) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ 2 ∆t ⎪ ⎪ C2 (i, j) = ⎪ ⎨ 2 ε(i, j) + σ(i, j) ∆t 2 ∆t ⎪ ⎪ C3 (i, j) = ⎪ ⎪ ∆s (2 ε(i, j) + σ(i, j) ∆t) ⎪ ⎪ ⎪ ⎪ ⎪ ∆t ⎪ ⎪ ⎪ C4 (i, j) = ⎪ ⎩ µ(i, j) ∆s (3.6) 高次 FDTD 法の分散関係式は文献 [31] [66] [67] で示されており,例えば,2 次,4 次,6 次精度 の FDTD 法ではそれぞれ式 (3.7)∼(3.9) で表される. 74 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 1 sin v∆t 1 sin v∆t 1 sin v∆t ω∆t 2 2 ω∆t 2 ω∆t 2 2 2 1 = sin ∆x k̃x ∆x 2 2 1 + sin ∆y k̃y ∆y 2 2 2 k̃x ∆x 1 3k̃x ∆x 1 9 sin − sin = ∆x 8 2 24 2 2 k̃y ∆y 3k̃y ∆y 1 9 1 sin sin + − ∆y 8 2 24 2 (3.7) (3.8) 2 1 2250 k̃x ∆x 125 3k̃x ∆x 9 5k̃x ∆x = sin sin sin − + ∆x 1920 2 1920 2 1920 2 2 125 9 1 2250 k̃y ∆y 3k̃y ∆y 5k̃y ∆y − + + sin sin sin ∆y 1920 2 1920 2 1920 2 (3.9) ここで,k̃ は数値的波数であり,θ を x 軸とのなす角とすると,k̃x = k̃ cos θ,k̃y = k̃ sin θ で表さ れる. 3.2.2 WE-FDTD 法の高次への展開と分散関係式の導出 高次 FDTD 法と同様に,時間 2 次精度,空間 n 次精度の高次 WE-FDTD 法は,2 階偏微分に 対する空間 n 次精度中心差分を用いて,波動方程式を差分方程式に変換する.2 階偏微分の空間 4 次,6 次,8 次,10 次精度の中心差分は,それぞれ式 (3.10)∼(3.13) で表される. ∂F 2 (i, j, t) 1 = 2 ∂x 12∆x2 − F n (i + 2, j) + F n (i − 2, j) + 16 F (i + 1, j) + F (i − 1, j) − 30F (i, j) + O(∆x4 ) n n n (3.10) n n 1 ∂F 2 (i, j, t) n n = (i + 3, j) + F (i − 3, j) − 27 F (i + 2, j) + F (i − 2, j) 2 F ∂x2 180∆x2 n n n (3.11) + 270 F (i + 1, j) + F (i − 1, j) − 490F (i, j) + O(∆x6 ) 75 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 ∂F 2 (i, j, t) 1 = 2 ∂x 5040∆x2 − 9 F n (i + 4, j) + F n (i − 4, j) + 128 F n (i + 3, j) + F n (i − 3, j) − 1008 F n (i + 2, j) + F n (i − 2, j) + 8064 F n (i + 1, j) + F n (i − 1, j) n (3.12) − 14350F (i, j) + O(∆x8 ) 1 ∂F 2 (i, j, t) = 8(F n (i + 5, j) + F n (i − 5, j)) − 125(F n (i + 4, j) + F n (i − 4, j)) 2 2 ∂x 25200∆x + 1000(F n (i + 3, j) + F n (i − 3, j)) − 6000(F n(i + 2, j) + F n (i − 2, j)) n n n + 42000(F (i + 1, j) + F (i − 1, j)) − 73766F (i, j) + O(∆x10 ) (3.13) TM 波における高次 WE-FDTD 法では,式 (3.10)∼(3.13) より,式 (2.11) の波動方程式を 差分方程式に変換する.式 (3.14)∼(3.17) にそれぞれ WE-FDTD(2,4) 法,WE-FDTD(2,6) 法, WE-FDTD(2,8) 法,WE-FDTD(2,10) 法における電界の差分方程式を示す.ここで,Cn (i, j) は 式 (3.18) で表される解析空間の媒質定数と時間ステップおよびセルサイズで表される定数である. Ezn+1 (i, j) = C1 (i, j) · Ezn (i, j) − C2 (i, j) · Ezn−1 (i, j) − C3 (i, j) · Jzn+1 (i, j) − Jzn−1 (i, j) C4 (i, j) · − Ezn (i + 2, j) + Ezn (i − 2, j) + 16 Ezn (i + 1, j) + Ezn (i − 1, j) + 12 n n n n n − Ez (i, j + 2) + Ez (i, j − 2) + 16 Ez (i, j + 1) + Ez (i, j − 1) − 60Ez (i, j) (3.14) Ezn+1 (i, j) = C1 (i, j) · Ezn (i, j) − C2 (i, j) · Ezn−1 (i, j) − C3 (i, j) · Jzn+1 (i, j) − Jzn−1 (i, j) C4 (i, j) · 2 Ezn (i + 3, j) + Ezn (i − 3, j) − 27 Ezn (i + 2, j) + Ezn (i − 2, j) + 180 + 270 Ezn (i + 1, j) + Ezn (i − 1, j) + 2 Ezn (i, j + 3) + Ezn (i, j − 3) − 27 Ezn (i, j + 2) + Ezn (i, j − 2) + 270 Ezn (i, j + 1) + Ezn (i, j − 1) − 980Ezn (i, j) (3.15) 76 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 Ezn+1 (i, j) = C1 (i, j) · Ezn (i, j) − C2 (i, j) Ėzn−1 (i, j) − C3 (i, j) · Jzn+1 (i, j) − Jzn−1 (i, j) C4 (i, j) + · − 9 Ezn (i + 4, j) + Ezn (i − 4, j) + 128 Ezn (i + 3, j) + Ezn (i − 3, j) 5040 − 1008 Ezn (i + 2, j) + Ezn (i − 2, j) + 8064 Ezn (i + 1, j) + Ezn (i − 1, j) − 9 Ezn (i, j + 4) + Ezn (i, j − 4) + 128 Ezn (i, j + 3) + Ezn (i, j − 3) − 1008 Ezn (i, j + 2) + Ezn (i, j − 2) + 8064 Ezn (i, j + 1) + Ezn (i, j − 1) n (3.16) − 28700Ez (i, j) Ezn+1 (i, j) = C1 (i, j) · Ezn (i, j) − C2 (i, j) · Ezn−1 (i, j) − C3 (i, j) · Jzn+1 (i, j) − Jzn−1 (i, j) C4 (i, j) · 8 Ezn (i + 5, j) + Ezn (i − 5, j) − 125 Ezn (i + 4, j) + Ezn (i − 4, j) + 25200 + 1000 Ezn (i + 3, j) + Ezn (i − 3, j) − 6000 Ezn (i + 2, j) + Ezn (i − 2, j) + 42000 Ezn (i + 1, j) + Ezn (i − 1, j) + 8 Ezn (i, j + 5) + Ezn (i, j − 5) − 125 Ezn (i, j + 4) + Ezn (i, j − 4) + 1000 Ezn (i, j + 3) + Ezn (i, j − 3) − 6000 Ezn (i, j + 2) + Ezn (i, j − 2) n n n + 42000 Ez (i, j + 1) + Ez (i, j − 1) − 147532Ez (i, j) (3.17) ⎧ 4 ε(i, j) ⎪ ⎪ C1 (i, j) = ⎪ ⎪ ⎪ 2 ε(i, j) + σ(i, j) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ 2 ε(i, j) − σ(i, j) ∆t ⎪ ⎪ ⎪ ⎨ C2 (i, j) = 2 ε(i, j) + σ(i, j) ∆t ⎪ ∆t ⎪ ⎪ C3 (i, j) = ⎪ ⎪ ⎪ 2 ε(i, j) + σ(i, j) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ∆t 1 2 ∆t ⎪ ⎪ ⎩ C4 (i, j) = 2 ε(i, j) + σ(i, j) ∆t µ(i, j) ∆s2 (3.18) 高次 FDTD 法の数値分散誤差は,文献 [31] [66] [67] で議論されているが,高次 WE-FDTD 法 の数値分散誤差の検討は行われていない.ここで,文献 [31] と同様の手法で高次 WE-FDTD 法の 数値分散誤差を導出し,FDTD 法との精度比較を行う. 77 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 2,4,6,8,10 次精度の高次 WE-FDTD 法の分散関係式は,文献 [31] と同様の手法により,そ れぞれ式 (3.19)∼(3.21) のように導くことができ,数値分散誤差の理論値を計算することができる. 1 c∆t 2 1 c∆t 1 c∆t 2 cos(k̃x ∆x) − 1 cos(k̃y ∆y) − 1 + cos(ω∆t) − 1 = ∆x2 ∆y 2 (3.19) 1 cos(ω∆t) − 1 = − cos(2k̃x ∆x) + 16 cos(k̃x ∆x) − 30 12∆x2 1 + − cos(2k̃y ∆y) + 16 cos(k̃y ∆y) − 30 12∆y 2 2 cos(ω∆t) − 1 (3.20) 1 ∆x) − 27 cos(2 k̃ ∆x) + 270 cos( k̃ ∆x) − 490 2 cos(3 k̃ x x x 180∆x2 1 + ∆y) − 27 cos(2 k̃ ∆y) + 270 cos( k̃ ∆y) − 490 2 cos(3 k̃ y y y 180∆y 2 = 1 c∆t 2 cos(ω∆t) − 1 (3.21) 1 − 9 cos(4 k̃ ∆x) + 128 cos(3 k̃ ∆x) − 1008 cos(2 k̃ ∆x) + 8064 cos( k̃ ∆x) − 14350 x x x x 5040∆x2 1 − 9 cos(4k̃y ∆x) + 128 cos(3k̃y ∆y) − 1008 cos(2k̃y ∆y) + 8064 cos(k̃y ∆y) − 14350 + 5040∆y 2 = (3.22) 1 c∆t 2 cos(ω∆t) − 1 1 = 8 cos(5k̃x ∆x) − 125 cos(4k̃x ∆x) + 1000 cos(3k̃x ∆x) 25200∆x2 − 6000 cos(2k̃x ∆x) + 42000 cos(k̃x ∆x) − 73766 + 1 8 cos(5k̃y ∆y) − 125 cos(4k̃y ∆y) + 1000 cos(3k̃y ∆y) 25200∆y 2 − 6000 cos(2k̃y ∆y) + 42000 cos(k̃y ∆y) − 73766 (3.23) 78 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 3.2.3 数値分散誤差特性 3.2.3.1 高次 FDTD および WE-FDTD 法の数値分散誤差の比較 数値分散誤差 eφ は,空間を差分化することにより,自由空間においては位相速度が光速 c = 3×108 m/s とならなず,数値的な光速 c̃(= 3 ×108 m/s) となるために生じる.c̃ は,高次 FDTD 法では 式 (3.7)∼(3.9),高次 WE-FDTD 法では式 (3.19)∼(3.23) の分散関係式から求められる数値的波数 k̃ より c̃ = ω k̃ から計算することができる.図 3.1 に式 (3.24) から求められる位相速度 c̃ の相対誤 差 ec を示す. ec = c̃ − c c (3.24) 図 3.1 (a) はクーラン数を 0.3,伝搬角を θ = 0◦ とした場合のセルサイズ ∆s による,図 3.1 (b) は クーラン数を 0.3,セルサイズを ∆s = λ/10 とした場合の伝搬角 θ による,図 3.1 (c) はセルサイ ズを ∆s = λ/10 ,伝搬角を θ = 0◦ とした場合のクーラン数の変化に対する位相速度の相対誤差を 示す.ここで,クーラン数は式 (3.25) で定義される. courant number = c ∆t ∆s (3.25) 図 3.1 より,空間で 2 次および 4 次の FDTD 法と WE-FDTD 法はほぼ同程度の精度があること が確認できる.図 3.1 (a) より,∆s を小さく取れば位相速度の相対誤差も小さくなり,2 次精度で は波長の 1/20 に設定すればおおよそ – 0.5 % の誤差になることが分かる.また,4 次精度では ∆s を波長の 1/10 以下にすれば誤差はほぼ 0 % になる.図 3.1 (b) のクーラン数を 0.3,セルサイズ を ∆s = λ/10 とした場合には,2 次および 4 次精度とも伝搬角が 45◦ で誤差が最も大きくなり,4 次精度では数値的光速 c̃ が 3 ×108 m/s より速くなる現象が見られる.図 3.1 (c) では,クーラン 数を小さくしても,すなわち時間ステップ ∆t を小さくしても誤差はある程度以上減少しないこと が分かる.また,4 次精度では誤差が 0 % になるクーラン数が存在することが分かる. さらに,1 波長伝搬あたりの数値分散誤差 eφ は,式 (3.7)∼(3.9) および式 (3.19)∼(3.23) の分散 関係式の数値的波長 λ̃ から,式 (3.26) より求めることができる [66]. λ eφ = 360 −1 λ̃ (3.26) 79 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 relative error of phase velocity [%] 1.00 0.00 -1.00 -2.00 WE-FDTD(2,2) WE-FDTD(2,4) -3.00 FDTD(2,2) -4.00 FDTD(2,4) -5.00 -6.00 -7.00 0 10 20 30 40 50 cells/λ (a) 0.20 relative error of phase velocity [%] 0.00 WE-FDTD(2,2) -0.20 WE-FDTD(2,4) -0.40 FDTD(2,2) FDTD(2,4) -0.60 -0.80 -1.00 -1.20 -1.40 -1.60 0 10 20 30 40 50 60 wave angle θ [deg.] 70 80 90 (b) relative error of phase velocity [%] 0.50 0.00 WE-FDTD(2,2) -0.50 WE-FDTD(2,4) FDTD(2,2) -1.00 FDTD(2,4) -1.50 -2.00 10-4 10-3 10-2 courant number 10-1 100 (c) 図 3.1 空間 2 次および 4 次精度の FDTD 法および WE-FDTD 法における位相速度 c の相対誤差 (a) セルサイズ ∆s (クーラン数=0.3,θ = 0◦ ) (b) 伝搬角 θ (クーラン数=0.3,∆s = λ/10) (c) クーラン数 (∆s = λ/10 ,θ = 0◦ ) 80 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 5.00 dispersion error [deg./λ] 0.00 -5.00 WE-FDTD(2,2) -10.00 WE-FDTD(2,4) FDTD(2,2) -15.00 FDTD(2,4) -20.00 -25.00 -30.00 0 10 20 30 40 50 cells/λ (a) 1.00 0.00 dispersion error [deg./λ] WE-FDTD(2,2) -1.00 WE-FDTD(2,4) FDTD(2,2) -2.00 FDTD(2,4) -3.00 -4.00 -5.00 -6.00 0 10 20 30 40 50 60 wave angle θ [deg.] 70 80 90 (b) 2.00 1.00 dispersion error [deg./λ] 0.00 -1.00 WE-FDTD(2,2) -2.00 WE-FDTD(2,4) -3.00 FDTD(2,2) -4.00 FDTD(2,4) -5.00 -6.00 -7.00 10-4 10-3 10-2 courant number 10-1 100 (c) 図 3.2 空間 2 次および 4 次精度の FDTD 法および WE-FDTD 法における 1 波長伝搬あたりの数値分 散誤差 (a) セルサイズ ∆s(クーラン数=0.3,θ = 0◦ ) (b) 伝搬角 θ (クーラン数=0.3,∆s = λ/10) (c) クーラン数 (∆s = λ/10 ,θ = 0◦ ) 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 81 図 3.2 に式 (3.7),(3.8),(3.19),(3.20),および式 (3.26) から求めた高次 FDTD 法および WE- FDTD 法の 1 波長伝搬毎の数値分散誤差を示す.図 3.2 (a) はクーラン数を 0.3,伝搬角を θ = 0◦ とした場合のセルサイズ ∆s による,図 3.2 (b) はクーラン数を 0.3,セルサイズを ∆s = λ/10 と した場合の伝搬角 θ による,図 3.2 (c) はセルサイズを ∆s = λ/10 ,伝搬角を θ = 0◦ とした場合 のクーラン数の変化に対する数値分散誤差特性を示す.図 3.2 の結果は図 3.1 の位相速度の誤差特 性と同様な特性を示す.また,図 3.2 より,伝搬距離の増加により蓄積される数値分散誤差を求め ることができる. 3.2.3.2 高次 WE-FDTD 法の数値分散誤差特性 2 次から 10 次までの高次 WE-FDTD 法の 1 波長伝搬あたりの数値分散誤差 eφ も同様に求め ることができる.図 3.3 に式 (3.19)∼(3.23) から求めた 2 次から 10 次までの高次 WE-FDTD 法 における 1 波長伝搬毎の数値分散誤差を示す.図 3.3 (a) はクーラン数を 0.01,伝搬角を θ=0 とした場合のセルサイズ ∆s による数値分散誤差特性,図 3.2 (b) はクーラン数を 0.01,セルサ イズを ∆s = λ/10 とした場合の伝搬角 θ による数値分散誤差特性,図 3.2 (c) はセルサイズを ∆s = λ/10,伝搬角を θ=0◦ とした場合のクーラン数の変化に対する数値分散誤差特性を示す.図 3.3 の結果より,高次の手法ほど数値分散誤差を軽減できるが,特に,図 3.3 (c) より,高次の方 法ほどクーラン数を小さく,すなわち時間ステップ ∆s を小さくする必要があり,また,高次では クーラン数によっては低次より誤差が大きくなる場合があるため,解析する問題によって適切に次 数を選択する必要があることが分かる. 3.2.3.3 数値分散誤差の周波数特性 図 3.4 に位相定数 β の周波数特性を示す.図 3.4 は FDTD(2,2) 法と FDTD(2,4) 法において, セルサイズ ∆s を 0.03 と 0.05 にした場合の周波数の変化による位相定数 β を示す.図 3.4 よ り,周波数が増加するほど位相定数の誤差は大きくなることが分かる.これはセルサイズ ∆s が波 長に比べ大きくなるためである.図 3.5 に図 3.4 の位相定数 β の相対誤差を示す.これより,ガ ウシアンパルスのような広帯域の周波数成分を含む電磁波の伝搬解析では,セルサイズ ∆s を高 い周波数に考慮して設定しなければ,分散により波形が崩れることが分かる.また,図 3.5 より, 82 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 2 10 WE-FDTD(2,2) WE-FDTD(2,4) WE-FDTD(2,6) WE-FDTD(2,8) WE-FDTD(2,10) absolute dispersion error [deg./λ] 101 100 10 -1 10-2 10-3 10 -4 10-5 10-6 10 -7 0 20 40 60 80 100 cells / λ (a) absolute dispersion error [deg./λ] 101 100 10-1 10-2 10-3 10-4 WE-FDTD(2,2) WE-FDTD(2,4) WE-FDTD(2,6) WE-FDTD(2,8) WE-FDTD(2,10) 10-5 10-6 0 10 20 30 40 50 60 wave angle θ [deg.] 70 80 90 (b) absolute dispersion error [deg./λ] 101 100 10-1 10-2 10-3 10-4 WE-FDTD(2,2) WE-FDTD(2,4) 10-5 10 WE-FDTD(2,6) WE-FDTD(2,8) -6 WE-FDTD(2,10) 10-7 0.001 0.01 0.1 courant number c ∆t/∆s 1 (c) 図 3.3 高次 WE-FDTD 法の 1 波長伝搬あたりの数値分散誤差 (a) セルサイズ ∆s(クーラン数=0.01, θ = 0◦ ) (b) 伝搬角 θ (クーラン数=0.01,∆s = λ/10) (c) クーラン数 (∆s = λ/10 ,θ = 0◦ ) 83 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 18 phase constant β [rad/m] FDTD(2,2), ∆s = 0.05 16 FDTD(2,2), ∆s = 0.03 14 FDTD(2,4), ∆s = 0.05 theoritical 12 10 8 6 4 2 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 angle frequency ω x 109 [rad/s] 図 3.4 FDTD 法における位相定数 β の周波数特性 3.0 relative error of phase constant β [%] FDTD(2,2), ∆s = 0.05 FDTD(2,2), ∆s = 0.03 2.5 FDTD(2,4), ∆s = 0.05 2.0 1.5 1.0 0.5 0.0 -0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 angle frequency ω x 109 [rad/s] 図 3.5 FDTD 法における位相定数 β の相対誤差 FDTD(2,4) 法でセルサイズを ∆s = 0.05 とした場合には,FDTD(2,2) 法の ∆s = 0.03 に比べ位 相定数の誤差は少ないことが分かる. 3.2.4 伝搬距離により蓄積される数値分散誤差の実際 図 3.2,3.3 の 1 波長伝搬毎の数値分散誤差特性から計算した伝搬距離の増加による数値分散誤差 を図 3.6 に示す.図 3.6 は,2 次から 6 次までの FDTD 法および WE-FDTD 法において,伝搬角 を 0◦ ,クーラン数を 0.05,セルサイズを λ/20 とした場合の伝搬距離の増加による数値分散誤差で 84 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 10 4 FDTD(2,2) WE-FDTD(2,2) FDTD(2,4) WE-FDTD(2,4) FDTD(2,6) WE-FDTD(2,6) 103 dispersion error [deg.] 102 101 10 0 10 -1 10 -2 10 -3 10 -4 10-5 1 10 100 propagation distance λ [m] 1000 図 3.6 高次 FDTD および WE-FDTD 法の伝搬距離による数値分散誤差の蓄積(セルサイズ λ/20, クー ラン数 0.05,伝搬角 θ = 0◦ ) ある.図 3.6 より,2 次精度では 100λ の伝搬によってセルサイズを λ/20 としても 141.3◦ の数値 分散誤差が生じるが,4 次精度では 1.56◦ ,6 次精度では 0.34◦ に数値分散誤差を軽減できることが 分かる. 3.2.5 計算精度と計算コスト 以上の図 3.2,3.3,3.6 の結果より,100λ の伝搬を数値分散誤差約 1◦ の精度で解析するための 各方法の計算コストを表 3.1 に示す.表 3.1 において,伝搬角 θ は 0◦ ,クーラン数は 2 次精度で は 0.5,4 次および 6 次精度では 0.05 とする.セルサイズ ∆s は図 3.3 や 3.6 の結果より,数値分 散誤差約 1◦ となる値を用いる. 使用する総セル数 Ncells は,解析領域を Lλ × Lλ (L = 100),セルサイズ を ∆s = ∆x = ∆y .n を 1 波長毎のセルの分割数,nEH を使用する電磁界成分の配列数とすれば,式 (3.27) から計算する ことができる.ここで,nEH は,FDTD 法では nEH = 3 ,WE-FDTD 法では nEH = 2 である. Ncells = nEH Nx × Ny = nEH Lλ ∆s 2 = nEH Lλ λ n 2 2 = nEH L · n (3.27) 使用メモリ memory は式 (3.27) より倍精度配列を使用するものとすれば,総セル数 Ncells × 8 byte となる.さらに,式 (3.27) より,時間 1 ステップあたりの計算量 Ncalc は式 (3.28) で表され 85 3.2 高次 FDTD 法および WE-FDTD 法とその数値分散誤差 表 3.1 100λ 伝搬を数値分散誤差 約 1◦ で解析するための各高次 FDTD 法の計算コスト(伝搬角 θ = 0◦ ) FDTD(2,2) WE-FDTD(2,2) FDTD(2,4) WE-FDTD(2,4) ∆s [m] courant number Ncells λ/210.7 0.5 1.3 × 109 10700 49 0.5 8.9 × 10 8 7100 37 1.3 × 10 7 105.8 52 9.7 × 10 6 77.4 47 6 19.4 65 8.1 53 λ/210.7 λ/21.0 λ/22.0 0.05 0.05 memory [Mbyte] nf [flop/(step · cell)] FDTD(2,6) λ/9.0 0.05 2.4 × 10 WE-FDTD(2,6) λ/7.1 0.05 1.0 × 106 る.ここで,nf flop / (step · cell) は,電磁界の差分方程式の計算における時間 1 ステップあた り 1 セルあたりの浮動小数点演算数であり,式 (2.4)∼(2.6) や式 (2.14) 等の差分方程式から求めら れる. Ncalc = nf · Ncells (3.28) 図 3.6 の結果より,2 次精度の方法では数値分散誤差約 1◦ にするためにはセルサイズ ∆s を λ/200 程度にする必要がある.また,FDTD(2,2) 法と WE-FDTD(2,2) 法を比較すると,FDTD 法は電磁界の配列総数 3N 2 であるのに対して,WE-FDTD 法では電界の配列総数 2N 2 で済むた め,WE-FDTD 法は FDTD 法に比べメモリは 2/3 の削減となる.4 次精度ではセルサイズは λ/20 程度で済むため 2 次精度に比べ使用メモリはおおよそ 1/100 に削減できるが,クーラン数を 10 倍 にする必要がある.しかしながら,配列総数を 1/100 にできるので,2 次精度との浮動小数点演算 数比を C24 とすれば,計算量は 2 次精度に比べおおよそ C24 /10 で済む.例えば,WE-FDTD(2,4) 法は FDTD(2,2) 法に比べ,C24 = 47/49 であるので,計算量は 47/490 とおおよそ 1/10 に削減で きる.6 次精度では,セルサイズを 4 次精度の半分以下の λ/10 以下にでき,4 次精度と同じクー ラン数 0.05 でよいので,6 次精度では 4 次精度と同等の精度を得るのに必要なメモリはおおよそ 1/4 に削減できる.また,4 次精度との浮動小数点演算数比を C46 とすれば,計算量は 4 次精度に 比べおおよそ C46 /4 で済む.さらに,2 次精度と比較するとおおよそ 1/400 に削減でき,2 次精度 との浮動小数点演算数比を C26 とすれば,計算量は 2 次精度に比べおおよそ C26 /40 に削減する ことができる.例えば,WE-FDTD(2,6) 法は FDTD(2,2) 法に比べ,配列総数は 1/1332 になり, C26 = 53/49 であるので,計算量はおおよそ 1/123 に削減できる. 86 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 3.3 高次 FDTD および WE-FDTD 法の並列計算 3.3.1 並列計算アルゴリズムとそのコスト ここで,高次 WE-FDTD 法の並列計算アルゴリズムについて示す.PC クラスタのような分散 メモリ型並列計算機では,解析領域を各計算機に割当て,各計算機で計算を行い,隣接する計算機 間で計算結果の受け渡しを行う.図 3.7 に高次の各方法の並列計算において,隣接する計算機間 で必要なデータ交換について示す.図 3.7 (a) は FDTD(2,2) 法および WE-FDTD(2,2) 法の計算 機境界におけるデータ交換である.FDTD(2,2) 法では計算機間で 2 つの電界 Ez と磁界 Hy の交 換を,WE-FDTD(2,2) 法では計算機間で 2 つの電界 Ez の交換を行う.図 3.7 (b) は 4 次精度に おけるデータ交換であり,FDTD(2,4) 法では計算機間で 6 つの電界 Ez および磁界 Hy の交換が, WE-FDTD(2,4) 法では計算機間で 4 つの電界 Ez および磁界 Hy の交換が必要になる.図 3.7 (c) の 6 次精度では,FDTD(2,6) 法は計算機間で 10 個の電界 Ez と磁界 Hy の交換が,WE-FDTD(2,6) 法は計算機間で 6 つの電界 Ez の交換が必要になる.以上のように高次になるほど通信量が増加す るが,WE-FDTD 法は FDTD 法に比べ通信量は削減できる. 表 3.2 に解析領域 N × N における高次 W FDTD 法および WE-FDTD 法の並列計算コスト を示す.表 3.2 において,nf は時間 1 ステップ 1 セルあたりの浮動小数演算数 であり,ncomm は,時間 1 ステップの各計算機で生じる通信量である.表 3.2 より,4 次精度では前述のように WE-FDTD(2,4) 法は FDTD(2,4) 法に比べ通信量は少なくて済み,時間 1 ステップの計算量も軽 減される.また,WE-FDTD(2,6) 法と FDTD(2,4) 法は同程度の計算量と通信量である.表 3.1 お よび表 3.2 と式 (3.28) より,並列計算における各高次手法の計算量 P Ncalc は計算機台数を p,解 析領域を L λ × L λ とすれば,式 (3.29) で求められる.n は 1 波長あたりのセルの分割数である. P Ncalc = nf nEH (n L)2 ncomm (p − 1) + p p (3.29) 表 3.2 高次 WE-FDTD 法の並列計算コスト(解析領域 N × N ) FDTD(2,2) WE-FDTD(2,2) FDTD(2,4) WE-FDTD(2,4) FDTD(2,6) WE-FDTD(2,6) nf 49 37 52 47 65 53 ncomm 2N 2N 6N 4N 10 N 6N 87 3.3 高次 FDTD および WE-FDTD 法の並列計算 PC: p PC: p+1 PC: p PC: p+1 Ez Ez Hy Hx y y z x z x FDTD(2,2) WE-FDTD(2,2) (a) PC: p PC: p+1 PC: p PC: p+1 Ez Ez Hy Hx y y z x z x FDTD(2,4) WE-FDTD(2,4) (b) PC: p PC: p+1 PC: p PC: p+1 Ez Ez y Hy z x Hx y z x FDTD(2,6) WE-FDTD(2,6) (c) 図 3.7 高次 FDTD および WE-FDTD 並列計算におけるデータ交換 (a) 2 次 (b) 4 次 (c) 6 次 88 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 3.3.2 大規模 PC クラスタにおける並列計算特性 高次 WE-FDTD 並列計算特性を検討するために,校内の教育用計算機 80 台を用いた並列計算 を行う.各計算機の仕様は,CPU が Celeron 900 MHz,搭載メモリは 128 Mbyte,NIC は Intel PRO 100 (100 Mbit/s) であり,上流のネットワークスイッチとは 1000 Base-SX/T で接続されて いる.OS は Linux (kernel 2.4.5-3) である.並列計算において計算機間の通信を行うライブラリと して,フリーの MPI(Message Passing Interface) の実装である mpich-1.2.4 [107] を用いる. 高次 WE-FDTD 並列計算の効果を検討するために,1200 × 1200 の解析領域で計算機 p 台を使 用した場合の時間 1000 ステップの計算時間 T (p, N) の測定結果を図 3.8 に示す.ここで,計算時 間 T (p, N) とは,並列計算における計算時間と計算機間の通信時間を含む wall clock time であ り,MPI 関数の MPI Wtime() を用いて測定した.図 3.8 より,いずれの方法も使用台数 p が増す ごとに計算時間が減少しており,並列計算により高速な計算が行われることが確認できる.しかし ながら,高次の方法ほど通信量と計算量が増加するため計算時間が増加することが分かる.また, 表 3.3 に p = 80 の場合の 1000 ステップの計算時間 T (p, N) の測定結果を示す.表 3.2 において, WE-FDTD(2,6) 法と FDTD(2,4) 法の計算量と通信量は同程度であることを示したが,図 3.8 およ び表 3.3 の結果より,WE-FDTD(2,6) 法と FDTD(2,4) 法の計算時間 T (p, N) は,同程度の計算時 間であることが確認できる. 図 3.9∼3.11 に式 (2.25)∼(2.27) で表される速度向上比 S(p, N) ,通信比 C(p, N) ,並列効率 E(p, N) を示す.図 3.9 の速度向上比 S(p, N) より,高次の方法ほど速度向上は低下するが,これ は図 3.10 に示すように高次手法の通信量の増加のためである.また,同じ次数の WE-FDTD 法と FDTD 法では,WE-FDTD 法の方が速度向上比が低い.これは,WE-FDTD 法の方が FDTD 法 より通信量と計算量が少ないため,WE-FDTD 法では全計算に占める通信の割合が高くなるため である. 表 3.3 各高次 FDTD 並列計算の計算時間(解析領域 1200 × 1200,時間 1000 ステップ) T (p, N ) [s] FDTD(2,2) WE(2,2) FDTD(2,4) WE(2,4) WE(2,6) WE(2,8) 17.93 14.95 28.07 19.71 27.14 34.02 89 3.3 高次 FDTD および WE-FDTD 法の並列計算 FDTD(2,2) 1000 WE-FDTD(2,2) calculation time [s] FDTD(2,4) WE-FDTD(2,4) WE-FDTD(2,6) 100 10 1 10 number of PCs 100 図 3.8 高次 WE-FDTD 並列計算の計算時間 T (p, N ) (N = 1200,1000 ステップ) 80 FDTD(2,2) 70 WE-FDTD(2,2) 60 FDTD(2,4) speed-up ratio WE-FDTD(2,4) 50 WE-FDTD(2,6) ideal 40 30 20 10 0 0 10 20 30 40 50 number of PCs 60 70 80 90 図 3.9 高次 WE-FDTD 並列計算の速度向上比 S(p, N ) (N = 1200,1000 ステップ) 90 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 0.6 FDTD(2,2) WE-FDTD(2,2) 0.5 communicatio ratio FDTD(2,4) WE-FDTD(2,4) 0.4 WE-FDTD(2,6) 0.3 0.2 0.1 0 0 10 20 30 40 50 number of PCs 60 70 80 90 図 3.10 高次 WE-FDTD 並列計算の通信比 C(p, N ) (N = 1200,1000 ステップ) 1.0 FDTD(2,2) WE-FDTD(2,2) parallel efficiency E(p,N) 0.9 FDTD(2,4) WE-FDTD(2,4) 0.8 WE-FDTD(2,6) 0.7 0.6 0.5 0.4 0 10 20 30 40 50 number of PCs 60 70 80 90 図 3.11 高次 WE-FDTD 並列計算の並列効率 E(p, N ) (N = 1200,1000 ステップ) 91 3.4 大型キャビティの電波伝搬解析への応用 表 3.4 従来の方法と比較した WE-FDTD(2,6) 並列計算の計算コスト比 (1200 × 1200, p = 80) FDTD(2,2) FDTD(2,4) memory 1/1332 1/13 calculation 1/88 1/13 3.3.3 高次 WE-FDTD 法の並列計算コストの評価 表 3.4 に WE-FDTD(2,6) の並列計算コストを示す.表 3.4 は,表 3.1,3.3 の結果から求めた計 算機 80 台使用した場合の,FDTD(2,2) および FDTD(2,4) 並列計算と比較した WE-FDTD(2,6) 並列計算の計算コスト比である.表 3.1 より,100λ の伝搬解析で同程度の精度を得るために必要 なメモリは,FDTD(2,2) 法に比べ 1/1332,FDTD(2,4) 法に比べ 1/13 に削減される.また,表 3.3 より,計算機 80 台使用した場合の計算時間は,FDTD(2,2) 法と比べ約 1.5 倍,FDTD(2,4) 法 と比べ約 1.0 倍となるため,配列総数とクーラン数の増減を考慮し計算時間の削減量を求めると, FDTD(2,2) 法と比べ約 1/88,FDTD(2,4) 法と比べ約 1/13 となり,提案した WE-FDTD(2,6) 並 列計算による方法は,従来の手法に比べ大幅に計算コストを削減することができる. 3.4 大型キャビティの電波伝搬解析への応用 3.4.1 解析モデル 高次 WE-FDTD 並列計算の大規模電波伝搬解析への適用例として,図 3.12 に示す大型キャビ ティ (L = 45 m × W = 15 m) における電波伝搬解析を行う.図 3.12 の大型キャビティは,周囲 W = 15 m free space Obs.(37.5, 7.5) Jz (7.5, 7.5) R = 30.0 m y x boundary condition: PEC z L = 45 m 図 3.12 大型キャビティモデル 92 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 表 3.5 大型キャビティの伝搬解析で用いる送信波形の周波数と波長 case wave form f [GHz] λ [m] a sine wave 1.0 0.3 b gauss pulse 1 ( tw = 0.6 ns) 1.3 0.227 c gauss pulse 2 ( tw = 0.16 ns) 5.3 0.057 1.0 tw = 0.6 ns tw = 0.16 ns amplitude [a.u.] 0.8 0.6 0.4 0.2 0.0 2.0 2.5 3.0 time [ns] 3.5 4.0 (a) 0 tw = 0.6 ns tw = 0.16 ns power [dB] -10 -20 -30 -40 -50 0.0 2.0 4.0 6.0 8.0 frequency [GHz] 10.0 12.0 (b) 図 3.13 大型キャビティの電波伝搬解析で用いる送信波形 (a) 時間領域 (b) スペクトル を完全導体で囲まれており,内部は自由空間である.波源として直線状電流源を (7.5, 7.5),観測点 を (37.5, 7.5) の位置に設定し,表 3.5 に示すような CW と帯域の異なる 2 種類のガウシアンパル スを波源として考える.図 3.13 にガウシアンパルス(半値幅 0.6 ns と 0.16 ns)の時間波形とスペ クトルを示す.ここで,各波形を用いた場合の波長に対する解析領域の大きさは,case a の CW で は 150λ × 50λ,ガウシアンパルスの場合には最大周波数を – 10 dB の周波数で定義すると,case b では 198λ × 66λ,case c では 790λ × 263λ となる. 93 3.4 大型キャビティの電波伝搬解析への応用 3.4.2 大型キャビティ内の電波伝搬解析とその計算精度 図 3.14 および表 3.6 に図 3.12 の大型キャビティモデルで生じる伝搬距離により蓄積される数値 分散誤差の理論値を示す.図 3.14 および表 3.6 より,FDTD(2,2) ではセルサイズを λ/20 としても 100λ の伝搬で数値分散誤差が 100◦ 以上生じ,WE-FDTD(2,4) においてもセルサイズを λ/10 と 1.5 FDTD(2,2), ∆s=λ/20 WE-FDTD(2,4), ∆s=λ/20 1.0 WE-FDTD(2,4), ∆s=λ/10 dispersion error [deg.] 0.5 WE-FDTD(2,6), ∆s=λ/10 0.0 -0.5 -1.0 -1.5 -2.0 0.01 0.1 courant number 1 (a) 4 10 FDTD(2,2), ∆s=λ/20, CN=0.5 WE-FDTD(2,4), ∆s=λ/20, CN=0.05 WE-FDTD(2,4), ∆s=λ/10, CN=0.05 WE-FDTD(2,6), ∆s=λ/10, CN=0.05 3 dispersion error [deg.] 10 102 101 100 -1 10 -2 10 -3 10 1 10 100 propagation distance λ [m] 1000 (b) 図 3.14 各高次 FDTD 法で生じる数値分散誤差の理論値 (a) クーラン数による数値分散誤差 (b) 伝搬 距離による数値分散誤差の蓄積 94 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 表 3.6 伝搬距離による数値分散誤差の理論値 method ∆s courant number R = 50λ R = 100λ FDTD(2,2) λ/20 0.5 55.95 111.90 WE-FDTD(2,4) λ/10 0.05 14.36 28.72 WE-FDTD(2,4) λ/20 0.05 0.78 1.56 WE-FDTD(2,6) λ/10 0.05 0.19 0.38 すると 100λ の伝搬で数値分散誤差が 30◦ 程度生じる.これに対して,WE-FDTD(2,4) で λ/20 と すると 1.5◦ ,WE-FDTD(2,6) で λ/10 とすると 0.4◦ 程度の数値分散誤差が生じ,WE-FDTD(2,6) では λ/10 としても高精度で計算できることが分かる. 図 3.15 に,波源に周波数 1 GHz の正弦波を与えた場合の (a) 50λ,(b) 100λ 離れた観測点におけ る電界 Ez の時間応答を示す.図 3.15 は,クーラン数を FDTD(2,2) 法では 0.5,WE-FDTD(2,4) および WE-FDTD(2,6) 法では 0.05,セルサイズ ∆s を FDTD(2,2) および WE-FDTD(2,4) 法 では λ/20,WE-FDTD(2,6) 法では λ/10 とした場合の 5 台の計算機 (Pentium 4 2.8 GHz, 512 Mbyte) を使用した並列計算による計算結果である.図 3.15 (a) より,FDTD(2,2) 法では数値分 散誤差は約 0.14 ns (49.1◦ ),∆s = λ/10 の WE-FDTD(2,4) 法では数値分散誤差は約 0.037 ns (13.5◦ ) が生じているが,∆s = λ/20 の WE-FDTD(2,4) 法と ∆s = λ/10 の WE-FDTD(2,6) 法で は解析解とよく一致している.図 3.15 (b) より,100λ の伝搬により図 3.15 (a) の誤差がさらに蓄積 され,FDTD(2,2) 法では数値分散誤差は約 0.29 ns (105.1◦ ),∆s = λ/10 の WE-FDTD(2,4) 法で は数値分散誤差は約 0.75 ns (27.0◦ ) が生じるが,∆s = λ/20 の WE-FDTD(2,4) 法と ∆s = λ/10 の WE-FDTD(2,6) 法では R = 100λ の伝搬でも解析解とよく一致する.特に,WE-FDTD(2,6) 法では ∆s = λ/10 としても理論値とよく一致している.ここで生じた数値分散誤差は,図 3.14 お よび表 3.6 に示した数値分散誤差の理論値とほぼ一致しており,並列計算は理論どおりに行われて いることが確認できる. 図 3.16 に,波源に図 3.13 の半値幅 0.6 ns のガウシアンパルスを与えた場合の FDTD(2,2), WE-FDTD(2,4),WE-FDTD(2,6) 並列計算により計算した (a) R = 15 m,(b) R = 30 m 離 れた観測点における電界 Ez の時間応答を示す.図 3.16 より,∆s = λ/20 の FDTD(2,2) 法と ∆s = λ/10 の WE-FDTD(2,4) 法では図 3.5 に示した数値分散誤差の周波数特性により,パルス 3.4 大型キャビティの電波伝搬解析への応用 95 の波形が崩れ,これが伝搬距離によりさらに大きくなることが確認される. 図 3.17 に 100 ns 後の各方法により計算した電界 |Ez | の空間分布を示す.FDTD(2,2) 法ではセ ルサイズ ∆s = 0.01 m,クーラン数 0.5,WE-FDTD(2,4) 法ではセルサイズ ∆s = 0.01 m,クーラ ン数 0.05,WE-FDTD(2,6) 法ではセルサイズ ∆s = 0.02 m,クーラン数 0.05 である.FDTD(2,2) 法では数値分散によりパルスの波形がやや崩れているが,WE-FDTD(2,4) 法や WE-FDTD(2,4) 法では正確にパルス伝搬を計算できていることが確認される. 図 3.18 に,波源に図 3.13 に示す半値幅 0.6 ns のガウシアンパルスを与えた場合の FDTD(2,2), WE-FDTD(2,4),WE-FDTD(2,6) 並列計算により計算した電界 Ez の解析領域内の空間分布を示 す.図 3.18 は,FDTD(2,2) 法ではセルサイズ ∆s = 0.015 m,クーラン数 0.5,WE-FDTD(2,4) 法ではセルサイズ ∆s = 0.015 m,クーラン数 0.05,WE-FDTD(2,6) 法ではセルサイズ ∆s = 0.03 m,クーラン数 0.05 と,セルサイズ ∆s を波長に比べ 1/2 や 1/4 という大きな値とした場合の結 果である.図 3.18 より,FDTD(2,2) 法では数値分散誤差によりパルスの形が大きく崩れているこ とが分かる.WE-FDTD(2,4) 法や WE-FDTD(2,6) 法のように,高次な方法ほど数値分散が軽減 できることが確認できる.特に,WE-FDTD(2,6) 法ではセルサイズを ∆s = 0.03 m と大きく取っ た場合でも WE-FDTD(2,4) 法より精度よく計算できることが分かる. 図 3.19 に図 3.17,3.18 において,y = 7.5 m における電界 |Ez | の分布を示す.図 3.19 (a) が f = 1 GHz の正弦波,(b) が半値幅 0.6 ns のガウシアンパルス,(c) が半値幅 0.16 ns のガウシ アンパルスである.図 3.19 より,FDTD (2,2) 法では WE-FDTD (2,4),WE-FDTD (2,6) に比 べ数値分散による位相誤差が生じており,特に,図 3.19 (a) では FDTD(2,2) 法では数値分散誤差 により振幅が大きく異なる.また,図 3.19 (c) では WE-FDTD (2,4) 法でも数値分散誤差が見ら れ,WE-FDTD (2,6) 法では WE-FDTD (2,4) 法よりセルサイズを 2 倍大きくしても,WE-FDTD (2,4) 法より正確に計算できることが分かる. 96 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 0.15 electric field Ez [V/m] 0.10 FDTD(2,2) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/10 WE-FDTD(2,6) ∆s=λ/10 exact 0.05 0.00 -0.05 -0.10 54.0 54.5 55.0 time [ns] 55.5 56.0 105.5 106.0 (a) 0.10 0.08 electric field Ez [V/m] 0.06 FDTD(2,2) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/10 WE-FDTD(2,6) ∆s=λ/10 exact 0.04 0.02 0.00 -0.02 -0.04 -0.06 -0.08 104.0 104.5 105.0 time [ns] (b) 図 3.15 高次 FDTD および WE-FDTD 並列計算による観測点における電界 Ez の時間応答(CW: f = 1 GHz ) (a) R = 15 m (50 λ) (b) R = 30 m (100 λ) 97 3.4 大型キャビティの電波伝搬解析への応用 0.04 0.03 electric field Ez [V/m] 0.02 0.01 0.00 -0.01 FDTD(2,2) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/10 WE-FDTD(2,6) ∆s=λ/10 exact -0.02 -0.03 -0.04 -0.05 -0.06 52.0 52.5 53.0 53.5 time [ns] 54.0 54.5 55.0 (a) 0.03 electric field Ez [V/m] 0.02 0.01 0.00 -0.01 FDTD(2,2) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/20 WE-FDTD(2,4) ∆s=λ/10 WE-FDTD(2,6) ∆s=λ/10 exact -0.02 -0.03 -0.04 102.0 102.5 103.0 103.5 time [ns] 104.0 104.5 105.0 (b) 図 3.16 高次 FDTD および WE-FDTD 並列計算による観測点における電界 Ez の時間応答(ガウシア ンパルス: f−10dB = 1.33 GHz) (a) R = 15 m (67λ) (b) R = 30 m (133λ) 98 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 (a) (b) (c) 図 3.17 高次 FDTD および WE-FDTD 並列計算による t = 100 ns 後の電界 |Ez | の空間分布(ガウシ アンパルス: f−10dB = 1.33 GHz) (a) FDTD(2,2) (b) WE-FDTD(2,4) (b) WE-FDTD(2,6) 99 3.4 大型キャビティの電波伝搬解析への応用 (a) (b) (c) 図 3.18 高次 FDTD および WE-FDTD 並列計算による t = 100 ns 後の電界 |Ez | の空間分布(ガウシ アンパルス: f−10dB = 5.33 GHz) (a) FDTD(2,2) (b) WE-FDTD(2,4) (b) WE-FDTD(2,6) 100 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 0.20 FDTD(2,2) electric field |Ez| [V/m] WE-FDTD(2,4) WE-FDTD(2,6) 0.15 0.10 0.05 0.00 30 31 32 33 34 x [m] 35 36 37 38 (a) 0.07 FDTD(2,2) electric field Ez [V/m] 0.06 WE-FDTD(2,4) WE-FDTD(2,6) 0.05 0.04 0.03 0.02 0.01 0.00 30 32 34 36 38 40 x [m] (b) 0.08 electric field |Ez| [V/m] 0.07 FDTD(2,2) WE-FDTD(2,4) 0.06 WE-FDTD(2,6) 0.05 0.04 0.03 0.02 0.01 0.00 10 15 20 25 x [m] 30 35 40 (c) 図 3.19 高次 FDTD および WE-FDTD 並列計算による t = 100 ns 後の y = 7.5 m における電界 |Ez | (a) CW (1GHz) (b) ガウシアンパルス(f−10dB = 1.33 GHz) (c) ガウシアンパルス(f−10dB = 5.33 GHz) 3.5 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 101 3.5 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 3.5.1 3 次元高次 FDTD 法および WE-FDTD 法 TM 波における高次 FDTD 法および WE-FDTD 法は,式 (3.3)∼(3.5),式 (3.14)∼(3.17) に示 したが,ここでは 3 次元における高次 FDTD および WE-FDTD 法について,差分方程式と数値 分散誤差について述べる. 3.5.1.1 FDTD(2,4) 3 次元における FDTD(2,4) 法は,式 (1.1),(1.2) を式 (3.30) の空間 4 次精度中心差分と式 (1.4) の時間 2 次精度中心差分より差分方程式に変換する. 9 ∂F (i, j, k, t) = · F n (i + 12 , j, k) − F n (i − 12 , j, k) ∂x 8∆x 1 − · F n (i + 32 , j, k) − F n (i − 32 , j, k) + O(∆x4 ) 24∆x (3.30) これより,FDTD (2,4) 法の差分方程式は,式 (3.31)∼(3.36) のように書くことができる.ここで, 式 (3.31)∼(3.36) の Cn (i, j) は,解析空間の媒質定数 ε(i, j),µ(i, j),σ(i, j) やセルサイズ ∆s,時 間ステップ ∆t からなる式 (3.37) で表される定数である. Exn+1 (i + 1 , j, k) 2 = C1 (i, j, k) · Exn (i + C3 (i, j, k) · − − + + 1 , j, k) 2 1 1 n n+1 − C2 (i, j, k) · Jx (i + 2 , j, k) + Jx (i + 2 , j, k) 1 1 n+ n+ 9 1 1 1 1 Hz 2 (i + 2 , j + 2 , k) − Hz 2 (i + 2 , j − 2 , k) 8∆y 1 1 n+ n+ 1 1 3 1 3 2 2 (i + 2 , j + 2 , k) − Hz (i + 2 , j − 2 , k) Hz 24∆y 1 1 n+ n+ 9 1 1 1 1 2 2 Hy (i + 2 , j, k + 2 ) − Hy (i + 2 , j, k − 2 ) 8∆z 1 1 n+ n+ 1 Hy 2 (i + 12 , j, k + 32 ) − Hy 2 (i + 12 , j, k − 32 ) 24∆z (3.31) 102 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 Eyn+1 (i, j + 1 , k) 2 = C1 (i, j, k) · Eyn (i, j + 1 , k) 2 1 1 n n+1 − C2 (i, j, k) · Jy (i, j + 2 , k) + Jy (i, j + 2 , k) 1 1 n+ n+ 9 1 1 1 1 Hx 2 (i, j + 2 , k + 2 ) − Hx 2 (i, j + 2 , k − 2 ) 8∆z 1 1 n+ n+ 1 1 3 1 3 2 2 Hx (i, j + 2 , k + 2 ) − Hx (i, j + 2 , k − 2 ) 24∆y 1 1 n+ n+ 9 1 1 1 1 2 2 (i + 2 , j + 2 , k) − Hz (i − 2 , j + 2 , k) Hz 8∆z 1 1 n+ n+ 1 Hz 2 (i + 32 , j + 12 , k) − Hz 2 (i − 32 , j + 12 , k) 24∆x + C3 (i, j, k) · − − + (3.32) Ezn+1 (i, j, k + 1 ) 2 = C1 (i, j, k) · Ezn (i, j, k + C3 (i, j, k) · − − + + 1 ) 2 1 1 n n+1 − C2 (i, j, k) · Jz (i, j, k + 2 ) + Jz (i, j, k + 2 ) 1 1 n+ n+ 9 1 1 1 1 2 2 Hy (i + 2 , j, k + 2 ) − Hy (i − 2 , j, k + 2 ) 8∆y 1 1 n+ n+ 1 3 1 3 1 2 2 (i + 2 , j, k + 2 ) − Hy (i − 2 , j, k + 2 ) Hy 24∆x 1 1 n+ n+ 9 1 1 1 1 Hx 2 (i, j + 2 , k + 2 ) − Hx 2 (i, j − 2 , k + 2 ) 8∆y 1 1 n+ n+ 1 3 1 3 1 Hx 2 (i, j + 2 , k + 2 ) − Hx 2 (i, j − 2 , k + 2 ) 24∆x (3.33) n+ Hx 1 2 n− (i, j + 12 , k + 12 ) = Hx 1 2 (i, j + 12 , k + 12 ) 9 n 1 1 Ez (i, j + 1, k + 2 ) − Ezn (i, j, k + 2 ) + C4 (i, j, k) · 8∆y 1 n 1 1 Ez (i, j + 2, k + 2 ) − Ezn (i, j − 1, k + 2 ) − 24∆y 9 n 1 1 n Ey (i, j + 2 , k + 1) − Ey (i, j + 2 , k) − 8∆z 1 + (3.34) Eyn (i, j + 12 , k + 2) − Eyn (i, j + 12 , k − 1) 24∆z 3.5 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 1 n+ 2 Hy (i n+ Hz 1 2 + 1 , j, k 2 + 1 ) 2 103 1 n− 2 Hy (i + 12 , j, k + 12 ) 9 n 1 1 n Ex (i + 2 , j, k + 1) − Ex (i + 2 , j, k) + C4 (i, j, k) · 8∆z 1 n 1 1 n − Ex (i + 2 , j, k + 2) − Ex (i + 2 , j, k − 1) 24∆z 9 n 1 1 n Ez (i + 1, j, k + 2 ) − Ez (i, j, k + 2 ) − 8∆x 1 (3.35) + Ezn (i + 2, j, k + 12 ) − Ezn (i − 1, j, k + 12 ) 24∆x = n− (i + 12 , j + 12 , k) = Hy 1 2 (i + 12 , j + 12 , k) 9 n 1 1 n + C4 (i, j, k) · Ey (i + 1, i + 2 , k) − Ey (i, i + 2 , k) 8∆x 1 n 1 1 n − Ey (i + 2, j + 2 , k) − Ey (i − 1, j + 2 , k) 24∆z 9 n 1 1 n − Ex (i + 2 , j + 1, k) − Ex (i + 2 , j, k) 8∆y 1 + (3.36) Exn (i + 12 , j + 2, k) − Exn (i + 12 , j − 1, k) 24∆y ⎧ 2 ε(i, j, k) − σ(i, j, k) ∆t ⎪ ⎪ C1 (i, j, k) = ⎪ ⎪ ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ∆t ⎪ ⎪ ⎪ ⎨ C2 (i, j, k) = 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ 2 ∆t ⎪ ⎪ C3 (i, j, k) = ⎪ ⎪ ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ∆t ⎪ ⎪ ⎩ C4 (i, j, k) = µ(i, j, k) (3.37) 式 (3.31)∼(3.36) から分かるように,FDTD(2,4) 法は式 (1.5)∼(1.10) の FDTD (2,2) 法に比べ 時間 1 ステップ 1 セルあたりの浮動小数点演算数は増加する. 104 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 3.5.1.2 WE-FDTD(2,2) 3 次元 WE-FDTD(2,2) 法は,式 (2.10) の波動方程式を,式 (3.38) の 2 階偏微分の空間 2 次精 度中心差分,式 (2.13) の時間 2 次精度中心差分により差分方程式に変換する. ∂F 2 (i, j, k, t) 1 n n n F = (i + 1, j, k) − 2F (i + 1, j, k) + F (i − 1, j, k) + O(∆x2 ) ∂x2 ∆x2 (3.38) 式 (2.10) の波動方程式は,電界の各成分 Ex ,Ey ,Ez で表すと,式 (3.39)∼(3.41) のようになる. 1 ∂ 2 Ex 1 ∂Jx σ ∂Ex − + = − ∂t2 ε ∂t ε ∂t εµ 1 1 ∂Jy σ ∂Ey ∂ 2 Ey − + = − ∂t2 ε ∂t ε ∂t εµ 1 1 ∂Jz σ ∂Ez ∂ 2 Ez − + = − ∂t2 ε ∂t ε ∂t εµ ∂ 2 Ex ∂ 2 Ex ∂ + − ∂y 2 ∂z 2 ∂x ∂ 2 Ey ∂ 2 Ey ∂ + − ∂z 2 ∂x2 ∂y ∂ 2 Ez ∂ 2 Ez ∂ + − ∂x2 ∂y 2 ∂z ∂Ey ∂Ez + ∂y ∂z ∂Ez ∂Ex + ∂z ∂x ∂Ex ∂Ey + ∂x ∂y (3.39) (3.40) (3.41) 式 (3.39)∼(3.41) の電界の各成分を差分方程式に変換すると,WE-FDTD (2,2) 法の差分方程式は 式 (3.42) ∼(3.44) のようになる.ここで,式 (3.42) ∼(3.44) の係数 Cn は式 (3.45) で表される. Exn+1 (i, j, k) = C1 (i, j, k) · Exn (i, j, k) − C2 (i, j, k) · Exn−1 (i, j, k) n n+1 − C3 (i, j, k) · Jx (i, j, k) + Jx (i, j, k) 1 n n n + C4 (i, j, k) · Ex (i, j + 1, k) − 2Ex (i, j, k) + Ex (i, j − 1, k) ∆y 2 1 n n n + Ex (i, j, k + 1) − 2Ex (i, j, k) + Ex (i, j, k − 1) ∆z 2 1 n n n n + Ey (i + 1, j + 1, k) − Ey (i, j + 1, k) − Ey (i + 1, j, k) + Ey (i, j, k) ∆x∆y 1 + (3.42) Ezn (i + 1, j, k + 1) − Ezn (i, j, k + 1) − Ezn (i + 1, j, k) + Ezn (i, j, k) ∆x∆z 3.5 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 105 Eyn+1 (i, j, k) = C1 (i, j, k) · Eyn (i, j, k) − C2 (i, j, k) · Eyn−1 (i, j, k) n n+1 − C3 (i, j, k) · Jy (i, j, k) + Jy (i, j, k) 1 n n n + C4 (i, j, k) · Ey (i + 1, j, k) − 2Ey (i, j, k) + Ey (i − 1, j, k) ∆x2 1 n n n + Ey (i, j, k + 1) − 2Ey (i, j, k) + Ey (i, j, k − 1) ∆z 2 1 n n n n + Ex (i + 1, j + 1, k) − Ex (i + 1, j, k) − Ex (i, j + 1, k) + Ex (i, j, k) ∆x∆y 1 + Ezn (i, j + 1, k + 1) − Ezn (i, j, k + 1) − Ezn (i, j + 1, k) + Ezn (i, j, k) ∆y∆z (3.43) Ezn+1 (i, j, k) = C1 (i, j, k) · Ezn (i, j, k) − C2 (i, j, k) · Ezn−1 (i, j, k) n n+1 − C3 (i, j, k) · Jy (i, j, k) + Jy (i, j, k) 1 n n n + C4 (i, j, k) · Ez (i + 1, j, k) − 2Ez (i, j, k) + Ez (i − 1, j, k) ∆x2 1 n n n + Ez (i, j, k + 1) − 2Ez (i, j, k) + Ez (i, j, k − 1) ∆z 2 1 n n n n + Ex (i + 1, j, k + 1) − Ex (i + 1, j, k) − Ex (i, j, k + 1) + Ex (i, j, k) ∆x∆z 1 n n n n + Ey (i, j + 1, k + 1) − Ey (i, j + 1, k) − Ey (i, j, k + 1) + Ey (i, j, k) ∆y∆z ⎧ 4 ε(i, j, k) ⎪ ⎪ C (i, j, k) = ⎪ 1 ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 2 ε(i, j, k) − σ(i, j, k) ∆t ⎪ ⎪ (i, j, k) = C ⎪ 2 ⎨ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ∆t ⎪ ⎪ (i, j, k) = C ⎪ 3 ⎪ ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ∆t2 2 ∆t ⎪ ⎪ ⎩ C3 (i, j, k) = 2 ε(i, j, k) + σ(i, j, k) ∆t ε(i, j, k) + µ(i, j, k) (3.44) (3.45) TM 波の場合には,WE-FDTD (2,2) 法は,FDTD(2,2) 法に比べ計算量が少なくなるが,3 次元 においては WE-FDTD(2,2) 法の法が計算量が増大する.これは,TM 波の場合では 1 成分の電界 Ez だけを計算すればよいが,3 次元では Ex ,Ey ,Ez の 3 成分の電界を計算する必要があること 106 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 や,TM 波では式 (2.10) に示した波動方程式の ∇2E − ∇(∇ · E ) の項が式 (2.11) のように簡単に なるが,3 次元では式 (3.39)∼(3.41) に示したように計算量が増加するためである.これらのこと から,3 次元の計算においては,FDTD 法の方が計算量が少なくなる. 3.5.1.3 WE-FDTD(2,4) WE-FDTD(2,4) 法では,式 (2.10) の波動方程式から求められる式 (3.39)∼(3.41) の電界の各成 分を,式 (3.46) の 2 階偏微分の空間 4 次精度中心差分により差分方程式に変換する. ∂F 2 (i, j, k, t) 1 − (F n (i + 2, j, k) + F n (i − 2, j, k)) = ∂x2 12∆x2 + 16 (F n (i + 1, j, k) + F n (i − 1, j, k)) − 30 F n (i, j, k) + O(∆x4 ) (3.46) これより,WE-FDTD(2,4) 法における各電界の差分方程式は,式 (3.47) ∼(3.49) のようになる. ここで,式 (3.47) ∼(3.49) の係数 Cn は式 (3.50) で表される. Exn+1 (i, j, k) = C1 (i, j, k) · Exn (i, j, k) − C2 (i, j, k) · Exn−1 (i, j, k) n n+1 − C3 (i, j, k) · Jx (i, j, k) + Jx (i, j, k) 1 + C4 (i, j, k) · − Exn (i + 1, j + 2, k) + 16Exn (i + 1, j + 1, k) 2 12∆y − + 1, j, k) + + 1, j − 1, k) − + 1, j − 2, k) 1 + − Exn (i + 1, j, k + 2) + 16Exn (i + 1, j, k + 1) 12∆z 2 − 30Exn (i + 1, j, k) + 16Exn (i + 1, j, k − 1) − Exn (i + 1, j, k − 2) 30Exn (i 16Exn (i Exn (i 1 + 27 27Eyn (i + 1, j + 1, k) − 27Eyn (i, j + 1, k) − Eyn (i + 2, j + 1, k) + Eyn (i − 1, j + 1, k) 576∆x∆y − 27 27Eyn (i + 1, j − 1, k) − 27Eyn (i, j − 1, k) − Eyn (i + 2, j − 1, k) + Eyn (i − 1, j − 1, k) − 27Eyn (i + 1, j + 2, k) − 27Eyn (i, j + 2, k) − Eyn (i + 2, j + 2, k) + Eyn (i − 1, j + 2, k) + 27Eyn (i + 1, j − 2, k) − 27Eyn (i, j − 2, k) − Eyn (i + 2, j − 2, k) + Eyn (i − 1, j − 2, k) 107 3.5 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 1 + 27 27Ezn (i + 1, j, k + 1) − 27Ezn (i, j, k + 1) − Ezn (i + 2, j, k + 1) + Ezn (i − 1, j, k + 1) 576∆x∆y − 27 27Ezn (i + 1, j, k − 1) − 27Ezn (i, j, k − 1) − Ezn (i + 2, j, k − 1) + Ezn (i − 1, j, k − 1) − 27Ezn (i + 1, j, k + 2) − 27Ezn (i, j, k + 2) − Ezn (i + 2, j, k + 2) + Ezn (i − 1, j, k + 2) + 27Ezn (i + 1, j, k − 2) − 27Ezn (i, j, k − 2) − Ezn (i + 2, j, k − 2) + Ezn (i − 1, j, k − 2) (3.47) Eyn+1 (i, j, k) = C1 (i, j, k) · Eyn (i, j, k) − C2 (i, j, k) · Eyn−1 (i, j, k) n n+1 − C3 (i, j, k) · Jx (i, j, k) + Jx (i, j, k) 1 + C4 (i, j, k) · − Eyn (i + 2, j + 1, k) + 16Eyn (i + 1, j + 1, k) 12∆x2 − + 1, k) + − 1, j + 1, k) − − 2, j + 1, k) 1 + − Eyn (i, j + 1, k + 2) + 16Eyn (i, j + 1, k + 1) 12∆z 2 30Eyn (i, j 16Eyn (i Eyn (i − 30Eyn (i, j + 1, k) + 16Eyn (i, j + 1, k − 1) − Eyn (i, j + 1, k − 2) 1 + 27 27Exn (i + 1, j + 1, k) − 27Exn (i + 1, j, k) − Exn (i + 1, j + 2, k) + Exn (i + 1, j − 1, k) 576∆x∆y − 27 27Exn (i − 1, j + 1, k) − 27Exn (i − 1, j, k) − Exn (i − 1, j + 2, k) + Exn (i − 1, j − 1, k) − 27Exn (i + 2, j + 1, k) − 27Exn (i + 2, j, k) − Exn (i + 2, j + 2, k) + Exn (i + 2, j − 1, k) + + − 2, j + 1, k) − − 2, j, k) − − 2, j + 2, k) + − 2, j − 1, k) 27 27Ezn (i, j + 1, k + 1) − 27Ezn (i, j, k + 1) − Ezn (i, j + 2, k + 1) + Ezn (i, j − 1, k + 1) 27Exn (i 27Exn (i Exn (i Exn (i 1 576∆y∆z − 27 27Ezn (i, j + 1, k − 1) − 27Ezn (i, j, k − 1) − Ezn (i, j + 2, k − 1) + Ezn (i, j − 1, k − 1) − 27Ezn (i, j + 1, k + 2) − 27Ezn (i, j, k + 2) − Ezn (i, j + 2, k + 2) + Ezn (i, j − 1, k + 2) + 27Ezn (i, j + 1, k − 2) − 27Ezn (i, j, k − 2) − Ezn (i, j + 2, k − 2) + Ezn (i, j − 1, k − 2) (3.48) 108 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 Ezn+1 (i, j, k) = C1 (i, j, k) · Ezn (i, j, k) − C2 (i, j, k) · Ezn−1 (i, j, k) n n+1 − C3 (i, j, k) · Jx (i, j, k) + Jx (i, j, k) 1 + C4 (i, j, k) · − Ezn (i + 2, j, k + 1) + 16Ezn (i + 1, j, k + 1) 12∆x2 − − 1, j, k + 1) − + 1) + 1 + 12∆y 2 − Ezn (i, j + 2, k + 1) + 16Ezn (i, j + 1, k + 1) 16Ezn (i Ezn (i − 2, j, k + 1) 30Ezn (i, j, k − 30Ezn (i, j, k + 1) + 16Ezn (i, j − 1, k + 1) − Ezn (i, j − 2, k + 1) 1 + 27 27Exn (i + 1, j, k + 1) − 27Exn (i + 1, j, k) − Exn (i + 1, j, k + 2) + Exn (i + 1, j, k − 1) 576∆x∆z − 27 27Exn (i − 1, j, k + 1) − 27Exn (i − 1, j, k) − Exn (i − 1, j, k + 2) + Exn (i − 1, j, k − 1) − 27Exn (i + 2, j, k + 1) − 27Exn (i + 2, j, k) − Exn (i + 2, j, k + 2) + Exn (i + 2, j, k − 1) + + − 2, j, k + 1) − − 2, j, k) − − 2, j, k + 2) + − 2, j, k − 1) 27 27Eyn (i, j + 1, k + 1) − 27Eyn (i, j + 1, k) − Eyn (i, j + 1, k + 2) + Eyn (i, j + 1, k − 1) 27Exn (i 27Exn (i Exn (i Exn (i 1 576∆y∆z − 27 27Eyn (i, j − 1, k + 1) − 27Eyn (i, j − 1, k) − Eyn (i, j − 1, k + 2) + Eyn (i, j − 1, k − 1) − 27Eyn (i, j + 2, k + 1) − 27Eyn (i, j + 2, k) − Eyn (i, j + 2, k + 2) + Eyn (i, j + 2, k − 1) + 27Eyn (i, j − 2, k + 1) − 27Eyn (i, j − 2, k) − Eyn (i, j − 2, k + 2) + Eyn (i, j − 2, k − 1) ⎧ 4 ε(i, j, k) ⎪ ⎪ C (i, j, k) = ⎪ 1 ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 2 ε(i, j, k) − σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎨ C2 (i, j, k) = 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ∆t ⎪ ⎪ C3 (i, j, k) = ⎪ ⎪ ⎪ 2 ε(i, j, k) + σ(i, j, k) ∆t ⎪ ⎪ ⎪ ⎪ ⎪ ∆t2 2 ∆t ⎪ ⎪ C (i, j, k) = ⎩ 3 2 ε(i, j, k) + σ(i, j, k) ∆t ε(i, j, k) + µ(i, j, k) (3.49) (3.50) 式 (3.47) ∼(3.49) に示したように,3 次元においては,WE-FDTD(2,4) 法は FDTD(2,4) 法に 比べ計算量が非常に多くなるため,3 次元においては FDTD 法を用いることとする. 109 3.5 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 3.5.2 数値分散誤差 ここで,3 次元解析における数値分散誤差を議論するために,2 次元の場合と同様に分散関係 式を求め,各方法の数値分散誤差を計算する.3 次元における FDTD(2,2),FDTD(2,4), WE- FDTD(2,2),WE-FDTD(2,4) の分散関係式は,それぞれ 式 (3.51)∼(3.54) のように求めることが できる. 1 sin c∆t ω∆t 2 2 1 sin = ∆x k̃x ∆x 2 2 1 sin + ∆y k̃y ∆y 2 2 1 sin + ∆z k̃z ∆z 2 2 (3.51) 1 c∆t 2 1 sin c∆t ω∆t 2 2 2 k̃x ∆x 3k̃x ∆x 1 9 1 sin sin = − ∆x 8 2 24 2 2 1 1 9 k̃y ∆y 3k̃y ∆y − + sin sin ∆y 8 2 24 2 2 k̃z ∆z 1 3k̃z ∆z 1 9 sin − sin + ∆z 8 2 24 2 cos(k̃x ∆x) − 1 cos(k̃y ∆y) − 1 cos(k̃z ∆z) − 1 cos(ω∆t) − 1 = + + ∆x2 ∆y 2 ∆z 2 1 c∆t 2 (3.52) (3.53) − cos(2k̃x ∆x) + 16 cos(k̃x ∆x) − 30 cos(ω∆t) − 1 = 12∆x2 − cos(2k̃y ∆y) + 16 cos(k̃y ∆y) − 30 12∆y 2 − cos(2k̃z ∆z) + 16 cos(k̃z ∆z) − 30 + 12∆z 2 + (3.54) ここで,k̃ は数値的波数であり,θ を z 軸とのなす角,φ を x 軸とのなす角とすると,k̃x = k̃ sin θ cos φ,k̃y = k̃ sin θ sin φ,k̃z = k̃ cos θ で表される. 図 3.20 に式 (3.51)∼(3.54) の分散関係式から求めた各方法の数値分散誤差特性を示す.図 3.20 の結果より,3 次元においても FDTD 法と WE-FDTD 法は同程度の精度であることが分かる.図 3.20 は,2 次元の結果の図 3.2 と同様の特性を示す. 110 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 absolute dispersion error [deg./λ] 102 FDTD(2,2) WE-FDTD(2,2) FDTD(2,4) WE-FDTD(2,4) 101 0 10 10-1 -2 10 10-3 0 20 40 60 80 100 cells / λ (a) absolute dispersion error [deg./λ] 10 FDTD(2,2) WE-FDTD(2,2) FDTD(2,4) WE-FDTD(2,4) 1 0.1 0 10 20 30 40 50 60 70 80 90 propagation angle φ [deg.] (b) absolute dispersion error [deg./λ] 101 100 10-1 -2 10 -3 10 FDTD(2,2) WE-FDTD(2,2) FDTD(2,4) WE-FDTD(2,4) -4 10 0.001 0.01 0.1 courant number c ∆t/∆s 1 (c) 図 3.20 3 次元における 2 次および 4 次精度の FDTD および WE-FDTD 法の数値分散誤差 (a) セル サイズ ∆s (クーラン数=0.3,θ = 90◦ ,φ = 0◦ )(b) 伝搬角 φ (クーラン数=0.3,∆s = λ/10,θ = 90◦ ) (c) クーラン数(∆s = λ/10,θ = 90◦ ,φ = 0◦ ) 111 3.5 3 次元における高次 FDTD 法および WE-FDTD 法と数値分散誤差特性 absolute dispersion error [deg.] 10000 FDTD(2,2), ∆s=λ/10 FDTD(2,2), ∆s=λ/20 FDTD(2,4), ∆s=λ/10 FDTD(2,4), ∆s=λ/20 1000 100 10 1 0.1 1 10 100 propagation distance λ 1000 図 3.21 高次 FDTD および WE-FDTD 法における伝搬距離による数値分散誤差の蓄積(クーラン数 0.3) 図 3.20 の結果から計算した伝搬距離の増加による数値分散誤差の蓄積を図 3.21 に示す.図 3.21 より,一般に知られているようにセルサイズを 波長 λ の 1/10 とすると,FDTD 法では 30λ の伝 搬により 167◦ の数値分散誤差を生じ位相がほぼ反転する.FDTD(2,4) 法ではセルサイズ ∆s を λ/10 としても 1 波長伝搬あたり 0.3◦ の数値分散誤差が生じ,30λ の伝搬においても 8.3◦ の数値 分散誤差が生じる.FDTD (2,2) 法を用いて FDTD (2,4) 法と同程度の精度で解析を行うにはセル サイズ ∆s を λ/44 にする必要があり,総セル数は FDTD (2,4) 法の約 88 倍必要になる.このこ とから,FDTD (2,4) 法は 3 次元においても大規模な電波伝搬解析を低コストで解析できる. 図 3.22 に実際の FDTD 法の計算において生じる数値分散誤差を示す.図 3.22 は,f = 1 GHz の正弦波の伝搬であり,(a) は伝搬距離 R = 15λ,(b) は R = 30λ の観測点における電界の時間応 答波形である.図 3.21 において,伝搬距離に比例した数値分散誤差が生じ,R = 30λ の伝搬によ り FDTD (2,2) 法では位相がほぼ反転することを示したが,図 3.22 より実際の計算においてもこ の数値分散誤差が確認される.ここで,解析解は式 (3.55) [118] を用いた. 1 E (rr , t) = 4πε0 1 t 1 j(τ − r/c) dτ + 2 j(τ − r/c) (2 cos θ er + sin θ eθ ) r 3 −∞ cr 1 ∂j(τ − r/c) + 2 sin θ eθ ) cr ∂t (3.55) 112 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 6.0 FDTD(2,2) FDTD(2,4) exact electric field Ey [V/m] 4.0 2.0 0.0 -2.0 -4.0 -6.0 18.0 18.5 19.0 19.5 20.0 20.5 21.0 21.5 22.0 time [ns] (a) 3.0 FDTD(2,2) FDTD(2,4) exact electric field Ey [V/m] 2.0 1.0 0.0 -1.0 -2.0 -3.0 32.0 32.5 33.0 33.5 34.0 time [ns] 34.5 35.0 35.5 36.0 (b) 図 3.22 3 次元高次 FDTD 法において伝搬距離により生じる数値分散誤差の実際 (∆s = λ/10) (a) R = 15λ (b) R = 30λ 3.6 PC クラスタを用いた 3 次元高次 FDTD 法および WE-FDTD 法の並列計算 113 表 3.7 160 × 160× 160 セルのキャビティモデルとパラメータ model cavity Boundary condition PEC (Perfectly Electrically Conductor) total cells 160 × 160 × 160 source point current source (gaussian pulse) f−10dB , λ 1.32 GHz, λ=0.23 m space increment ∆s (=∆x=∆y=∆x) = 0.01 m ( λ/20) time increment ∆t = 0.01 ns (courant number = 0.3) time step 5000 3.5.3 マルチパスによる長距離伝搬で生じる数値分散誤差の実際 実際の室内環境のようなマルチパス環境下での FDTD 法の数値分散誤差の影響を検討するため に,表 3.7 に示した周囲を完全導体で囲まれたキャビティを考える.図 3.23 に波源から 0.5 m 離 れた観測点における電界 Ez の時間応答を示す.図 3.23 (a) は,セルサイズ ∆s = λ/12 とした場 合の FDTD(2,2) 法および FDTD(2,4) 並列計算による図 3.13 に示したガウシアンパルス(半値幅 = 0.6 ns,f−10dB = 1.32 GHz)の伝搬における計算結果であるが,伝搬時間が長いほど,すなわち 伝搬距離が大きくなるほど FDTD(2,2) 法では数値分散誤差が生じることが分かる.また,図 3.23 (b) は,波源を f = 1 GHz の正弦波とした場合のセルサイズ ∆s = λ/20 とした場合の FDTD(2,2) 法および FDTD(2,4) 法の計算結果であるが,正弦波のような連続波ではマルチパスによる長距離 伝搬の影響が大きくなることが分かる.これは,ガウシアンパルスは出力の低い高周波分の影響が 出るため数値分散誤差は低くなるが,連続波では出力の大きい周波数の影響が出るためである. 3.6 PC クラスタを用いた 3 次元高次 FDTD 法および WE-FDTD 法の並列計算 3.6.1 3 次元における並列計算とそのコスト 高次 FDTD 法および WE-FDTD 法を用いて大規模な領域の電波伝搬解析を行う場合には,よ り多くのメモリを使用するため,また,これを高速に計算するために並列計算が必要になる.本論 文では,複数台の 計算機 をネットワーク接続する分散メモリ型並列計算環境である PC クラスタ を用いた FDTD (2,4) 法の並列計算を行う. 114 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 0.003 FDTD(2,2) FDTD(2,4) electric field Ez [V/m] 0.002 0.001 0.000 -0.001 -0.002 -0.003 0 10 20 30 40 50 time [ns] (a) 0.008 FDTD(2,2) FDTD(2,4) 0.006 electric field Ez [V/m] 0.004 0.002 0.000 -0.002 -0.004 -0.006 -0.008 0 5 10 15 20 25 30 35 40 45 50 time [ns] (b) 図 3.23 マルチパス環境化により生じる数値分散誤差 (a) ガウシアンパルス (b) 正弦波 f = 1 GHz 115 3.6 PC クラスタを用いた 3 次元高次 FDTD 法および WE-FDTD 法の並列計算 PC: p-1 PC: p PC: p+1 N N N/n z y x Hy Hz Ey Ez Hy Hz Ey Ez (a) PC: p-1 PC: p PC: p+1 N N N/n z Ey Ez Hy x2 Hz x2 Ey x2 Ez x2 Hy Hz y x Ey x2 Ez x2 Hy Hz Ey Ez Hy x2 Hz x2 (b) 図 3.24 3 次元 FDTD 並列計算における計算機間の電磁界の送受信 (a) FDTD(2,2) (b) FDTD(2,4) 表 3.8 3 次元高次 FDTD 法および WE-FDTD 並列計算の計算コスト calc [flop/(step · cell)] E H total comm [/step] E H 2 2N total 2 4N 2 FDTD (2,2) 75 21 96 2N FDTD (2,4) 102 48 150 6N 2 6N 2 12N 2 WE-FDTD (2,2) 171 – 171 7N 2 – 7N 2 WE-FDTD (2,4) 354 – 354 21N 2 – 21N 2 PC クラスタのような分散メモリ型並列計算機を用いて並列計算を行う場合には,各プロセッサ 間で相互にデータ通信が必要になる.ここで,N × N × N の解析領域を n 台の 計算機 で並列計 算することを考え,また,並列計算の領域分割法として図 3.24 に示すような yz 平面の分割を考え る.FDTD (2,4) 法の並列計算では,例えば,p 番目の 計算機 における電界 Ey の計算では,p − 1 番目の 計算機 がもつ磁界 Hz と p + 1 番目の 計算機 がもつ磁界 Hz を必要とするため,計算機 間 116 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 で 3N 2 個の磁界 Hz の送受信を行う.同様に,電界 Ez の計算では 3N 2 個の磁界 Hy ,磁界 Hy の計算では 3N 2 個の電界 Ez ,磁界 Hz の計算では 3N 2 個の電界 Ey を必要とするため,図 3.24 (b) に示すように 計算機間で計 12N 2 個の電磁界の送受信が必要になる.以上のように,FDTD (2,4) 法の並列計算では,図 3.24 (a) に示す FDTD (2,2) 法に比べデータ通信量が 3 倍増加する. 表 3.8 に並列計算の計算コストを示す.計算量については,時間 1 ステップあたりの浮動小数点 演算数 flop/step で考えると,式 (3.31)∼(3.36) で示したように,FDTD (2,4) 法は FDTD (2,2) 法に比べ約 1.6 倍増加する.通信量については,時間 1 ステップあたりに送受信するセル数を考え れば,FDTD (2,4) 法は FDTD (2,2) 法に比べ約 3 倍増加する.表 3.8 に示すように FDTD (2,4) 法の並列計算では,FDTD (2,2) 法に比べ計算量や通信量がともに増加するが,同程度の精度を 得るのに必要なセル数は前述したしたように約 1/88 に削減できるので,全体としての計算量は約 1/56 程度に減少できる. 3.6.2 PC クラスタにおける FDTD (2,4) 法の並列計算特性 図 3.25 に示す教育用として導入された市販の計算機 (CPU: Pentium 4 3.0 GHz ,メモリ: 512 Mbyte) を 16 台と,2 章で示した CD ブート Linux を用いて構築した並列計算環境において FDTD(2,4) 並列計算を行った.図 3.26 に教育用計算機を用いた FDTD (2,4) 並列計算の計算時間 図 3.25 教育用計算機を用いた PC クラスタ(Pentium 4 3.0 GHz,512 Mbyte × 16 台) 117 3.6 PC クラスタを用いた 3 次元高次 FDTD 法および WE-FDTD 法の並列計算 3500 FDTD (2,2) FDTD (2,4) calculation time [s] 3000 2500 2000 1500 1000 500 0 0 5 10 number of PCs 15 20 図 3.26 PC クラスタにおける FDTD (2,4) 法の並列計算の計算時間 8 FDTD (2,2), 160*170*170 7 FDTD (2,4), 160*170*170 FDTD (2,2), 320*170*170 speed-up ratio 6 FDTD (2,4), 320*170*170 ideal 5 4 3 2 1 0 0 1 2 3 4 5 number of PCs 6 7 8 9 図 3.27 PC クラスタにおける FDTD (2,4) 法の並列計算の速度向上比 を示す.図 3.26 は,FDTD(2,2) 法および FDTD(2,4) 法を用いて解析領域 160 × 170 × 170 を計算 機 1,2,4,8,16 台で並列計算を行った計算時間である.図 3.26 より,FDTD(2,2) 法では計算機 8 台以上,FDTD(2,4) 法では 4 台以上で使用台数を増加すると計算時間も増加する現象が見られ る.これは,全計算量に占める通信量の比が大きくなるためであり,FDTD(2,4) 法は FDTD(2,2) 法に比べ 3 倍の通信量となるので,台数を増加させるごとに通信量の影響が大きくなるためであ 118 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 る.これは通信比を少なくすれば改善でき,解析領域が大きいほど並列計算の効果が得られる.ま た,今回は汎用の 100 Base-T ネットワークを使用したが,1000 Base-T 等のより高速なネット ワークを用いることにより高い並列計算効率が得られる. 図 3.27 に並列計算における速度向上比を示す.図 3.27 は,解析領域を 160 × 170 × 170 および 320 × 170 × 170 とした場合の FDTD(2,2) 法および FDTD(2,4) 法の速度向上比である.図 3.27 より,通信量の少ない FDTD(2,2) 法の方が速度向上比が大きいことがわかる.また,FDTD(2,2) 法,FDTD(2,4) 法いずれにおいても解析領域が大きいほど速度向上比は大きくなることが分かる. 3.6.3 PC クラスタとスーパーコンピュータの計算コストと計算精度の比較 本研究のような市販の教育用計算機を並列計算に用いるクラスタ型並列計算機の計算精度および 計算コストを検討するために,スーパーコンピュータとの比較を行う.スーパーコンピュータは, 東北大学情報シナジーセンターの NEC 製 SX-7 を用いた.表 3.9 に各々の計算機の仕様を示す. スーパーコンピュータ NEC SX-7 は,総 CPU 数が 240,メモリ 1920 Gbyte の高性能計算機であ るが,設置コストやスペースの問題,共同利用施設であるため使用可能な CPU とメモリの制限, 使用料金が発生する等の欠点がある.これに対して,CD ブート Linux と市販の計算機を用いて構 築する本研究の PC クラスタでは,周囲にある計算機を容易に並列計算に利用することができるた め拡張が容易であり,設置コストは新規に計算機を購入することなく周囲計算機をそのまま使うこ とができるため,超低コストで並列計算を行うことができる等スーパーコンピュータにない利点が ある. スーパーコンピュータと PC クラスタによる FDTD 並列計算の計算精度および計算コストを比 表 3.9 使用するスーパーコンピュータと PC クラスタの仕様 super computer SX-7 our PC cluster (Pentium 4 3.0 GHz × 16) (NEC) (handmade) total CPU 240 16 main memory 1920 Gbyte 8 Gbyte job class max 32 CPU, 256 Gbyte 16 CPU, 8 Gbyte accounting 0.4 Y/sec 0 parallelize auto (sxcc -Pauto ) Message Passing (MPI, mpich-1.2.6) 119 3.6 PC クラスタを用いた 3 次元高次 FDTD 法および WE-FDTD 法の並列計算 0.004 our PC cluster NEC SX-7 0.003 electric field Ez [V/m] 0.002 0.001 0.000 -0.001 -0.002 -0.003 -0.004 0 10 20 30 40 50 time [ns] 図 3.28 スーパーコンピュータと PC クラスタとの FDTD(2,4) 並列計算結果の比較(波源から 0.5 m 離れた観測点における電界 Ez の時間応答) 表 3.10 スーパーコンピュータと PC クラスタによる FDTD 並列計算の計算時間の比較 calculation time [s] architecture FDTD(2,2) FDTD(2,4) NEC SX-7 26.2 40.1 Pentium 4 3.0 GHz × 16 3214.0 14084.7 較するために,周囲を完全導体で囲まれた解析領域 160 × 160 × 160 セルの自由空間における電波 伝搬を計算した.表 3.7 にしめした解析パラメータを用いる.波源は微小ダイポールとし,図 3.13 に示したガウシアンパルス(半値幅 0.6 ns,f−10dB = 1.32 GHz)を用いた.FDTD(2,4) 法におけ るセルサイズ ∆s および時間ステップ ∆t は,それぞれ ∆s = 0.01 m, ∆t = 0.01 ns とする.計 算時間は 5000 ステップ (50 ns) とする. 図 3.28 に,波源から 0.5 m 離れた観測点における電界 Ez の時間応答を示す,図 3.28 より,スー パーコンピュータと PC クラスタによる計算結果は一致していることが分かる.このことから, スーパーコンピュータによる自動並列化と,PC クラスタのメッセージ通信を用いた並列計算プロ グラムの妥当性が確認できる. 表 3.10 に表 3.7 のモデルの計算に要した計算時間を示す.表 3.10 において,スーパーコン 120 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 ピュータは PC クラスタと同じ 16 台のプロセッサを使用した場合の計算時間である.表 3.10 よ り,FDTD(2,2) 法や FDTD(2,4) 法ともスーパーコンピュータは PC クラスタと比較すると高速に 計算できることが分かる.しかしながら,表 3.10 のスーパーコンピュータの計算時間はキューに 投入したジョブの実行時間であり,実際に計算結果を得るまでにはスーパーコンピュータの利用 状態に依存するがこれ以上の時間を要する.PC クラスタの計算時間はスーパーコンピュータの約 120 倍であるが,設置コストや課金等を考えれば,PC クラスタの方が価格性能比は優れていると いえる. また,表 3.10 のスーパーコンピュータにおいて,FDTD(2,4) 法の計算時間は FDTD(2,2) 法の 1.53 倍程度に増加しているが,表 3.8 に示した 1 ステップあたりの計算量の増加量 1.56 倍と同程 度の値である.さらに,PC クラスタではネットワークの帯域幅や遅延時間のため 4.4 倍程度増加 している.しかしながら,FDTD(2,4) 法の計算時間の増加は,前述したように同程度の精度を得る には FDTD(2,2) 法では総セル数を約 88 倍程度にする必要があるため,FDTD(2,2) 法の計算時間 は表 3.10 の 56 倍程度は必要になり,結果的には FDTD(2,4) 法は FDTD(2,2) 法に比べスーパー コンピュータや PC クラスタにおいても計算時間を削減できる. 3.6.4 FDTD 並列計算における Mur の吸収境界条件 FDTD 法の吸収境界条件として広く用いられる手法に,Mur の吸収境界条件 [33] と,Berenger の PML (Perfect Matched Layer) [34] がある.PML は,Mur の吸収境界条件に比べ精度は良い が,電磁波を吸収する仮想的な媒質で解析領域の外側を囲むため使用メモリが多くなり,また,並 列計算においてはデータ転送量が増加することやアルゴリズムが煩雑になる問題がある.これに対 し,Mur の吸収境界条件は,解析領域の外側境界において,境界面に達する平面波の後退波を 0 に するように波動方程式から電界成分を求める方法であり,精度は PML よりやや劣るが使用メモリ や並列計算におけるアルゴリズム等で PML より有利である.本研究では,この理由から Mur の 吸収境界条件を適用する. Mur の 1 次および 2 次の吸収境界条件は,例えば xz 面 (y = 0) では,それぞれ,式 (3.56), (3.57),および式 (3.58),(3.59) で表される. 3.6 PC クラスタを用いた 3 次元高次 FDTD 法および WE-FDTD 法の並列計算 Exn+1 (i, 0, k) Ezn+1 (i, 0, k) Exn+1 (i, 0, k) Ezn+1 (i, 0, k) = Exn (i, 1, k) v ∆t − ∆y + v ∆t + ∆y = Ezn (i, 1, k) v ∆t − ∆y + v ∆t + ∆y 121 n+1 n Ex (i, 1, k) − Ex (i, 0, k) (3.56) n+1 n Ez (i, 1, k) − Ez (i, 0, k) (3.57) n+1 n−1 = Ex (i, 1, k) − Ex (i, 0, k) 2 ∆y n n + Ex (i, 0, k) + Ex (i, 1, k) v ∆t + ∆y ∆y (v ∆t)2 + Exn (i + 1, 0, k) − 2 Exn (i, 0, k) + Exn (i − 1, 0, k) 2 (∆x)2 (v ∆t + ∆y) n n n + Ex (i + 1, 1, k) − 2 Ex (i, 1, k) + Ex (i − 1, 1, k) ∆y (v ∆t)2 + Exn (i, 0, k + 1) − 2 Exn (i, 0, k) + Exn (i, 0, k − 1) 2 (∆z)2 (v ∆t + ∆y) n n n + Ex (i, 1, k + 1) − 2 Ex (i, 1, k) + Ex (i, 1, k − 1) (3.58) n+1 n−1 = Ez (i, 1, k) − Ez (i, 0, k) 2 ∆y n n + Ez (i, 0, k) + Ez (i, 1, k) v ∆t + ∆y ∆y (v ∆t)2 + Ezn (i + 1, 0, k) − 2 Ezn (i, 0, k) + Ezn (i − 1, 0, k) 2 (∆x)2 (v ∆t + ∆y) n n n + Ez (i + 1, 1, k) − 2 Ez (i, 1, k) + Ez (i − 1, 1, k) ∆y (v ∆t)2 + Ezn (i, 0, k + 1) − 2 Ezn (i, 0, k) + Ezn (i, 0, k − 1) 2 (∆z)2 (v ∆t + ∆y) n n n + Ez (i, 1, k + 1) − 2 Ez (i, 1, k) + Ez (i, 1, k − 1) (3.59) −Exn−1 (i, 1, k) −Ezn−1 (i, 1, k) v ∆t − ∆y + v ∆t + ∆y v ∆t − ∆y + v ∆t + ∆y y = Nj および他の境界面(xy 面, xz 面)においても同様な吸収境界条件式が得られる. ここで,Mur の 1 次および 2 次の吸収境界条件の並列計算におけるデータ通信量を考える.解析 領域を N × N × N とし,並列計算の領域分割法として図 3.24 に示すような yz 平面の分割を考 える.式 (3.56),(3.57) に示す 1 次吸収境界条件では,吸収境界の計算においては隣接する計算機 の値を必要としないので,データ通信は行わなくてよい.これに対して 2 次吸収境界条件では,式 122 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 PC: p-1 PC: p PC: p-1 Ex PC: p Ez send to p-1 send to p-1 send to p send to p Ex z y Ez z x y x (a) (b) 図 3.29 Mur 2 次吸収境界条件におけるデータ通信(xz 面) (a) Ex (b) Ez 表 3.11 並列計算における Mur の吸収境界条件のデータ通信 order communication 1 st. 0 2 nd. 16N (3.58),(3.59) に示すように,隣接する計算機の値を必要とするため,計算機間でデータ通信が必 要になる.例えば,式 (3.58) の Ex ,式 (3.59) の Ez の計算では図 3.29 に示すように計算機間で それぞれ 2N 個の電界 Ex および Ez の通信が必要になる.同様に xy 面においても,計算機間で それぞれ 2N 個の電界 Ex および Ey の通信が必要になり,2 次吸収境界においては,全体として 16N 個の電界の通信が生じる. 以上の結果より,Mur の 2 次では比較的通信量が多くなることから Higdon [35] や Liao [36] 等 の他の吸収境界条件における計算精度と並列計算の計算コストの比較を行い,並列計算に適した吸 収境界条件の検討が必要である. 3.7 結言 本章では,大規模電波伝搬解析のための数値分散誤差および使用メモリの少ない解析手法として 高次 FDTD 法とその並列計算による手法を提案した. まず,数値分散誤差および使用メモリの少ない方法として,TM 波における波動方程式に基づいた 空間 n 次精度の高次 WE-FDTD 法とその並列計算による手法について提案した.高次 WE-FDTD 3.7 結言 123 法の分散関係式を導出し,大規模解析における誤差を定量的に示した.高次 WE-FDTD 法と FDTD 法との精度比較を行った結果,高次 FDTD 法と同程度な計算精度であることを示した.ま た,100λ の伝搬によって生じる数値分散誤差を計算し,数値分散誤差約 1◦ を得るための計算コ ストを比較した結果,FDTD(2,2) 法ではセルサイズを約 λ/200 まで小さく取る必要があるため, 使用メモリは約 10 Gbyte 必要であるのに対して,4 次精度の WE-FDTD(2,4) 法ではセルサイズ を約 λ/20 にでき,また,FDTD(2,4) 法に比べても使用メモリを 2/3 に削減することができるた め,使用メモリは 77 Mbyte にまで削減できる.さらに,WE-FDTD(2,6) 法ではセルサイズは約 λ/10 以下にできるので,使用メモリは 10 Mbyte 以下にまで削減できる.なお,高次の方法では, クーラン数を小さく取る必要があるため,WE-FDTD(2,4) 法の場合には 2 次精度の FDTD(2,2) 法に比べ計算ステップ数は 10 倍程度増加するが,配列の総数が約 1/100 になるので,1 ステップ あたりの浮動小数点演算数の増減を加味すれば,全体として WE-FDTD(2,4) 法は FDTD(2,2) 法 に比べ計算量は 1/10 に削減できる.同様に,WE-FDTD(2,6) 法は FDTD(2,2) 法に比べ計算量は 1/123,使用メモリは 1/1332 に削減できる. 次に,高次 WE-FDTD 法を大規模な電波伝搬解析に適用するために,高次 WE-FDTD 法の並 列計算特性について検討した.仙台電波高専の教育用計算機 80 台を使用した WE-FDTD(2,n) 並 列計算の結果,高次の手法ほど通信量が増加するため並列効率はやや低下するが,各方法とも台 数の増加とともに計算時間を短縮できることを示した.WE-FDTD(2,4) 並列計算の計算時間は, FDTD(2,4) 法に比べ約 30% 短縮され,さらに,WE-FDTD(2,6) 法では,FDTD(2,4) 法と同程 度の計算時間であった.このことから,WE-FDTD(2,6) 法の使用メモリは FDTD(2,4) 法の 1/13 でよいので,計算時間は WE-FDTD(2,6) の計算量増加を考慮するとこれまでに提案されている FDTD(2,4) 法に比べ約 1/13 に短縮できる. 高次 WE-FDTD 並列計算の大規模電波伝搬解析への適用例として,45 m × 15 m (150 λ0 × 50λ0 ) の大型キャビティにおける電波伝搬解析を行った.この結果,WE-FDTD(2,6) 並列計算は, FDTD(2,4) 並列計算より大きなセルサイズでも精度がよく,また計算時間も同程度であることを 明らかにした.このことから,WE-FDTD(2,6) 並列計算による手法は,従来の手法に比べ大規模 な電波伝搬の解析を低コストで精度よく解析できることを示した. 124 第 3 章 高次 FDTD 法とその並列計算による大規模電波伝搬解析 さらに,高次 FDTD および WE-FDTD 法の 3 次元における数値分散特性と教育用計算機を用い た PC クラスタによる並列計算特性について示した.数値分散誤差については,TM 波と同様な特 性であることを示した.また,3 次元解析においては,WE-FDTD 法は FDTD 法に比べ 2 次精度 では 1.56 倍,4 次精度では 2.07 倍に計算量が多くなり,3 次元解析では FDTD 法が有効であるこ とを示した.教育用計算機を用いた PC クラスタによる並列計算について,計算機 16 台をネット ワーク接続した PC クラスタにおいてその計算コストと実際の計算時間を示した.FDTD(2,4) 法 は,FDTD(2,2) 法に比べ計算量は 1.56 倍増加し,また並列計算においても通信量が 3 倍増加す る.しかしながら,同程度の精度を得るためには FDTD(2,2) 法ではセルサイズを小さくする必要 があるため,総セル数を約 88 倍にする必要があり,結果的には,FDTD(2,4) 法では FDTD(2,2) 法に比べ計算量は 1/56 ,使用メモリは 1/88 に減少できることを示した. 現有の教育用計算機を用いた PC クラスタによる並列計算の有効性を示すために,東北大学情報 シナジーセンターのスーパーコンピュータ NEC SX-7 との比較を行った.この結果,計算程度は 同程度であるが,計算時間は SX-7 に比べ PC クラスタでは約 120 倍かかった.SX-7 の計算時間 はキューに投入された計算の開始から終了までの時間であり,実際に計算結果を得るにはこれより もさらに時間がかかる.SX-7 は,CPU 数,メモリ,自動並列化等の面で利点があるが,設置コス トや課金の発生等の計算コストの問題がある.本研究のような,現有の教育用計算機による PC ク ラスタでは,新規に計算機を導入する必要がないので計算コストは超低コストであり,スーパーコ ンピュータに比べ価格性能比は優れている. 125 第4章 光電界センサを用いた室内 UWB パルス伝搬実 験への応用 4.1 緒言 本章では,2,3 章で提案した大規模電波伝搬解析のための低コストかつ高精度な手法である,高 次 FDTD 法と PC クラスタによる並列計算手法の有効性・妥当性を明らかにするために,室内電 波伝搬実験へ適用し,実験と本手法の並列計算の比較を行う. 室内電波伝搬実験には UWB パルスを用いる.UWB は 500 MHz 以上の超広帯域,数 ns 以下 の超短パルスを用いる新しい通信システムであり,ベースバンドによる通信が可能であることか ら小型・低消費電力なシステム構成が可能になる等の特長を持つが,UWB における電波伝搬特 性の解明や,既存の狭帯域通信システムとの干渉のような EMI/EMC 問題等の未解決の問題も多 い [119] [120].UWB は,無線通信の他にも,地雷探査のための地中レーダ [13] や,植生や災害モ ニタリング等のための GB-SAR [14] 等,環境計測用のレーダシステムにも適用されており,その 伝搬特性の解明は重要である. このような UWB の問題に対して,オフィスや家庭内における 1 – 10 GHz 帯の電波伝搬測定が 時間領域や周波数領域で実験されている [121]∼ [129] が,これらはいずれも高周波ケーブル等金属 系を用いる測定であり,測定電磁界への影響が考えられている.また,数値シミュレーションによ る電波伝搬解析法として,これらの実験から得られたデータを元にした統計モデルの提案がいくつ 126 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 か行われている [121] が,統計モデルでは環境がより複雑になると精度が低下する問題がある.こ の問題に対して,数値計算が有効であると考えられる.電波伝搬の数値計算法として広く用いられ ている方法に,レイトレーシング法や FDTD 法がある.レイトレーシング法では UWB パルス の ような時間領域の現象を解析するには不向きであり,さらにモデルが複雑になるほど計算量と精度 が低下する問題がある.FDTD 法は時間領域の解法であるが,高精度な解析を行うには計算コス トが膨大になる問題等があり,数値計算による UWB パルス伝搬解析の報告はほとんど行われてい ない. そこで本章では,室内 UWB パルス伝搬解析のような大規模な電波伝搬解析に本研究で提案した 高次 FDTD 法と PC クラスタによる並列計算による手法を適用し,本手法の有効性と妥当性を明 らかにする.また,UWB パルス伝搬の測定手法として,測定電磁界への影響が少ない非金属の測 定系である光電界センサ [130] を用いた測定を提案する.PC クラスタによる FDTD (2,4) 並列計 算と光電界センサによる室内 UWB パルス伝搬実験との比較を行うことにより,FDTD (2,4) 法 の並列計算による手法は,既存の FDTD 法とその並列計算に比べ,大規模電波伝搬解析を時間領 域で低コストでかつ精度よく解析できることを示す.また,これにより光電界センサを用いた室内 UWB パルス伝搬測定の有効性も明らかにする. 4.2 光電界センサを用いた室内 UWB パルス伝搬実験 4.2.1 室内 UWB 伝搬実験モデル これまでの室内 UWB パルス伝搬の測定には,対数周期アンテナやモノポールアンテナ等と高周 波ケーブルを用いた金属系の測定が行われている [121]∼ [128] が,金属系を用いることにより測定 電磁界に影響を及ぼす問題がある.本研究では,室内 UWB パルス伝搬を高精度に測定するために 非金属を用いた測定系の光電界センサ [130] を用いる. 光電界センサを用いた室内 UWB パルス伝搬測定として,図 4.1,4.2 に示す室内廊下において実 験を行う.実験を行う領域は,長さ 14.5 m,幅 1.9 m,高さ 2.5 m とし,送信アンテナは広帯域ア ンテナとして地雷探査用の GPR 等に用いられている図 4.3 に示すビバルディアンテナを,受信ア ンテナとして図 4.4,4.5 に示す光電界センサを用い,それぞれ 0.9 m の高さに設置する.表 4.1 に 127 4.2 光電界センサを用いた室内 UWB パルス伝搬実験 Top view Opt. sys. VNA: E5071B metal door Rx y Tx z x 1.9m R metal door 14.5m Side view Tx: Vivaldi ( L=8.0cm, W=7.4cm ) Rx: OEFS-2 Tx Rx 2.5m 0.9m z styrene foam y x 14.5m 図 4.1 室内 UWB パルス伝搬実験 表 4.1 室内 UWB パルス伝搬実験の実験パラメータ vector network analyzer Agilent E5071B measurement S21 start frequency 50 MHz stop frequency 5 GHz frequency increments 3.09 MHz IF bandwidth 100 Hz power +5 dBm transmitted antenna vivaldi received antenna OEFS-2 (NEC-Tokin) 実験で用いるパラメータを示す.測定にはベクトルネットワークアナライザ (Agilent E5071B) を 用いて S21 を周波数領域 (50 MHz ∼ 5 GHz) で測定し,フーリエ逆変換を行うことで時間領域波 形を観測する. 128 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 図 4.2 実験風景 図 4.3 送信アンテナとして用いるビバルディアンテナ 4.2.2 実験で使用する光電界センサ 図 4.4,4.5 に本研究で用いる光電界センサを示す.使用する光電界センサは図 4.5 に示すよう に,LiNbO3 結晶基板上にマッハツェンダ型光導波路を形成したものであり,小型軽量で,電界受 信のためのアンテナエレメント以外は非金属で金属給電線を用いないため,測定電磁界への影響が 少ない電磁界センサとして近年 EMC 等の分野で用いられている [131] [132].実験では 50 MHz ∼ 5 GHz の高帯域な特性を持つ光電界センサ(NEC-TOKIN 製)を用いる. 129 4.2 光電界センサを用いた室内 UWB パルス伝搬実験 図 4.4 光電界センサ(NEC-TOKIN 製) Input from optical source optical wave guide optical fiber Output to optical detector optical fiber electrode LiNbO3 electro-optical crystal 図 4.5 光電界センサの構造 4.2.3 UWB パルスの時間波形とスペクトル 図 4.6 に測定で用いる UWB パルスを示す.図 4.6 は,電波暗室において表 4.1 のパラメータに より送受信間距離 1 m で測定した時間波形と周波数スペクトルである.FCC による UWB の定義 では帯域幅 B ≥ 500 MHz と比帯域幅 η ≥ 0.2 とされる [11].本実験で用いる図 4.6 の UWB パ ルスでは,帯域幅 B = 1.12 GHz,比帯域幅 η = 0.38 である. 4.2.4 室内 UWB パルス伝搬の測定 図 4.7 に送信点から 1,2,3,4 m 離れた観測点における光電界センサの受信波形を示す.図 4.7 より,送受信間の距離が離れるほど振幅が小さくなり,また遅延時間も大きくなっており,定性的 130 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 0 Initial electric field 1.0 -10 -20 power [dB] amplitude [a.u.] 0.5 0.0 -0.5 -30 -40 -50 -60 -1.0 0.0 0.5 1.0 1.5 time [ns] 2.0 2.5 3.0 -70 0.0 0.5 1.0 (a) 1.5 2.0 2.5 3.0 frequency [GHz] 3.5 4.0 4.5 (b) 図 4.6 室内電波伝搬解析で用いる UWB パルス (a) 時間領域 (b) スペクトル に UWB パルス伝搬測定が正しく行われていることが確認できる.図 4.8 にレイトレーシング法を 用いた送受信間距離 1m における伝搬経路の計算結果を示す.図 4.8 (a) は xy 面におけるマルチ パスであり,図 4.2 の廊下側面の壁による反射を示す.図 4.8 (b) は xz 面のマルチパスであり,図 4.2 の床や天井からの反射を示す.実験で用いる光電界センサは 1 軸センサであり,本実験では光 電界センサを図 4.2 に示すように水平方向に設置しているので,床や天井からの反射を主に受信す るため,図 4.8 (b) のような xz 面のマルチパスによる電界を受信する.表 4.2 に図 4.8 (b) から求 めた受信される反射波の経路長と観測時間の理論値を示す.図 4.7 (a) の 1 m における観測波形の 到達時間と比較すると,表 4.2 とほぼ一致していることが分かる.図 4.7 (a) には表 4.2 以外に約 13 ns と 18 ns にやや大きな反射波が観測されているが,コンクリート中の鉄筋による反射波と推 測される. 表 4.2 マルチパスにより観測される反射波の観測時間の理論値 (R = 1 m) reflected wave path length [m] observation time [ns] direct wave 1.0 3.3 floor 2.1 6.9 ceiling 3.4 11.2 floor to ceiling 4.6 15.3 5.0 131 transmission [a.u.] 4.2 光電界センサを用いた室内 UWB パルス伝搬実験 0.008 0.006 0.004 0.002 0.000 -0.002 -0.004 -0.006 -0.008 R=1m transmission [a.u.] 0 transmission [a.u.] 10 15 time [ns] (a) 20 0.004 0.003 0.002 0.001 0.000 -0.001 -0.002 -0.003 -0.004 25 30 R=2m 0 5 10 15 time [ns] (b) 20 0.003 0.002 0.001 0.000 -0.001 -0.002 -0.003 25 30 R=3m 0 transmission [a.u.] 5 5 10 15 time [ns] (c) 20 0.003 0.002 0.001 0.000 -0.001 -0.002 -0.003 25 30 R=4m 0 5 10 15 time [ns] (d) 20 25 30 図 4.7 室内 UWB パルス伝搬実験で観測された光電界センサの受信波形 (a) R = 1 m (b) R = 2 m (c) R = 3 m (d) R = 4 m 132 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 2.5 1.8 1.6 2.0 1.4 1.2 1.0 z [m] y [m] 1.5 0.8 1.0 0.6 0.4 0.5 0.2 0.0 0.0 0.2 0.4 0.6 x [m] 0.8 0.0 0.0 1.0 0.2 (a) 0.4 0.6 x [m] 0.8 1.0 (b) 図 4.8 レイトレーシング法による伝搬経路の計算 (a) xy 面,(b) xz 面 4.2.5 デコンボリューションによる送受信システム係数の除去 図 4.7 の観測波形は観測点の電界の絶対値ではなく,図 4.9 (a) に示すように,観測波形には送 受信アンテナの伝達関数 T (ω),R(ω) や,光電界センサシステムの伝達関数 S(ω) を含む測定系全 体の伝達関数となる.このため,観測点における電界の絶対値を求めるには,デコンボリューショ ンにより測定系のシステム係数を除いた電界の相対値を計算し,これに TEM セル等で測定した基 準値を乗じればよい.デコンボリューションは式 (4.1) のように受信信号 U(ω) と電波暗室等で測 定した図 4.10 に示すような参照信号 V (ω) より求めることができる. F (ω) = U(ω) V (ω) (4.1) 図 4.11,4.12 に図 4.7 の (b) 2 m と (d) 4 m における観測波形にデコンボリューションを行っ た結果を示す.ここで,参照信号 V (ω) は電波暗室で測定した図 4.10 を用いた.図 4.11 の R = 2 m の観測点のデコンボリューションの結果より,約 7 ns に直接波,約 9 ns に床面からの反射波, 約 13 ns に天井からの反射波がよく現れている.図 4.12 の R = 4 m の結果から,約 13 ns の直接 波,約 15 ns に床面からの反射波,約 17 ns に天井からの反射波が見られるが,4 m の地点では観 133 4.2 光電界センサを用いた室内 UWB パルス伝搬実験 T R O Tx T Rx Object Tx R P Rx free space S S VNA OE system VNA OE system transfer function: T(ω), R(ω), O(ω) and S(ω) transfer function: T(ω), R(ω), P(ω) and S(ω) recieving signal U(ω) reference signal V(ω) 図 4.9 デコンボリューションによる送受信システム係数の除去 0 -10 power [dB] -20 -30 -40 -50 -60 -70 0.0 0.5 1.0 1.5 2.0 2.5 3.0 frequency [GHz] 3.5 4.0 4.5 5.0 図 4.10 電波暗室で測定したデコンボリューションで用いる参照信号 V (ω) 表 4.3 R = 2 m, 4 m において観測されるマルチパスによる反射波の観測時間の理論値 reflected wave R=2m R=4m path length [m] observation time [ns] path length [m] observation time [ns] direct 2.00 6.67 4.00 13.33 floor 2.67 8.97 4.34 14.47 ceiling 3.89 12.97 5.12 17.07 測波形の振幅が小さくなり SN 比が低下する.表 4.3 に R = 2 m ,4 m におけるマルチパスの観 測時間の理論値を示す.表 4.3 の理論値と図 4.11,4.12 で見られる各反射波の時間はよく一致して いることが分かる. 134 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 0.004 measurement, R=2m 0.003 transmission [a.u.] 0.002 0.001 0.000 -0.001 -0.002 -0.003 -0.004 5 10 15 20 time [ns] 25 30 35 30 35 (a) 0.30 deconvolution, R=2m 0.25 0.20 output [a.u.] 0.15 0.10 0.05 0.00 -0.05 -0.10 -0.15 -0.20 -0.25 5 10 15 20 time [ns] 25 (b) 図 4.11 デコンボリューションによる送受信システム係数の除去 (R = 2 m) (a) R = 2 m における 観測波形,(b) デコンボリューション 135 4.2 光電界センサを用いた室内 UWB パルス伝搬実験 0.003 measurement, R=4m transmission [a.u.] 0.002 0.001 0.000 -0.001 -0.002 -0.003 5 10 15 20 time [ns] 25 30 35 30 35 (a) 0.10 deconvolution, R=4m 0.08 output [a.u.] 0.06 0.04 0.02 0.00 -0.02 -0.04 -0.06 5 10 15 20 time [ns] 25 (b) 図 4.12 デコンボリューションによる送受信システム係数の除去 (R = 4 m) (a) R = 4 m における 観測波形,(b) デコンボリューション 136 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 4.3 FDTD(2,4) 並列計算による室内 UWB パルス伝搬解析 4.3.1 解析モデル 図 4.1 の光電界センサを用いた室内 UWB パルス伝搬実験と,FDTD (2,4) 並列計算による大 規模電波伝搬解析を比較を行う.図 4.13 に FDTD 並列計算における計算モデルを示す.解析領 域は,長さ 5.6 m,幅 1.9 m,高さ 2.5 m とする.表 4.4 に FDTD (2,2) および FDTD (2,4) 法 の並列計算で用いるパラメータを示す.本研究では,図 3.25 のような Pentium 4 3.0 GHz の 教 育用計算機 16 台を 100 Base-T のネットワークで接続した PC クラスタによる並列計算を行う. PC クラスタのような分散メモリ型並列計算機で計算機間の通信を行うライブラリとして MPI Top view 0.1 m Side view side wall ( εr = 3.03) 0.1 m ceiling ( εr = 3.03) Tx (Ey) Tx Rx (Ey) Rx 1.9 m 2.5 m R= 4.0 m R= 4.0 m y z 0.1 m x z side wall ( εr = 5.89) y 5.6 m 0.1 m floor ( εr = 5.80) x 図 4.13 FDTD (2,4) 並列計算による室内 UWB 伝搬の解析モデル 表 4.4 FDTD 並列計算の計算パラメータ floor model 5.6 m × 2.1 m × 2.7 m ∆s (=∆x=∆y=∆z) 0.01 m (= λ/8.6) ∆t 0.01 ns total cells 560 × 210 × 270 ABC Mur 2nd. number of PCs 16 (Pentium4 3.0 GHz, 512 Mbyte) OS bootable CD Linux (kernel 2.4.20-8) [79] network Fast Ether 100 Mbit/s message passing MPI (mpich-1.2.6) 0.9 m 4.3 FDTD(2,4) 並列計算による室内 UWB パルス伝搬解析 137 (Message Passing Interface) の実装である mpich-1.2.6 [107] を用いる.FDTD 法で用いるセルサ イズ ∆s を ∆s = 0.01 m,時間ステップ ∆t を ∆t = 0.01 ns とする.ここで,セルサイズ ∆s は, 図 4.6 の UWB パルスの最大周波数を – 10 dB の周波数で定義すれば,f−10dB = 3.5 GHz とな り,∆s = λ/8.6 である.このように,セルサイズ ∆s を 0.01 m とすれば,長さ 5.6 m,幅 1.9 m, 高さ 2.5 m の室内をモデル化するための総セル数は 560 × 210 × 270 であるが,計算機 16 台の使 用により計算機 1 台あたりのセル数は 35 × 210 × 270 となる.また,吸収境界条件として Mur の 2 次吸収境界条件 [33] を用いる. 4.3.2 送受信アンテナのモデリング これまでに行われている FDTD 法を用いたアンテナ特性解析では,モノポール [138],ボウタ イ [139] [140] [141],マイクロストリップ [142],ホーン [143] [144],フェイズドアレイ [145] 等, アンテナの微細な形状や給電部を正確にモデル化しているが,本研究のようなアンテナ特性の解析 ではなく,また,解析領域の大きさがアンテナよりはるかに大きい場合にはアンテナの微細な構造 の影響は少ないものと考えられる. 本研究で用いる FDTD 法における送受信アンテナのモデリングを図 4.14 に示す.送信アンテナ のビバルディアンテナは,アンテナ幅の複数セル上に図 4.6 に示す初期電界の時間波形を与えるこ とで,また,受信の光電界センサは設置した方向と同方向の 1 セル電界によりモデル化した. 図 4.15 に FDTD(2,4) 法で計算されたモデル化したアンテナの放射指向性を示す.図 4.15 は (a) が E 面,(b) が H 面であり,0◦ ,45◦ ,90◦ ,135◦ ,180◦ の方向の観測点における電界の時間波形で ある.図 4.15 (a) の E 面より,前方および後方の放射が大きく,斜め方向 45◦ ,135◦ と横方向 90◦ の放射は小さいことが分かる.また,図 4.15 (b) の H 面ではほぼ全方向に放射することが分かる. 4.3.3 TDR 法による壁や床面の比誘電率測定 壁や床の比誘電率は,TDR (Time Domain Reflectometry) 法による水分率測定 [146] より測定 した.TDR 法による水分率測定は,図 4.16 に示すように IMKO 社の TRIME を用い,surface probe S3F により測定した.TRIME では水分率が測定されるので,式 (4.2) の Topp の式より誘 138 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 z Ey on some cells y x Vivaldi antenna Ey on a cell z y x OEFS 図 4.14 送受信アンテナのモデル化 90 90 135 135 45 180 0 45 180 (a) 0 (b) 図 4.15 FDTD(2,4) 法で計算されたモデル化したアンテナの放射指向性 (a) E 面 (b) H 面 電率に変換した.この結果,天井 εr = 3.03,床 εr = 5.89,壁 εr = 3.03 と 5.80 が得られた. εr = 3.03 + 9.3 θv + 146.0 θv2 − 76.7 θv3 (4.2) 4.4 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 139 図 4.16 TDR 法による壁や床面の比誘電率測定 4.4 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 4.4.1 室内廊下における伝搬実験との比較 図 4.17,4.18 に光電界センサを用いた室内 UWB パルス伝搬実験と,FDTD (2,4) 並列計算で得 られた送信アンテナから R = 2.0 m,4.0 m 離れた観測点における受信波形を示す.図 4.17,4.18 は,(a) が実験と FDTD (2,2) 法の比較,(b) は実験と FDTD (2,4) 法の比較である.図 4.17 にお いて,約 7∼9 ns に観測される波形が送信アンテナからの直接波であり,約 9∼11 ns に観測され る波形は床面からの反射波である.図 4.17 (a) より,R = 2.0 m (20λ) の伝搬により FDTD (2,2) 法の計算では数値分散誤差を生じるが,図 4.17 (b) より,FDTD (2,4) 法では少ない数値分散誤差 で精度よく計算できていることが確認できる.また, FDTD (2,4) 法では床面からの反射波の誤 差がやや大きくなっているが,これは図 4.19 に示すように数値分散誤差が 伝搬方向(z 軸との角 度 θ )に依存するためであり,床面からの反射波は z 軸との角度 θ が約 45◦ となるため,z 軸と の角度 θ が 0◦ の直接波に比べ約 2 倍の数値分散誤差を生じる.図 4.18 では,伝搬距離が 2 倍の 40 λ であるために FDTD (2,2) 法では図 4.17 の 2 倍となる数値分散誤差が生じる.図 4.18 (b) の FDTD (2,4) 法では,約 15∼17 ns で観測される床面からの反射波でやや数値分散誤差が生じてい るが,40 λ の伝搬でもほぼ実験と一致した精度よい計算ができる. 140 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 0.004 measurement 0.003 FDTD(2,2) transmission [a.u.] 0.002 0.001 0.000 -0.001 -0.002 -0.003 -0.004 6 7 8 9 time [ns] 10 11 12 (a) 0.004 measurement 0.003 FDTD(2,4) transmission [a.u.] 0.002 0.001 0.000 -0.001 -0.002 -0.003 -0.004 6 7 8 9 time [ns] 10 11 12 (b) 図 4.17 FDTD 並列計算と室内伝搬実験との比較 (R = 2.0 m) (a) FDTD (2,2) 法,(b) FDTD (2,4) 法 141 4.4 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 0.002 measurement FDTD(2,2) transmission [a.u.] 0.001 0.000 -0.001 -0.002 13 14 15 16 time [ns] 17 18 19 (a) 0.002 measurement FDTD(2,4) transmission [a.u.] 0.001 0.000 -0.001 -0.002 13 14 15 16 time [ns] 17 18 19 (b) 図 4.18 FDTD 並列計算と室内伝搬実験との比較 (R = 4.0 m) (a) FDTD (2,2) 法,(b) FDTD (2,4) 法 142 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 absolute phase error [deg./λ] 10 FDTD(2,2), ∆s =λ/10 FDTD(2,4), ∆s =λ/10 1 0.1 0 10 20 30 40 50 60 propagation angle θ [deg.] 70 80 90 図 4.19 伝搬方向(z 軸とのなす角)θ による数値分散誤差 表 4.5 室内 UWB パルス伝搬における数値分散誤差の理論値 (R = 2, 4 m) propagation dispersion error [%] FDTD (2,2) FDTD (2,4) direct floor direct floor 2.0 30.6 18.6 1.50 3.60 4.0 61.3 46.5 3.03 4.50 distance R [m] 表 4.5 に図 3.20,4.19 の数値分散誤差特性から求められる FDTD (2,2) および FDTD (2,4) 法 の室内 UWB 伝搬解析における数値分散誤差の理論値を示す.表 4.5 において, direct は送信ア ンテナからの直接波であり,floor は床面からの反射波である.表 4.5 より,R = 40λ の伝搬にお いて,FDTD (2,2) 法では 61 % (0.2 ns) の数値分散誤差が生じるが,FDTD (2,2) 法では わずか 3 % (0.01 ns) の数値分散誤差で済み,FDTD (2,4) 法では FDTD (2,2) 法に比べおおよそ 10 倍の オーダーで精度よく計算できることが分かる. 4.4.2 マルチパス環境下における伝搬実験との比較 実際の室内のような様々な散乱体がある環境では,多数のマルチパスによる反射波が生じる.こ こでは,室内のように多数のマルチパスが生じる場合の UWB パルス伝搬を検証するために金属面 143 4.4 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 で囲まれたモデルでマルチパス環境を模擬し,光電界センサによる測定と FDTD(2,4) 並列計算に より UWB パルスにおけるマルチパス伝搬解析を行う. 図 4.20 に周囲を金属板で囲まれたマルチパス実験モデルを示す.図 4.20 は,図 4.2 の廊下にお いて側面,床面,上部に金属板を置いたものであり,大きさは,長さ 1.9 m,幅 1.0 m,高さ 0.8 m である.送受信アンテナは 0.4 m の高さに設置し,アンテナ間隔を 1.0 m とした.送信アンテナ は図 4.3 のビバルディアンテナ,受信アンテナは図 4.4 の光電界センサを用いた. 図 4.21 (a),4.22 (a) に光電界センサで観測される波形を示す.図 4.21 (a) は金属板で囲われた 場合であり,図 4.22 (a) は金属板がない場合の受信波形である.図 4.21 (a) より,金属板により 多数のマルチパスによる反射波が見られ,またその振幅も大きいことが分かる.特に,直接波の後 に上下面の金属板による大きな反射波が観測され,その後の時間にも多数の反射が観測される.図 4.21 (b) では反射波の振幅も小さく,マルチパスによる反射波も少ない.図 4.21 (b),4.22 (b) に 図 4.21 (a),4.22 (a) にデコンボリューションを行った結果を示す.図 4.21 (b) の金属板で囲まれ た場合には,直接波,金属板による反射波,金属板からの 2 回反射のように大きな反射波が 10 ns までに観測され,その後も反射波が多く観測される.図 4.22 (b) の金属板がない場合には,直接波 や床面からの反射波以外に観測される多重反射波は少ない. metal plate Tx: Vivaldi Rx: OEFS 0.5 m 0.4 m 0.8 m 0.5 m 1.0 m 1.0 m 0.5 m z y x 1.9 m 図 4.20 マルチパス環境の実験モデル 144 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 0.04 with metal plate 0.03 transmission [a.u.] 0.02 0.01 0 -0.01 -0.02 -0.03 -0.04 0 10 20 30 40 time [ns] 50 60 70 80 70 80 (a) 1.2 deconvolution 1.0 0.8 output [a.u.] 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 0 10 20 30 40 time [ns] 50 60 (b) 図 4.21 周囲を金属板で囲んだマルチパス環境化における観測波形 (a) 観測波形,(b) デコンボリューション 145 4.4 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 0.04 without metal plate 0.03 transmission [a.u.] 0.02 0.01 0 -0.01 -0.02 -0.03 -0.04 0 10 20 30 40 time [ns] 50 60 70 80 70 80 (a) 1.0 deconvolution output [a.u.] 0.5 0.0 -0.5 -1.0 0 10 20 30 40 time [ns] 50 60 (b) 図 4.22 周囲に金属板がない場合の観測波形とデコンボリューション (a) 観測波形,(b) デコンボリューション 146 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 図 4.23 に図 4.20 のモデルで FDTD 並列計算により計算した結果と,図 4.21 の実験との比較を 示す.図 4.23 (a) は実験における観測波形であり,(b) は FDTD(2,2) 並列計算,(c) は FDTD(2,4) 並列計算による計算結果である. 図 4.23 の結果より,FDTD(2,4) 並列計算では FDTD(2,2) 並列計算に比べ直接波や上下面から の反射波をよく再現できるが,その後に大きな反射波が観測される.これは,FDTD 法のアンテナ のモデル化に原因がある.図 4.14 に示したように複数セル上に初期電界の時間波形を与えること でモデル化したが,これにより図 4.15 に示したように電磁波は広角度に放射されるためである. 図 4.25 に,図 4.24 に示すような電波暗室で測定 [133]∼ [137] したビバルディアンテナの放射パ ターンの測定結果を示す.図 4.25 (a) が E 面,図 4.25 (b) が H 面である.また,図 4.26 に各角 度における受信波形を示す.図 4.25,4.26 より,前方への放射が後方に比べ大きくなっており,図 4.26 より,E 面,H 面とも後方の 135◦ ,180◦ では前方の 0◦ に比べ振幅はおおよそ 1/2 程度の大 きさになる.このことから,FDTD 法でのアンテナモデルは図 4.15 に示すように E 面,H 面とも 後方へも前方と同じ大きさで放射するため,実験に比べ計算結果の振幅が大きくなる.しかしなが ら,実際の UWB パルス伝搬を応用した通信やレーダシステムでは第一到達波の観測時間が重要で あることが多い.図 4.23 (c) のように FDTD(2,2) 法に比べ FDTD(2,4) 法では約 12 ns 付近まで は実験とよく一致しており,今回のアンテナモデル化でも前方への放射は考慮できるため,UWB パルス伝搬の時間領域の数値解法として有効であるといえる. 147 4.4 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 0.04 measurement 0.03 transmission [a.u.] 0.02 0.01 0.00 -0.01 -0.02 -0.03 -0.04 0 5 10 15 time [ns] 20 25 30 (a) 0.04 FDTD(2,2) 0.03 transmission [a.u.] 0.02 0.01 0.00 -0.01 -0.02 -0.03 -0.04 0 5 10 15 time [ns] 20 25 30 (b) 0.04 FDTD(2,4) 0.03 transmission [a.u.] 0.02 0.01 0.00 -0.01 -0.02 -0.03 -0.04 0 5 10 15 time [ns] 20 25 30 (c) 図 4.23 マルチパス環境下における観測波形と FDTD(2,4) 並列計算との比較 (a) 観測波形,(b) FDTD(2,2) 並列計算,(c) FDTD(2,4) 並列計算 148 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 Top view Side view anechoic chamber 90 Tx 180 0 Rx Tx Rx 0.6m turn table 270 y z 1.5m styrene foam z Opt. sys. x y x Tx: Vivaldi ( L=8.0cm, W=7.4cm ) VNA: HP8720 Rx: OEFS-2 ( A311-8 ) Vivaldi ( L=8.0cm, W=7.4cm ) 図 4.24 電波暗室におけるビバルディアンテナの放射パターン測定 90 180 -10 -30 -50 -50 -70 -50 -70 -50 -30 0 -10 1GHz 3GHz -10 -30 [dB] -30 90 1GHz 3GHz -10 180 -10 [dB] -30 -70 -50 -70 -50 -50 -30 -30 -10 270 -10 270 (a) (b) -50 図 4.25 測定したビバルディアンテナの放射パターン (a) E 面 (b) H 面 -30 0 -10 149 4.4 FDTD (2,4) 並列計算と UWB パルス伝搬実験との比較 45 0 0 2 0 2 4 4 2 6 6 8 4 8 10 6 135 10 8 10 90 0 2 6 4 8 10 180 0 2 4 6 8 10 0 8 10 0 (a) 45 0 0 2 0 2 4 4 2 6 6 8 4 8 10 6 135 10 8 10 90 0 2 4 6 8 10 180 0 2 4 6 (b) 図 4.26 測定した時間領域におけるビバルディアンテナの放射パターン (a) E 面 (b) H 面 150 第 4 章 光電界センサを用いた室内 UWB パルス伝搬実験への応用 4.5 結言 本章では,2,3 章で提案した高次 FDTD 法と PC クラスタを用いた並列計算による手法の有効 性・妥当性を明らかにするために,室内 UWB パルス伝搬実験との比較を行った.実験は,光電界 センサを用いて室内廊下で行い,計算は現有の教育用計算機 16 台を用いた並列計算により行った. 室内 UWB パルス伝搬実験と計算を比較した結果,これまでよく用いられている FDTD 法では空 間 2 次精度であるため,セルサイズが λ/10 で伝搬距離が 40λ の場合には約 61 % の数値分散誤差 を生じるが,空間 4 次精度の FDTD (2,4) 法では数値分散誤差は約 3 % であり,セルサイズが波 長に比べ大きな場合でも時間領域のパルス伝搬を精度よく計算できることを示した.これまでの研 究では,FDTD 法を用いた大規模電波伝搬解析と時間領域における実験との比較は行われていな かったが,本手法により時間領域における大規模電波伝搬解析を精度よく低コストで計算すること ができる.また,PC クラスタを用いた FDTD (2,4) 並列計算による電波伝搬解析は,光電界セン サを用いた室内 UWB パルス伝搬実験とよく一致しており,非金属を用いる測定系である光電界セ ンサを用いた UWB パルス伝搬測定の有効性も示すことができた. 今後の課題として,アンテナモデリングを簡易にかつ放射特性の再現性も含めて行うことが挙げ られる.本研究では,ビバルディアンテナのモデル化として,複数セル上に初期電界を与える方法 を示した.本手法は簡易的で前方方向へは精度よく計算できる特長があるが,ビバルディアンテナ のような後方への放射が小さく,後方からの反射波が大きい室内のような狭い閉じられたモデルで は,実験と計算は一致しにくくなる.本研究のアンテナモデリングではこのような欠点はあるが, 簡易なモデル化で前方放射は精度よく計算することができるので,後方からの反射を考えないよう な問題では非常に有効であると考えられる. 151 第5章 結論 5.1 本研究の成果 UWB (Ultra Wide Band) を用いた地雷探査レーダや屋内高速通信,さらに,地球環境計測のた めの L バンドや X バンドを用いる合成開口レーダ (SAR) 等,近年,レーダシステムや無線通信 の高周波化や高度化が進んでおり,このようなレーダシステムや通信システム最適設計のための電 波伝搬解析法が必要とされている.しかしながら,電波伝搬の数値計算として広く用いられている FDTD 法では波長に比べ解析領域が大きくなるため,計算精度や計算コストの問題があった.本 研究では,この問題を解決するために,波長に比べ大規模な領域の電波伝搬を高精度かつ低コスト で解析可能な時間領域の手法を提案し,提案手法の有効性を実験により明らかにした.以下に本研 究で得られた結果を要約して記す. 第 1 章では,本研究の背景となる電磁波を用いた様々なレーダシステムや通信システムについ て,その周波数帯,対象領域,特徴等を示した.特に,レーダシステム・通信システムの最適設計 でこれまで用いられていた FDTD 法について,波長に比べ大規模な領域の問題へ適用する場合の 問題点を述べ,研究の目的と意義を明らかにした. 第 2 章では,第 1 章で述べた大規模解析における FDTD 法の計算コストの問題を現有計算機を 用いた PC クラスタによる FDTD 並列計算で解決する方法について提案した.ここでは,並列計算 用に新しい設備を導入することなく,現有設備を有効利用することを考え,教育機関等に情報教育 152 第 5 章 結論 用として設置されている大規模計算機群を並列計算に利用する手法や,FDTD 並列計算特性等を詳 細に調べた.この結果,計算機 80 台を用いた TM 波における FDTD 並列計算では,1200 × 1200 の解析領域において 55.0 倍の速度向上比と並列効率 68.8% が得られた.また,並列計算の計算時 間の理論式を導出し,並列計算の効果をあらかじめ推定できることを示し,大規模な問題ほど並列 計算の効果が得られることを明らかにした.より計算コストの低い手法として,波動方程式に基づ く FDTD 法(WE-FDTD 法)に着目し,その並列計算特性を調べた.この結果,FDTD 法に比 べ,使用メモリは 2/3 に削減でき,80 台を使用した並列計算では計算時間が 16% 程度短縮される ことを示した. PC クラスタを用いた FDTD 並列計算の大規模電波伝搬問題への適用として,室内における UWB パルス伝搬解析を FDTD 並列計算で行った.この結果,使用メモリが約 4 GB 必要となる 大規模な問題でも,計算機を 40 台使用することにより解析可能となり,メモリ効果は 1/39.9,計 算時間の短縮率は 1/36.4 が得られることを示した.以上の結果から,大規模な電波伝搬解析に対 する現有計算機を用いた PC クラスタによる FDTD 並列計算の有効性を明らかにした. さらに多くの計算資源を得るために,異なるネットワーク上にある異機種の計算機を並列計算に 利用するグリッドコンピューティングに着目した.本研究では,周囲の計算機をグリッドとして用 いるために,セキュリティや使用メモリに考慮した CD のみで起動する Linux の開発作成を行っ た.このような CD ブート Linux でグリッドを構築することにより,周囲の計算機を容易に並列 計算機として使用でき,低コストで並列計算環境を得ることができる.開発した CD ブート Linux を評価した結果,使用メモリは 55 MB ,セキュリティホールも 0 に削減でき,また並列計算性能 も通常のハードディスク起動のシステムに比べ約 10 % 程度高速になることを示し,本研究で提案 した CD ブート Linux によるグリッド環境の有効性を明らかにした. また,様々な性能の計算機を使用するグリッドで必要となる FDTD 法の負荷分散について,(1) FDTD の時間 1 ステップを各計算機で実行し最小計算時間となる領域分割を行う領域分割法と, (2) 計算機起動時に計測した FDTD 法の計算時間を計算性能基準として用い,各計算機に複数の プロセスを起動することにより各計算機の性能毎に領域分割を行うマルチプロセス法を提案した. 実際に 3 種類のグリッドを構築し,ふたつの手法の負荷分散評価実験を行った結果,いずれも 50 5.1 本研究の成果 153 % 程度の計算時間の短縮を実現でき,負荷分散法として有効であることを示した.(1) の領域分割 法では,通信性能等グリッドを構成するすべての要素を考慮できる手法であるが,領域分割を出力 するまでに時間を要すること,グリッドの構成毎にプログラムを変更する必要がある等の欠点があ る.これに対して,(2) のマルチプロセス法では,ネットワーク性能は考慮されないが,負荷分散 パラメータを出力するまで時間が (1) の領域分割法の 1/50 程度でよく,またクラスタ用のプログ ラムをそのまま流用できる利点がある.大規模な問題ではネットワーク性能に比べ計算性能の影響 が大きくなるため,マルチプロセス法は簡易な負荷分散法として有効であることを示した. グリッドを用いた FDTD 並列計算による大規模電波伝搬解析への応用として,ランダムな散乱 体を含む不均質な地中媒質における地中物体の検出シミュレーションを行った.この結果,計算機 1 台では 23.0 時間かかった計算が,計算機 20 台のグリッドにより計算時間は 1.5 時間にすること ができることを示した. 第 3 章では,低コストで高い計算精度を持つ方法として,空間で高次精度の波動方程式に基づく FDTD 法その並列計算による手法を提案し,分散誤差特性や並列計算特性について詳細に検討し た.まず,高次 WE-FDTD 法の分散関係式を導出することにより,高次 WE-FDTD 法の数値分 散誤差特性と,大規模解析における数値分散誤差とセルサイズ ∆s および時間ステップ ∆t の関係 を明らかにし,計算パラメータの決定指針を示した.また,これにより,高次 WE-FDTD 法は高 次 FDTD 法と同程度の計算精度であることを明らかにした.さらに,高次 WE-FDTD 法の計算 コストを導出し,空間 4 次精度の WE-FDTD(2,4) 法は FDTD 法に比べ,TM 波においては使用 メモリは 1/100,計算量は 1/10 に削減でき,空間 6 次精度の WE-FDTD(2,6) 法は FDTD 法に比 べ,使用メモリは 1/1332,計算量は 1/123 に削減できることを明らかにした.次に,高次 FDTD および WE-FDTD 法の並列計算特性に関する検証を行い,80 台の計算機を使用した並列計算で は,高次の手法ほど通信量増加のため並列効果は低下することを示した.また,高次 WE-FDTD 法は同じ次数の高次 FDTD 法に比べ通信量を軽減でき,WE-FDTD(2,6) 法は FDTD(2,4) 法と同 程度の計算時間であることを示した.高次 WE-FDTD 法の有効性を示すために,45 m × 15 m (150λ × 50λ) の大型キャビティにおける電波伝搬解析を行った.この結果,WE-FDTD(2,6) 法 は WE-FDTD(2,4) 法よりセルサイズを 10 倍大きくしても高精度に計算できることを示し,高次 154 第 5 章 結論 WE-FDTD 法の並列計算による大規模電波伝搬解析の有効性を明らかにした.以上のことから, TM 波においては,WE-FDTD(2,6) 並列計算による手法は,従来の FDTD 法に比べ使用メモリ は 1/1332,計算時間は 1/88,FDTD (2,4) と比べると使用メモリは 1/13,計算時間は 1/13 のよ うに計算コストを削減できることを明らかにした. 高次手法の 3 次元への拡張として,3 次元高次 FDTD および WE-FDTD 法の数値分散特性や並 列計算コストの検討を行った.この結果,3 次元においても高次手法の数値分散誤差は TM 波と同 様な特性を示すが,計算コストは WE-FDTD 法は FDTD 法に比べ,2 次精度では 1.56 倍,4 次 精度では 2.07 倍計算量が増加し,また並列計算の通信量も増加することを示し,3 次元解析では FDTD 法が有効であることを示した.空間 4 次精度の FDTD(2,4) 法について,PC クラスタにお ける 3 次元並列計算特性を調べた結果,FDTD(2,2) 法に比べ計算量は約 1.6 倍,通信量は 3 倍増加 するが,同程度の計算精度を得る計算コストを比較した結果,FDTD(2,4) 法は FDTD(2,2) 法に比 べ計算量は 1/56 ,使用メモリを 1/87 に削減できることを示した.また,FDTD(2,4) 並列計算に おいて教育用計算機による PC クラスタとスーパーコンピュータ NEC SX-7 との計算時間を比較 した結果,PC クラスタの方が 120 倍計算時間がかかり,メッセージ通信プログラムを必要とする 欠点はあるが,PC クラスタよる並列計算の方が価格性能比等の観点から有利であることを示した. 第 4 章では,高次 FDTD 並列計算による大規模電波伝搬解析の有効性を明らかにするために, 光電界センサを用いた室内 UWB 電波伝搬実験との比較を行った.FDTD(2,4) 並列計算と室内 UWB パルス伝搬実験との比較では,従来の FDTD 法に比べ,セルサイズを λ/10 としても 40λ の伝搬距離の実験結果と時間領域でよく一致することを示し,実験との比較により PC クラスタを 用いた高次 FDTD 並列計算による手法の有効性を示した. 以上本論文では,波長に比べ数十∼数百程度の大きさの領域における大規模電波伝搬を高精度か つ低コストで解析する手法について提案し,その詳細な検討を行った.本研究で得られた知見をま とめると, 5.2 今後の展開 155 (1) 現有計算機を用いたクラスタおよびグリッドにおける FDTD 並列計算の効果とその定式化 (2) 低コスト・高セキュリティのグリッド構築手法 (3) グリッドにおける FDTD 並列計算の負荷分散の実装とその効果・検証 (4) 高次 FDTD 法および WE-FDTD 法の大規模解析における数値分散誤差の詳細な検証とそ の定量化,および計算パラメータ決定指針 (5) 高次 FDTD 法とその並列計算による低コスト・高精度な数値計算手法 (6) 光電界センサを用いた室内 UWB パルス伝搬実験との比較による本手法の有効性の検証 である.以上,本研究で提案した高次 FDTD および WE-FDTD 法の PC クラスタ・グリッドによ る並列計算は,大規模電波伝搬を低コスト・高精度で解析可能な有効な手法であることを示した. 5.2 今後の展開 本論文の第 4 章では,基本的かつ本質的な問題に応用することで本手法の有効性を明らかにした が,今後の課題として,具体的な問題に本手法の適用を行うことがあげられる.まず,今後広く用 いられると考えられる室内 UWB 通信において,UWB 通信と人体の相互関係や既存の通信システ ムとの干渉の問題等の UWB の EMC 問題への適用があげられる. さらに,環境分野への応用として,土壌や地盤調査で用いられる地中レーダやボアホールレーダ について,送受信アンテナの最適配置や,逆問題で用いられる信号処理システム開発のための順問 題解析への適用等が考えられる.地中レーダやボアホールレーダでは,比誘電率の比較的高い地中 媒質における電波伝搬散乱問題になるため,波長に比べ大規模な問題になることから,本手法の適 用が有効であると考えられる.また,航空機や衛星からの電波によるリモートセンシングでは,数 km の範囲で L バンドや X バンドを使用するため,この問題に従来の FDTD 法を直接適用するこ とはこれまで困難であったが,高次の手法と並列計算の組み合わせにより適用可能になる. 表 5.1,5.2 に SAR や GPR における電波伝搬散乱解析に FDTD 法を適用した場合の使用メモ リを示す.表 5.1,5.2 は,周波数 1.5 GHz を想定した場合において,数値分散誤差 |eφ | を約 1 ◦ で解析するための使用メモリである.表 5.1 の航空機 SAR の問題においては,従来の FDTD 法で 156 第 5 章 結論 表 5.1 航空機 SAR の電波伝搬散乱解析に FDTD 法を適用した場合の計算コスト area (wavelength) FDTD(2,2) WE-FDTD(2,10) 5 km2 (25000 λ)2 200 Pbyte 1 Tbyte 1.5 Pbyte 40 Gbyte 2 1 km 2 (5000 λ) 表 5.2 GPR の電波伝搬散乱解析に FDTD 法を適用した場合の計算コスト area (wavelength) FDTD(2,2) FDTD(2,4) 5 m3 (50 λ)3 20 Tbyte 30 Gbyte 1 m3 (10 λ)3 200 Gbyte 300 Mbyte は,5 km2 を解析するのに 200 Pbyte,1 km2 では 1.5 Pbyte もの膨大なメモリを必要とする.一 方,本論文で提案したような空間 10 次精度の高次 WE-FDTD 法を用いた場合には,5 km2 の解 析では 1 Tbyte,1 km2 では 40 Gbyte でよく,PC クラスタやスーパーコンピュータによる解析 が可能となる.表 5.2 の GPR への応用では,地中の比誘電率を εr = 4.0 と想定した場合に必要な 使用メモリは,従来の FDTD 法では,5 m3 を解析するのに 20 Tbyte,1 m3 では 200 Gbyte の メモリを必要とするのに対して,空間 4 次精度の FDTD 法を適用することにより,5 m3 では 30 Gbyte,1 m3 では 300 Mbyte にまで必要メモリを削減することができ,1 m3 では計算機 1 台で 解析可能な問題になる. 以上述べたように,本研究で提案した手法は,今後重要になる環境計測のためのリモートセンシ ングや高度無線通信の分野等に広く適用できる有効な手法である. 157 謝辞 本研究を遂行するにあたり,始終有益なる御検討・御助言と熱心な御指導・御鞭撻を賜りました 東北大学 東北アジア研究センター 教授 工学博士 佐藤源之 先生に深く感謝致します.また,本研 究の遂行ならびに論文をまとめるにあたり,有益な御教示と御助言を賜りました東北大学 大学院 環境科学研究科 研究科長 教授 工学博士 新妻弘明 先生,東北大学 大学院 工学研究科 教授 工学博 士 澤谷邦男 先生,東北大学 電気通信研究所 教授 工学博士 杉浦行 先生に深く感謝致します. 著者が東北大学 大学院 環境科学研究科で研究を進めるにあたり,多くの御援助と御便宜を図っ てくださりました仙台電波工業高等専門学校 前校長 工学博士 渡辺英夫 先生,仙台電波工業高等専 門学校 校長 工学博士 宮城光信 先生,仙台電波工業高等専門学校 電子工学科 前学科主任 教授 工 学博士 熊谷正純 先生に深く感謝致します.また,研究内容に関するアドバイスや学会発表を熱心 に勧めていただきました仙台電波工業高等専門学校 電子制御工学科 教授 理学博士 海野啓明 先生 に深く感謝の意を表します.校内の計算機を並列計算として使用するにあたりご協力をいただきま した仙台電波工業高等専門学校 電子工学科 講師 與那嶺尚弘 先生,仙台電波工業高等専門学校 技 術専門職員 笈口誠志 氏,本研究の実験を遂行するにあたり,工作等にご協力いただきました仙台 電波工業高等専門学校 技術専門職員 高田稔 氏,同 山内誠 氏に感謝致します.また,計算機の使 用にご協力いただきました電子工学科並びに仙台電波工業高等専門学校 教職員,学生のみなさんに 感謝致します. 大分工業高等専門学校 電気電子工学科 教授 博士(工学)佐藤秀則 先生,岩手大学 大学院 工学 研究科 助教授 博士(工学) 高木浩一 先生,富士写真フィルム株式会社 博士(工学) 佐藤智夫 氏, 弁理士 源純一 氏,富山商船高等専門学校 助教授 博士(工学) 千葉元 先生,アルプス電気株式会 社 菊地進一郎 氏には,長きにわたり多くの励ましとアドバイスをいただきました.ここに感謝の 158 謝辞 意を表します. 東北大学 東北アジア研究センター 佐藤研究室のみなさまには,研究を進めるにあたり常に熱心 に御討議していただき,非常に有意義な研究生活を送ることができましたこと,深く感謝してお ります.特に,Pukyong National University Prof. Ph.D. Hee Joo Kim 先生には研究内容に関 しまして有益な情報をいただきました.東北大学 東北アジア研究センター 前助手 Ph.D. Timofei Savelyev 先生,東北大学 東北アジア研究センター 助手 Ph.D. Feng Xuag 先生には実験に対する 様々なアドバイスをいただきました.独立行政法人 科学技術振興機構 研究員 博士(理学)小林敬 生 氏には東北大学情報シナジーセンターのスーパーコンピュータ使用に関しまして多大なご協力 をいただきました.Korea Institute of Geoscience and Mineral Resources (KIGAM) Ph.D. Cho Seong Jun 氏には実験に対する様々なアドバイスをいただき,また測定器の制御プログラムをご提 供下さいました.ここに深く感謝致します.また,同時期に学位審査を受け,様々な情報をいただ き苦楽を共にした Lu Qi 氏,同じ博士後期課程の学生として,様々なアドバイスをいただいた藤原 純 氏,高橋一徳 氏,趙建国 氏,Ganchuluun Nadmidtseden 氏に感謝致します.実験を行うにあ たり様々な協力をいただいた修了生の田中亮平 氏,入部紘一 氏,博士前期課程の高山卓也 氏,吉 田健太郎 氏,二瓶雄次 氏,学部生の江代啓 氏,林直樹 氏,草野駿一 氏に感謝致します.事務等 でお世話になった独立行政法人 科学技術振興機構 佐藤洋恵さんに感謝致します. 研究遂行にあたっては,仙台電波工業高等専門学校の専攻科生ならびに卒業研究生に協力をいた だきました.特に,2.4.1 節のグリッド用 CD ブート Linux の開発には木村功児 君と若生一樹 君, 2.4.4 節のマルチプロセス法による FDTD 負荷分散では木村功児 君,4.2.4 節のレイトレーシング 法の計算には佐藤拓美さんの協力をいただきました.ここに感謝致します. 最後に,本研究にかかわって下さったすべての方々,学会等で御議論・御助言いただきました 方々に心から感謝致します.また,大学院修士課程まで学費の援助をしていただき勉学の機会を 作っていただいた母に,家庭において研究活動の援助をしていただいた妻に,感謝致します. 平成 17 年 9 月 園 田 潤 159 参考文献 [1] F. T. Ulaby, R. K. Moore, and A. K. Fung, Microwave Remote Sensing: Active and Passive. Artech House, 1986. [2] 古濱洋治,岡本謙一,増子治信,人工衛星によるマイクロ波リモートセンシング,電子情報 通信学会,1986. [3] 岡本謙一, 地球環境計測,オーム社,1999. [4] 進士昌明 編著,無線通信の電波伝搬,電子情報通信学会,1992. [5] 野本真一,ワイヤレス基礎理論,電子情報通信学会,2003. [6] 中嶋信生,新世代ワイヤレス技術,丸善,2004. [7] M. Sato and T. Suzuki, “Recent progress in borehole radars and ground penetrating radars in Japan,” vol. E76–B, no. 10, pp. 1236–1242, Oct. 1993. [8] 佐藤源之, “地中レーダによる地下イメージング,“ 電子情報通信学会論文誌 C, vol. J85–C, no. 7, pp.520–530, July 2002. [9] 三輪空司,佐藤源之,新妻弘明,“ポラリメトリックボアホールレーダ計測における直達波を 用いたアンテナ特性補償法,” 信学論 B,vol. J82–B, no. 3, pp. 442–451, March 1999. [10] S. Liu and M. Sato, “Electromagnetic logging technique based on borehole radar,” IEEE Trans. Geosci. Remote Sensing, vol. 40, no. 9, pp. 2038–2092, Sept. 2002. [11] I. Oppermann, M. Hämäläinen, and J. Iinatti, UWB Theory and Applications. John Wiley & Sons, 2004. [12] P. D. Smith and S. R. Cloude, Ultra-Wideband, Short-Pulse Electromagnetics 5. Plenum US, 2002. 160 参考文献 [13] M. Sato, Y. Hamada, X. Feng, F. Kong, Z. Zeng, and G. Fang, “GPR using an array antenna for landmine detection,” Near Surface Geophysics, vol. 2, pp. 7–13, Feb. 2004. [14] Z. Zhou, W. M. Boerner, and M. Sato, “Development of a ground-based polarimetric broadband SAR system for noninvasive ground-truth validation in vegetation monitoring,” IEEE Trans. Geosci. Remote Sensing, vol. 42, no. 9, pp. 1803–1810, Sept. 2004. [15] T. K. Sarkar, J. Zhong, K. Kyungjung, A. Medouri, and M. S. Palma, “A survey of various propagation models for mobile communication,” IEEE Antennas Propag. Mag., vol. 45, no.3, pp. 51–82, June 2003. [16] M. F. Iskander and Z. Yun, “Propagation prediction models for wireless communication systems,” IEEE Trans. Microwave Theory Tech., vol. 50, no. 3, pp. 662–673, March 2002. [17] T. Kobayashi and M. Sato, “Optimization of GPR array antenna spacing for common mid point measurement,” in Proc. of The 7th SEGJ International Symposium - Imaging Technology -, pp. 114–117, Nov. 2004. [18] 清水康敬,杉浦行編著,電磁妨害波の基本と対策,電子情報通信学会,1995. [19] Y. Matsumoto, M. Takeuchi, K. Fujii, A. Sugiura, and Y. Yamanaka, “A time-domain microwave oven noise model for the 2.4 GHz band,” IEEE Trans. Electromagn. Compat., vol. 45, no. 3, pp. 561–565, Aug. 2003. [20] T. V. Yioultsis, T. I. Kosmanis, E. P. Kosmidou, T. T. Zygiridis, N. V. Kantartzis, T. D. Xenos, and T. D. Tsiboukis, “A comparative study of the biological effects of various mobile phone and wireless LAN antennas,” IEEE Trans. Magn., vol. 38, no. 2, pp, 777–780, March 2002. [21] R. A. ウィッテ,スペクトラム/ネットワーク・アナライザ:理論と計測,トッパン,1993. [22] 森屋俶昌,関 和雄,高周波計測,東京電機大学出版局,1998. [23] 電気学会 電磁波雑音のタイムドメイン計測技術調査専門委員会編,電磁波雑音のタイムドメ イン計測技術,コロナ社,1995. [24] R. F. Harrington, Field Computation by Moment Methods. Wiley-IEEE Press, 1993. 161 [25] K. Sawaya, “Antenna design by using method of moments,” IEICE Trans. Commun., vol. E88–B, no. 5, pp. 1766–1773, May 2005. [26] 電気学会 編,計算電磁気学,培風館,2003. [27] 細矢良雄 編著, 電波伝搬ハンドブック,リアライズ社,1999. [28] S. Y. Seidel and T. S. Rappaport, “Site-specific propagation prediction for wireless inbuilding personal communication system design,” IEEE Trans. Vech. Tech., vol. 43, no. 4, pp. 879–891, Nov. 1994. [29] K. S. Yee, “Numerical solution of initial boundary value problems involving Maxwell’s equations in isotropic media,” IEEE Trans. Antennas Propag., vol. 14, no. 2, pp. 302–307, May 1966. [30] K. S. Kunz and R. J. Luebbers, The Finite Difference Time Domain Method for Electromagnetics. CRC Press, 1993. [31] A. Taflove, Computational Electrodynamics: The Finite-Difference Time-Domain Method. Artech House, 1995. [32] 宇野 亨,FDTD 法による電磁界およびアンテナ解析,コロナ社,1998. [33] G. Mur, “Absorbing boundary conditions for the finite-difference approximation of the time-domain electromagnetic-field equations,” IEEE Trans. Electromagn. Compat., vol. 23, pp. 377–382, Nov. 1981. [34] J. P. Berenger, “A perfect matched layer for the absorption of electromagnetics waves,” J. Computational Physics, vol. 114, no. 1, pp. 185–200, 1994. [35] R. L. Higdon, “Absorbing boundary conditions for difference approximations to the multidimensional wave equation,” Mathematics of Computation, vol. 47, no. 176, pp. 437–459, 1986. [36] Z. P. Liao, H. L. Wong, B. P. Yang, and Y. F. Yuan, “A transmitting boundary for transient wave analysis,” Science Sinica, Series A, vol. 27, no. 10, pp. 1063–1076, 1984. [37] M. W. Chevalier, and R. J. Luebbers, and V. P. Cable, “FDTD local grid with material 162 参考文献 traverse,” IEEE Trans. Antennas Propag., vol. 45, no. 3, pp. 411–421, March 1997. [38] M. Okoniewski, E, Okoniewska, and M. A. Stuchly, “Three-dimensional subgridding algorithm for FDTD, “ IEEE Trans. Antennas Propag., vol. 45, no. 3, pp. 422–429, March 1997. [39] T. Namiki, “A new FDTD algorithm based on alternating-direction implicit method,” IEEE Trans. Microwave Theory Tech., vol. 47, no. 10, pp.2003–2007, Oct. 1999. [40] F. Zheng, Z. Chen, and J. Zhang, “A finite-difference time-domain method without the courant stability conditions,” IEEE Trans. Microwave Guided Wave Lett., vol. 9, no. 11, pp.441–443, Nov. 1999. [41] Q. H. Liu, “Large-scale simulations of electromagnetic and acoustic measurements using the pseudospectral time-domain (PSTD) algorithm,” IEEE Trans. Geosci. Remote Sensing, vol. 37, no. 2, pp. 917–926, March 1999. [42] M. Krumpholz and L. P. B. Katehi, “MRTD: new time-domain schemes based on multiresolution analysis,” IEEE Trans. Microwave Theory Tech., vol. 44, no. 4, pp. 555–571, April 1996. [43] R. J. Luebbers, K. S. Kunz, M. Schneider, and F. Hunsberger, “A finite-difference timedomain near zone to far zone transformation,” IEEE Trans. Antennas Propag., vol. 39, no. 4, pp. 429–433, April 1991. [44] R. Luebbers D. Ryan, and J. Beggs, “A two–dimensional time-domain near-zone to far– zone transformation,” IEEE Trans. Antennas Propag., vol. 40, no. 7, pp. 848–851, July 1992. [45] J. Sonoda and Y. Miyazaki, “Electromagnetic scattering by objects on the stratified and rough surface ground for satellite remote sensing,” in Proc. of Asia-pacific Radio Science Conference, p.174, July 2001. [46] P. B. Wong, G. L. Tyler, J. E. Baron, E. M. Gurrola, and R. A. Simpson, “A three-wave FDTD approach to surface scattering with applications to remote sensing of geophysical 163 surfaces,” IEEE Trans. Antennas Propag., vol. 44, no. 4, pp. 504–514, April 1996. [47] Z. Huang, K. R. Demarest, and R. G. Plumb, “An FDTD/MoM hybrid technique for modeling complex antennas in the presence of heterogeneous grounds,” IEEE Trans. Geosci. Remote Sensing, vol. 37, no. 6, pp. 2692–2698, Nov. 1999. [48] M. F. Catedra, J. Perez, F. S. Adana, and O. Gutierrez, “Efficient ray-tracing techniques for three-dimensional analysis of propagation in mobile communications: application to picocell and microcell scenarios,” IEEE Antennas Propag. Mag., pp. 15–28, [49] R. Lee and C. Tse-Tong, “Analysis of electromagnetic scattering from a cavity with a complex termination by means of a hybrid ray-FDTD method,” IEEE Trans. Antennas Propag., vol. 41, no. 11, pp. 1560–1569, Nov. 1993. [50] Y. Wang, S. Safavi-Naeini, and S. K. Chaudhuri, “A hybrid technique based on combining ray tracing and FDTD methods for site-specific modeling of indoor radio wave propagation,” IEEE Trans. Antennas Propag., vol. 48, no. 5, pp. 743–754, May 2000. [51] A. Monorchio, A. R. Bretones, R. Mittra, G. Manara, and R. G. Martin, “A hybrid timedomain technique that combines the finite element, finite difference and method of moment techniques to solve complex electromagnetic problems,” IEEE Trans. Antennas Propag., vol. 52, no. 10, pp. 2666–2674, Oct. 2004. [52] P. G. Petropoulos, “Phase error control for FD-TD methods of second and fourth order accuracy,” IEEE Trans. Antennas Propag., vol. 42, no. 6, pp. 859–862, June 1994. [53] M. F. Hadi and M. Piket-May, “A modified FDTD (2, 4) scheme for modeling electrically large structures with High-Phase Accuracy,” IEEE Trans. Antennas Propag., vol. 45, no. 2, pp. 254–264, Feb. 1997. [54] K. Lan, Y. Liu, and W. Lin, “A higher order (2,4) scheme for reducing dispersion in FDTD algorithm,” IEEE Trans. Electromagn. Compat., vol. 41, no. 2, pp. 160–165, May 1999. [55] S. V. Georgakopoulos, C. R. Birtcher, C. A. Balanis, and R. A. Renaut, “Higher-order finite-difference schemes for electromagnetic radiation, scattering, and penetration .1. The- 164 参考文献 ory,” IEEE Antennas Propag. Mag., vol, 44, no. 1, pp. 134–142, Feb. 2002. [56] S. V. Georgakopoulos, C. R. Birtcher, C. A. Balanis, and R. A. Renaut, “Higher-order finite-difference schemes for electromagnetic radiation, scattering, and penetration .2. Applications,” IEEE Antennas Propag. Mag., vol 44, no. 2, pp. 92–101, April 2002. [57] J. B. Cole, “A high-accuracy realization of the Yee algorithm using non-standard finite differences,” IEEE Trans. Microwave Theory Tech., vol. 45, no. 6, pp. 991–996, June 1997. [58] 大谷忠生,工藤祥典,柏 達也, “Non-Standard FDTD 法を用いた大型 Cavity の散乱解析,” 信学論 C, vol. J84–C, no. 4, pp. 237–244, April 2001. [59] S. V. Georgakopoulos, R. A. Renaut, C. A. Balanis, and C. R. Birtcher, “A hybrid fourthorder FDTD utilizing a second-order FDTD subgrid,” IEEE Trans. Microwave Wireless Comp. Lett., vol. 11, no. 11, pp. 462–464, Nov. 2001. [60] S. H. Sun and C. T. M. Choi, “A new subgridding scheme for two-dimensional FDTD and FDTD (2,4) methods,” IEEE Trans. Magn., vol. 40, no. 2, pp, 1041–1044, March 2004. [61] H. E. A. El-Raouf, E. A. El-Diwani, A. E. H. Ammar, and F. M. El-Hefnawi, “A lowdispersion 3-D second-order in time fourth-order in space FDTD scheme (M3d24 ),” IEEE Trans. Antennas Propag., vol. 52, no. 7, pp. 1638–1646, July 2004. [62] T. T. Zygiridis and T. D. Tsiboukis, “Low-dispersion algorithms based on the higher order (2,4) FDTD method,” IEEE Trans. Microwave Theory Tech., vol. 52, no. 4, pp. 1321–1327, April 2004. [63] S. Wang and F. L. Teixeira, “Grid-dispersion error reduction for broadband FDTD electromagnetic simulations,” IEEE Trans. Magn., vol. 40, no. 2, pp, 1440–1443, March 2004. [64] 千葉雄樹,田口健治,工藤祥典,柏 達也,大谷忠生,“各種高精度 FDTD 法の数値分散特 性及び安定条件の比較検討,” 信学論 C, vol. J85–C, no. 12, pp. 1159–1167, Dec. 2002. [65] K. L. Shlager, J. G. Maloney, S. L. Ray, and A. F. Peterson, “Relative accuracy of several finite-difference time-domain methods in two and three dimensions,” IEEE Trans. Antennas Propag., vol. 41, no. 12, pp. 1732–1737 Dec. 1993. 165 [66] K. L. Shlager and J. B. Schneider, “Comparison of the dispersion properties of several low-dispersion finite-difference time-domain algorithms,” IEEE Trans. Antennas Propag., vol. 51, no. 3, pp. pp. 642–653, March 2003. [67] K. L. Shlager and J. B. Schneider, “Comparison of the dispersion properties of higher order FDTD schemes and equivalent-sized MRTD schemes,” IEEE Trans. Antennas Propag., vol. 52, no. 4, pp. 1095–1104, April 2004. [68] V. Varadarajan and R. Mittra, “Finite-difference time-domain (FDTD) analysis using distributed computing,” IEEE Trans. Microwave Guided Wave Lett., vol. 4, no. 5, pp.144–145, May 1994. [69] Z. M. Liu, A. S. Mohan, T. A. Aubrey, and W. R. Belcher, “Techniques for implementation of the FDTD method on CM-5 parallel computer,” IEEE Antennas and Propag. Mag., vol. 37, no. 5, pp. 64–71, Oct. 1995. [70] C. Guiffaut and K.Mahdjoubi, “A parallel FDTD algorithm using the MPI library,” IEEE Antennas Propag. Mag., vol. 43, no. 2, pp. 94–103, April 2001. [71] 打矢 匡,柏 達也, “並列型スーパコンピュータを用いた FDTD 並列計算,” 信学論 C, vol. J84–C, no. 11, pp. 1122–1125, Nov. 2001. [72] A. D. Tinniswood, C. M. Furse, and O. P. Gandhi, “Computations of SAR distributions for two anatomically based models of the human head using CAD files of commercial telephones and the parallelized FDTD code,” IEEE Trans. Antennas Propag., vol. 46, no. 6, pp. 829–833, June 1998. [73] L. Catarinucci, P. Palazzari, and L. Tarricone, “Human exposure to the near field of radiobase antennas - a full-wave solution using parallel FDTD,” IEEE Trans. Microwave Theory Tech., vol. 51, no. 3, pp. 935–940, March 2003. [74] T. Kashiwa, “Large-scale FDTD computation for computational electromagnetics,” 電学 論 A, vol. J124–A, no. 12, pp. 1129–1134, Dec. 2004. [75] T. Hikage, T. Nojima, S. Watanabe, and T. Shinozuka, “A Study on implantable car- 166 参考文献 diac maker EMI from cellular radios in semi-echoic environments,” in Proc. Int. Symp. of Electromagnetic Compatibility, Sendai, Japan, pp. 565–568, Aug. 2004. [76] J. Wang, O. Fujiwara, S. Watanabe, and Y. Yamanaka, “Computation with a parallel FDTD system of human-body effect on electromagnetic absorption for portable telephones,” IEEE Trans. Microwave Theory Tech., vol. 52, no. 1, pp.53–58, Jan. 2004 [77] 橋本利紀,山口優介,木村健一,橋本 修,“並列計算機を用いた FDTD 法による室内の電 波環境特性に関する基礎的検討,” 信学論 B, vol. J87–B, no. 5, pp. 756–759, May 2004. [78] 園田 潤, “ヘテロ PC クラスタにおける FDTD 並列計算の自動最適負荷分散,” 信学論 B, vol. J87–B, no. 5, pp. 760–764, May 2004. [79] 園田 潤, “校内教育用電子計算機群を用いた FDTD 並列計算による大規模電波伝搬解析,” 電学論 C, vol. 124–C, no. 7, pp. 1359–1366, July 2004. [80] C. G. Biniaris, A. I. Kostaridis, D. I. Kaklamani, and I. S. Venieris, “Implementing distributed FDTD codes with Java mobile agents,” IEEE Antennas Propag. Mag., vol. 44, no. 6, pp. 115–119, Dec. 2002. [81] L. Tarricone and A. Esposito, Grid Computing For Electromagnetics, Artech House, 2004. [82] 木村功児,園田 潤,“CD ブート Linux を用いたグリッドによる FDTD 並列計算の負荷分 散特性,” 第 3 回情報科学技術フォーラム FIT2004 講演論文集, pp.57–58, Sept. 2004. [83] A. K. Fung, M. R. Shah, and S. Tjuatja, “Numerical simulation of scattering from threedimensional randomly rough surfaces,” IEEE Trans. Geosci. Remote Sensing, vol. 32, no. 5, pp. 986–994, Sept. 1994. [84] F. D. Hastings, J. B. Schneider, and S. L. Broschat, “A monte-carlo FDTD technique for rough surface scattering,” IEEE Trans. Antennas Propag., vol. 43, no. 11, pp. 1183–1191, Nov. 1995. [85] K. Demarest, Z. Huang, and R. Plumb, “An FDTD near- to far-zone transformation for scatterers buried in stratified grounds,” IEEE Trans. Antennas Propag., vol. 45, no. 8, pp. 1150–1157, Aug. 1996. 167 [86] H. Israelsson, L. M. H. Ulander, T. Martin, and J. I. H. Askne, “A coherent scattering model to determine forest backscattering in the VHF-band,” IEEE Trans. Geosci. Remote Sensing, vol. 38, no. 1, pp. 238–248, Jan. 2000. [87] E. M. Nassar, and J. T. Johnson, and R. Lee, “A numerical model for electromagnetic scattering from sea ice,” IEEE Trans. Geosci. Remote Sensing, vol. 38, no. 3, pp. 1309– 1319, May 2000. [88] T. Dogaru and L. Carin, “Time-domain sensing of targets buried under a rough air-ground interface,” IEEE Trans. Antennas Propag., vol. 46, no. 3, pp. 360–372, March 1998. [89] J. M. Bourgeois and G. S. Smith, “A fully three-dimensional simulation of a groundpenetrating radar: FDTD theory compared with experiment,” IEEE Trans. Geosci. Remote Sensing, vol. 34, no. 1, pp. 36–44, Jan. 1996. [90] Y. Nishioka, O. Maeshima, T. Uno, and S. Adachi, “FDTD analysis of resistor-loaded bow-tie antennas covered with ferrite-coated conducting cavity for subsurface radar,” IEEE Trans. Antennas Propag., vol. 47, no. 6, pp. 970–977, June 1999. [91] L. Gurel, and U. Oguz, “Simulations of ground-penetrating radars over lossy and heterogeneous grounds,” IEEE Trans. Geosci. Remote Sensing, vol. 39, no. 6, pp. 1190–1197, June 2001. [92] B. Yang, and C. Rappaport, “Response of realistic soil for GPR applications with 2-D FDTD,” IEEE Trans. Geosci. Remote Sensing, vol. 39, no. 6, pp. 1190–1197, June 2001. [93] M. Sato, and M. Takeshita, “Estimation of subsurface fracture roughness by polarimetric borehole radar,” IEICE Trans. Commun., vol. E83–C, no.12, pp. 1881–1888, Dec. 2000. [94] T. Kim and H. Lee, “Antenna and propagation modeling of an indoor propagation channel for digital TV signal using FDTD,” IEICE Trans. Commun., vol. E86–B no. 6, pp.2068– 2072, June 2003. [95] Z. Yun, M. F. Iskander, and Z. Zhang, “Complex-wall effect on propagation characteristics and MIMO capacities for an indoor wireless communication environment,” IEEE Trans. 168 参考文献 Antennas Propag., vol. 52, no. 4, pp. 914–922, April 2004. [96] P. H. Aoyagi, L. Jin-Fa, and R. Mittra, “A hybrid Yee algorithm/scalar-wave equation approach,” IEEE Trans. Microwave Theory Tech., vol. 41, no. 9, pp. 1593–1600, Sept. 1993. [97] D. V. Krupezevic, V. J. Brankovic, and F. Arndt, “The wave-equation FD-TD method for the efficient eigenvalue analysis and S-matrix computation of waveguide structures,” IEEE Trans. Microwave Theory Tech., vol. 41, no. 12, pp. 2109–2115, Dec. 1993. [98] K. Ichige and H. Arai, “Concept and evaluation of a 2-D FDTD formulation based on expanded wave equation approach,” IEICE Trans. Electron, vol. E84–C, no.7, pp. 981– 993, July 2001. [99] J. Sonoda, “Fourth-order finite-difference time-domain with parallel computation using superclusters for large scale analysis of electromagnetic wave propagation,” in Proc. of International Workshop on Similarity in Diversity, p.18, June 2004. [100] T. Sterling, Beowulf Cluster Computing with Linux. MIT Press, 2002. [101] R. Buyya, High Performance Cluster Computing: Programming and Applications, Volume 2. Prentice Hall, 1999. [102] S. Scott, “Cluster Installation using OSACR,” International Conference on Cluster Computing, 2000. [103] http://www.pccluster.org/ [104] 高宮安仁, 真鍋 篤, 松岡 聡, “Lucie: 大規模クラスタに適した高速セットアップ・管理ツー ル,“ 情報処理学会研究報告 HPC,pp. 131–136, 2002. [105] W. Gropp, E. Lusk, and . Skjellum, Using MPI. MIT Press, 1999. [106] P. S. Pacheco 著, 秋葉 博 訳,MPI 並列プログラミング, 培風館,2001. [107] http://www-unix.mcs.anl.gov/mpi/mpich/ [108] F. Berman, G. Fox, T. Hey, and A. J. G. Hey, Grid Computing: Making the Global Infrastructure a Reality. Wiley, 2003. 169 [109] A. Abbas, Grid Computing: A Practical Guide to Technology and Applications. Charles River Media, 2004. [110] 笹生 健, 松岡 聡, 建部修見, “ヘテロなクラスタ環境における並列 LINPACK アルゴリズ ム,” 情報処理学会並列処理シンポジウム JSPP2002 論文集, pp. 71–78, 2002. [111] K. Rankin 著,須崎有康 監修,Knoppix Hacks, オライリー・ジャパン,2005. [112] P. Gray and S. Miller, “In search of clusters for high-performance computing education,” The 5th LCI International Conference on Linux Clusters, 2004. [113] http://bofh.be/clusterknoppix/ [114] http://www.frozentech.com/content/livecd.php [115] M. D. Bauer 著,豊福 剛 訳,LINUX サーバセキュリティ,オライリー・ジャパン,2003. [116] http://www.netperf.org/ [117] 宮崎保光,園田 潤,上乗有希,“ランダム媒質中物体の電磁波散乱に関する FD-TD 法によ る統計的解析,” 電学論 C, vol. 117–C, no.1, pp. 35 – 41, Jan. 1997. [118] Glenn S. Smith, An Introduction to Classical Electromagnetic Radiation. Cambridge University Press, 1997. [119] T. Kobayashi, F. Ohkubo, N. Takahashi, M. Yoshikawa, T. Miyamoto, H. Zhang, J. Takada, and K. Araki, “Overview and trends of UWB (ultra wideband) propagation studies,” Tech. Report of IEICE, WBS2003–1, pp. 1–6, March 2003. [120] 小林岳彦,“UWB 技術におけるアンテナ・伝搬および EMC の諸問題,” 信学技報, WBS2004– 7, pp. 31–36, March 2003. [121] Z. Irahhauten, H. Nikookar, and G.J.M. Janssen, “An overview of ultra wide band indoor channel measurements and modeling,” IEEE Trans. Microwave Wireless Comp. Lett., vol. 14, no. 8, pp. 386–388, Aug. 2004. [122] T. B. Welch, R. L. Musselman, B. A. Emessiene, P. D. Gift, D. K. Choudhury, D. N. Cassadine, and S. M. Yano, “The effects of the human body on UWB signal propagation in an indoor environment,” IEEE J. Select. Areas Commun. vol. 20, no. 9, pp. 1778–1782, 170 参考文献 Dec. 2002. [123] W. Ciccognani, A. Durantini, and D. Cassioli, “Time domain propagation measurements of the UWB indoor channel using PN-sequence in the FCC-compliant band 3.6–6 GHz,” IEEE Trans. Antennas Propag., vol. 53, no. 4, pp. 1542–1549, April 2005. [124] S. S. Ghassemzadeh, R. Jana, C. W. Rice, W. Turin, and V. Tarokh, “Measurement and modeling of an ultra-wide bandwidth indoor channel,” IEEE Trans. Commun., vol. 52, no. 10, pp. 1786–1796, Oct. 2004. [125] M. Z. Win and R. A. Scholtz, “Characterization of ultra-wide bandwidth wireless indoor channels: a communication-theoretic view,” IEEE J. Select. Areas Commun. vol. 20, no. 9, pp. 1613–1627, Dec. 2002. [126] D. Cassioli, M. Z. Win, and A. F. Molisch, “The ultra-wide bandwidth indoor channel: from statistical model to simulations, “ IEEE J. Select. Areas Commun. vol. 20, no. 6, pp. 1247–1257, Aug. 2002. [127] R. J. M. Cramer, R. A. Scholtz, and M. Z. Win, “Evaluation of an ultra-wide-band propagation channel,” IEEE Trans. Antennas Propag., vol. 50, no. 5, pp. 561–570, May 2002. [128] R. J. Fontana, “Recent system applications of short-pulse ultra-wideband (UWB) technology,” IEEE Trans. Microwave Theory Tech., vol. 52, no. 9, pp. 2087–2104, Sept. 2004. [129] Z. N. Low, J. H. Cheong, C. L. Law, W. T. Ng, and Y. J. Lee, “Pulse detection algorithm for line of sight (LOS) UWB ranging applications,” IEEE Antennas Wireless Propag. Lett., vol. 4, pp. 63–67, 2005. [130] N. Kuwabara, K. Tajima, R. Kobayashi, and F. Amemiya, “Development and analysis of electric field sensor using LiNbO3 optical modulator,” IEEE Trans. Electromagn. Compat., vol. 34, no. 4, pp. 391–396, Nov. 1992. [131] M. Sato and E. Igarashi, “3-D radar imaging by a passive electric field sensor,” in Proc. Int. Symp. of Electromagnetic Compatibility, Sendai, Japan, pp. 685–688, Aug. 2004. [132] E. Suzuki, S. Arakawa, H. Ota, K. Arai, R. Sato, and K. Nakamura, “EO probe for 171 simultaneous electric and magnetic near-field measurements using LiNbO3 with inverted domain,” IEEE Trans. Microwave Theory Tech., vol. 53, no. 2, pp. 696–701, Feb. 2005. [133] C. A. Balanis, Antenna Theory – Analysis and Design. John Wiley & Sons, 1982. [134] 遠藤敬二,佐藤源貞,永井淳,アンテナ工学,総合電子出版社,1979. [135] 手代木扶,アンテナ測定法の基礎と実際,アンテナ・伝搬における設計・解析手法ワーク ショップ(14 回) ,1999. [136] 新井宏之,新アンテナ工学,総合電子出版社,1996. [137] H. Togawa, K. Hatakeyama, and K. Yamauchi, “Reflectivity measurements in anechoic chambers in the microwave to millimeter range,” IEEE Trans. Electromagn. Compat., vol. 47, no. 2, pp. 312–319, May 2005. [138] J. G. Maloney, G. S. Smith, and W. R. Scott Jr., “Accurate computation of the radiation from simple antennas using the finite-difference time-domain method,” IEEE Trans. Antennas Propag., vol. 38, no. 7, pp. 1059–1068, July 1990. [139] K. L. Shlager, G. S. Smith, and J. G. Maloney, “Optimization of bow-tie antennas for pulse radiation,” IEEE Trans. Antennas Propag., vol. 42, no. 7, pp. 975–982, July 1994. [140] K. Kiminami, A. Hirata, and T. Shiozawa, “Double-sided printed bow-tie antenna for UWB communications,” IEEE Antennas Wireless Propag. Lett., vol. 3, pp. 152–153, 2004. [141] Kwan-Ho Lee, Chi-Chih Chen, F. L. Teixeira, and R. Lee, “Modeling and investigation of a geometrically complex UWB GPR antenna using FDTD,” IEEE Trans. Antennas Propag., vol. 52, no. 8, pp. 1983–1991, Aug. 2004. [142] R. J. Luebbers and H. S. Langdon, “A simple feed model that reduces time steps needed for FDTD antenna and microstrip calculations,” IEEE Trans. Antennas Propag., vol. 44, no. 7, pp. 1000–1005, July 1996. [143] K. L. Shlager, G. S. Smith, and J. G. Maloney, “Accurate analysis of TEM horn antennas for pulse radiation,” IEEE Trans. Electromagn. Compat., vol. 38, no. 3, pp. 414–423, Aug. 1996. 172 参考文献 [144] N. V. Venkatarayalu, Chi-Chih Chen, F. L. Teixeira, and R. Lee, “Numerical modeling of ultrawide-band dielectric horn antennas using FDTD.” IEEE Trans. Antennas Propag., vol. 52, no. 5, pp. 1318–1323, May 2004. [145] G. M. Turner and C. Christodoulou, “FDTD analysis of phased array antennas,” IEEE Trans. Antennas Propag., vol. 47, no. 4, pp. 661–667, April 1999. [146] G. C. Topp, J. L. Davis, and A. P. Annan, “Electromagnetic determination of soil water content: measurements in coaxial transmission lines, Water Resources Research, vol. 16, no. 3, pp. 574–582, June 1980. 173 本研究に関する発表論文 第2章 【原書論文】 [1] 園田 潤,” ヘテロ PC クラスタにおける FDTD 並列計算の自動最適負荷分散,” 電子情報通 信学会論文誌 B, vol. J87-B, no. 5, pp. 760–764, May 2004. [2] 園田 潤,” 校内教育用電子計算機群を用いた FDTD 並列計算による大規模電波伝搬解析,” 電気学会論文誌 C, vol. 124, no. 7, pp. 1359–1366, July 2004. [3] 園田 潤,木村功児,“CD ブート Linux を用いて構築したキャンパスグリッドにおける FDTD 並列計算の最適負荷分散,” 電気学会論文誌 C, 投稿中. [4] 園田 潤,木村功児,佐藤源之,“グリッドにおけるマルチプロセス法を用いた FDTD 並列 計算の負荷分散特性,” 電子情報通信学会論文誌 B, 投稿中. 【口頭発表】 [1] 園田 潤,“FDTD 法の陰的解法とその並列計算による大規模電磁波散乱解析,” 情報処理学 会東北支部平成 14 年度第 2 回研究会, 発表資料番号 02–2–11, Jan. 2003. [2] 園田 潤, “ヘテロな PC クラスタにおける並列 FDTD 法の最適負荷分散,” 情報処理学会東 北支部平成 14 年度第 4 回研究会資料, 発表資料番号 02–4–B12, March 2003. [3] 園田 潤, “校内教育用電子計算機群を用いた並列 FDTD 法による大規模電波伝搬解析,” 電 気学会 電子・情報・システム部門大会講演論文集 GS7–1, pp. 817–821, Aug. 2003. [4] 園田 潤, “校内教育用電子計算機群を用いた波動方程式の並列計算による大規模電波伝搬解 174 本研究に関する発表論文 析,” 第 2 回情報科学技術フォーラム FIT2003 講演論文集, pp. 11–12, Sept. 2003. [5] 木村功児 園田 潤,“大規模電波伝搬解析のための 1CD ブート Linux によるセキュアグ リッド環境の構築とその評価,” 情報処理学会東北支部平成 15 年度第 4 回研究会, 発表資料番 号 03–4–B4–4, March 2004. [6] 木村功児,園田 潤,“CD ブート Linux を用いたグリッドによる FDTD 並列計算の負荷分 散特性,” 第 3 回情報科学技術フォーラム FIT2004 講演論文集, pp. 57 – 58, Sept. 2004. [7] 木村功児, 園田 潤,“CD ブート Linux を用いたキャンパスグリッドの構築とマルチジョブ 法による FDTD 並列計算の負荷分散特性,” 情報処理学会東北支部平成 16 年度第 5 回研究会, 発表資料番号 04-05-14, March 2005. [8] 鈴木研太,木村功児, 園田 潤,“Globus を導入した CD Linux によるキャンパスグリッドの 構築と電波伝搬解析への応用,” 情報処理学会東北支部平成 16 年度第 6 回研究会, 発表資料番 号 04-06-B3-3, March 2005. 【その他】 [1] 園田 潤, “校内教育用電子計算機群を用いた並列計算による高速電磁波伝搬解析,” 仙台電波 工業高等専門学校研究紀要, vol. 33, pp. 7–14, Aug. 2003. [2] 園田 潤, 木村功児,若生一樹,“Linux Live CD による低コストかつセキュアな並列計算環 境の構築,” 仙台電波工業高等専門学校研究紀要, vol. 34, pp. 43–48, Aug. 2004. 第3章 【原書論文】 [1] 園田 潤,佐藤源之,“高次 WE-FDTD 法の並列計算による大規模電波伝搬解析,” 電子情報 通信学会論文誌 B, 投稿中. 本研究に関する発表論文 175 【国際会議】 [1] J. Sonoda, “Fourth-Order Finite-Difference Time-Domain with Parallel Computation using Superclusters for Large Scale Analysis of Electromagnetic Wave Propagation,” Proc. 9th International Workshop on Similarity in Diversity, p. 18, June 2004. 【口頭発表】 [1] 園田 潤, “大規模電波伝搬解析のための波動方程式に基づいた低分散 FDTD(2,4) 法とその 並列計算アルゴリズム,” 情報処理学会東北支部平成 15 年度第 3 回研究会資料, 03–3–3–4, Jan. 2004. [2] 園田 潤,“教育用計算機群を用いた WE-FDTD(2,4) 法の並列計算による大型 Cavity の電波 伝搬解析,” 電気学会 電子・情報・システム部門大会講演論文集 GS5–1, pp. 817 – 821, Sept. 2004. [3] 園田 潤,“高次 WE-FDTD 法の並列計算による大規模電波伝搬解,” 情報処理学会東北支部 平成 16 年度第 3 回研究会, 発表資料番号 04–3–27, Jan. 2005. 第4章 【原書論文】 [1] Jun Sonoda and Motoyuki Sato, “Large-Scale Analysis of EM Wave Propagation Using Three-dimensional Higher-Order FDTD With Parallel Computation,” IEICE ELEX , 投 稿中. 【口頭発表】 [1] 園田 潤,佐藤源之,“高次 FDTD 法の並列計算による大規模電波伝搬解析と光電界センサ を用いた室内 UWB パルス伝搬実験,” 電気学会電磁界理論研究会資料 EMT 05 – 25, pp.1–6, 176 本研究に関する発表論文 July 2005. [2] 園田 潤,佐藤源之,“クラスタを用いた高次 FDTD 法の並列計算による大規模電波伝搬解 析と光電界センサを用いた室内 UWB パルス伝搬実験との比較,” 東北大学電気通信研究所第 482 回伝送工学研究会, 講演資料 pp.1–8, June 2005. 関連論文 【原著論文】 [1] 宮崎保光,園田 潤,上乗有希,“ランダム媒質中物体の電磁波散乱に関する FD-TD 法によ る統計的解析,” 電気学会論文誌 C,vol. 117 no. 1,pp.35–41,Jan.1997. 【国際会議】 [1] J. Sonoda and Y. Miyazaki, “Dynamic Characteristics of Electromagnetic Scattering of Pulse Wave by Buried Object Using FD-TD Method,” in Proc. of International Symposium on Electromagnetic Compatibility (EMC’94), pp.382–385, May 1994. [2] J. Sonoda and Y. Miyazaki, “FD-TD Scattering Analysis of Electromagnetic Pulse Wave by an Object Buried in Random Media,” in Proc. of Sino-Japanese Joint Meeting on Optical Fiber Science and Electromagnetic Theory (OFSET’95) [3] Y. Miyazaki, J. Sonoda, and Y. Jyonori, “Statistical Reflection Properties of Electromagnetic Pulse by Buried Objects in Random Medium Using FD-TD,” in Proc. of 1996 International Symposium on Antennas and Propagation (ISAP’96), vol.3 ,pp.877–880, Sept. 1996. [4] Y. Miyazaki, J. Sonoda, and Y. Jyonori, “Statistical Characteristics of Reflections and Scatterings of Electromagnetic Radar Pulses by Buried Objects in Random Underground Media,” in Proc. of 6th International Conference on Ground Penetrating Radar (GPR’96), pp.151-154, Sept. 1996. 本研究に関する発表論文 177 [5] J. Sonoda and Y. Miyazaki, “Electromagnetic Scattering by Objects on the Stratified and Rough Surface Ground for Satellite Remote Sensing,” in Proc. of Asia-Pacific Radio Science Conference, p.174, July 2001. [6] J. Sonoda and Y. Miyazaki, “Electromagnetic Wave Scattering by Objects on the Stratified and Rough Surface Ground for Microwave Remote Sensing,” in Proc. of PIERS2001, p.408, Aug. 2001. 【口頭発表】 [1] 園田 潤,宮崎保光,“地中物体による電磁波散乱の FD-TD 法解析,” 平成 5 年電子情報通信 学会秋季大会, c–19, pp. 381, Sept. 1993. [2] 園田 潤,宮崎保光,“電磁パルスによる地中物体からの反射・散乱の FD-TD 法解析,” 平成 5 年電気関係学会東海支部連合大会, 471, p.236, Oct. 1993. [3] 園田 潤,宮崎保光,“地中物体によるパルス波の反射・散乱,” 平成 5 年電気学会電磁界理論 研究会, EMT93, Oct. 1993. [4] 園田 潤,宮崎保光,“FD-TD 法によるランダム媒質中の地中物体からの電磁波散乱解析,” 平成 6 年電子情報通信学会秋季大会, SB-2-6, pp.434–435, Sept. 1994. [5] 上乗 有希,園田 潤,宮崎保光,“FD-TD 法によるランダム媒質中の地下埋設物からの電 磁波散乱解析,” 平成 7 年電気学会電磁界理論研究会, EMT95, Oct. 1995. [6] 園田 潤,上乗有希,宮崎保光,“地中レーダに関するランダム媒質中物体の FD-TD 法によ る電磁波散乱解析,” 平成 7 年電子情報通信学会春季大会, SBC-1-8, pp.583–584, March 1996. [7] 園田 潤,宮崎保光,“ランダム媒質中物体による電磁波散乱の FD-TD 法解析とその統計的 性質,” 平成 7 年電気学会電磁界理論研究会,EMT-93-121,Nov.1996. [8] 園田 潤,宮崎保光,“地中レーダ用クラッタ除去フィルタの設計に関する研究,” 情報処理学 会東北支部 1997 年度第 4 回研究会,March 1998. [9] 園田 潤,宮崎保光,“人工衛星から斜入射される電磁波の FDTD 法と遠方界変換による散 乱解析,” 平成 12 年度電気関係学会東海支部連合大会講演論文集 p.194, Sept. 2000. 178 本研究に関する発表論文 [10] 園田 潤,宮崎保光,“人工衛星アンテナから斜入射された電磁波の散乱特性解析,” 電子情報 通信学会ソサイエティ大会講演論文集 C-1-27, p.27, Oct. 2000. [11] 園田 潤,宮崎保光,“人工衛星リモートセンサーにおける電磁波散乱特性の FDTD 法と遠 方界変換による解析,” 電気学会電磁界理論研究会, EMT-00-102, pp.19-24, Oct. 2000. [12] 園田 潤,宮崎保光,“マイクロ波リモートセンシングにおける層状大地上物体の電磁波散乱 特性 2000 年電子情報通信学会総合大会講演論文集 C-1-31, pp.31, March. 2001. 179 付録 A 2 階偏微分に対する空間 n 次精度の中心差分式 の導出 A.1 2 次精度 ある区間において,f (x) は n 回微分可能であるとき,f (x) は 任意の点 x = a の近傍で式 (A.1) のテーラー展開式で表すことができる. f (x) = f (a) + (x − a) ∂f (a) (x − a)2 ∂ 2 f (a) (x − a)3 ∂ 3 f (a) + + + O(∆x4 ) ∂x 2! ∂x2 3! ∂x3 (A.1) 式 (A.1) において,x = x + ∆x,x = x − ∆x とおくと,式 (A.2),(A.3) を得る. ∂f (x) (x + ∆x − x)2 ∂ 2 f (x) + + O(∆x3 ) ∂x 2! ∂x2 ∂f (x) (x − ∆x − x)2 ∂ 2 f (x) + + O(∆x3 ) f (x − ∆x) = f (x) + (x − ∆x − x) ∂x 2! ∂x2 f (x + ∆x) = f (x) + (x + ∆x − x) (A.2) (A.3) 式 (A.2),(A.3) を加算すれば,式 (A.4) の 2 階偏微分に対する空間 2 次精度の中心差分式が得ら れる. ∂ 2 f (x) f (x + ∆x) − 2f (x) + f (x − ∆x) = + O(∆x2 ) 2 ∂x ∆x2 (A.4) 180 付録 A.2 4 次精度 式 (A.1) において,x = x + ∆x,x = x − ∆x,x = x + 2∆x,x = x − 2∆x とおき,それぞれ を加算すると,式 (A.5),(A.6) を得る. ∂ 4 f (x) (∆x)4 ∂ 2 f (x) (∆x)2 + 2 + O(∆x6 ) 2 4 ∂x 2! ∂x 4! ∂ 4 f (x) (2∆x)4 ∂ 2 f (x) (2∆x)2 +2 + O(∆x6 ) f (x + 2∆x) + f (x − 2∆x) = 2 f (x) + 2 ∂x2 2! ∂x4 4! f (x + ∆x) + f (x − ∆x) = 2 f (x) + 2 (A.5) (A.6) ここで,x1 ,x2 を式 (A.7),(A.8) のようにおくと, ∂ 2 f (x) (∆x)2 ∂x2 ∂ 4 f (x) (∆x)4 x2 = ∂x4 x1 = (A.7) (A.8) 式 (A.9) を得る. ⎛ 2 ⎞⎛ ⎞ ⎛ ⎞ 1 b1 ⎜ 4! ⎟ x1 ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ = ⎝ ⎠ ⎜ ⎠ ⎝ 2 · 24 x2 b2 4 4! (A.9) ここで,b1 = f (x + ∆x) + f (x − ∆x) − 2f (x),b2 = f (x + 2∆x) + f (x − 2∆x) − 2f (x) である. 式 (A.9) より,式 (A.10) が得られる. ⎞ ⎛ ⎞ ⎛4 1 ⎛ ⎞ b x1 − ⎟ ⎜ 1⎟ 3 12 ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠=⎜ ⎠ ⎝ x2 b2 −4 1 (A.10) 式 (A.10) より,式 (A.11) の 2 階偏微分に対する空間 4 次精度の中心差分式が得られる. ∂ 2 f (x) 1 = 2 ∂x 12∆x2 + O(∆x4 ) − f (x + 2∆x) + f (x − 2∆x) + 16 f (x + ∆x) + f (x − ∆x) − 30f (x) (A.11) 181 A.3 6 次精度 A.3 6 次精度 式 (A.1) において,x = x + ∆x,x = x − ∆x,x = x + 2∆x,x = x − 2∆x,x = x + 3∆x, x = x − 3∆x とおき,それぞれを加算すると,式 (A.12)∼(A.14) を得る. ∂ 4 f (x) (∆x)4 ∂ 2 f (x) (∆x)2 + 2 ∂x2 2! ∂x4 4! 6 6 ∂ f (x) (∆x) + O(∆x8 ) +2 ∂x6 6! ∂ 4 f (x) (2∆x)4 ∂ 2 f (x) (2∆x)2 +2 f (x + 2∆x) + f (x − 2∆x) = 2 f (x) + 2 ∂x2 2! ∂x4 4! 6 6 ∂ f (x) (2∆x) + O(∆x8 ) +2 ∂x6 6! ∂ 2 f (x) (3∆x)2 ∂ 4 f (x) (3∆x)4 f (x + 3∆x) + f (x − 3∆x) = 2 f (x) + 2 + 2 ∂x2 2! ∂x4 4! 6 6 ∂ f (x) (3∆x) + O(∆x8 ) +2 ∂x6 6! f (x + ∆x) + f (x − ∆x) = 2 f (x) + 2 (A.12) (A.13) (A.14) ここで,x1 ,x2 ,x3 を式 (A.15)∼(A.17) のようにおくと, ∂ 2 f (x) x1 = (∆x)2 2 ∂x ∂ 4 f (x) (∆x)4 x2 = ∂x4 ∂ 6 f (x) (∆x)6 x3 = ∂x6 (A.15) (A.16) (A.17) 式 (A.18) を得る. ⎛ 2 1 ⎜ 4! ⎜ ⎜ ⎜ ⎜ 2 · 24 ⎜4 ⎜ 4! ⎜ ⎜ ⎝ 2 · 34 9 4! 2 ⎞⎛ ⎞ ⎛ ⎞ b 6! ⎟ x1 ⎟ ⎜ ⎟ ⎜ 1⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎟ ⎟ ⎜ ⎟ 2 · 26 ⎟ ⎜ ⎟ =⎜ x2 ⎟ ⎟⎜ ⎜ ⎜b2 ⎟ 6! ⎟ ⎜ ⎟ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎟ ⎠ ⎟ 6⎠ x3 b3 2·3 6! (A.18) ここで,b1 = f (x + ∆x) + f (x − ∆x) − 2f (x),b2 = f (x + 2∆x) + f (x − 2∆x) − 2f (x), b3 = f (x + 3∆x) + f (x − 3∆x) − 2f (x) である. 182 付録 式 (A.18) より,式 (A.19) が得られる. ⎛ ⎞ 3 3 1 ⎛ ⎞ ⎛ ⎞ − x1 ⎜ 2 ⎟ 20 90 ⎟ ⎜b1 ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟ 1 13 ⎜x2 ⎟ = ⎜ ⎟⎜ ⎟ 2 − ⎟ ⎜b2 ⎟ ⎜ ⎟ ⎜− ⎜ ⎟ ⎜ 2 6⎟ ⎜ ⎟ ⎟⎝ ⎠ ⎝ ⎠ ⎜ ⎝ ⎠ x3 b3 15 −6 1 (A.19) 式 (A.19) より,式 (A.20) の 2 階偏微分に対する空間 6 次精度の中心差分式が得られる. ∂ 2 f (x) 1 = 2 f (x + 3∆x) + f (x − 3∆x) − 27 f (x + 2∆x) + f (x − 2∆x) ∂x2 180∆x2 (A.20) + 270 f (x + ∆x) + f (x − ∆x) − 490f (x) + O(∆x6 ) A.4 8 次精度 式 (A.1) において,x = x + ∆x,x = x − ∆x,x = x + 2∆x,x = x − 2∆x,x = x + 3∆x, x = x − 3∆x,x = x + 4∆x,x = x − 4∆x,とおき,それぞれを加算すると,式 (A.21)∼(A.24) を得る. ∂ 2 f (x) (∆x)2 ∂ 4 f (x) (∆x)4 + 2 ∂x2 2! ∂x4 4! 6 6 8 ∂ f (x) (∆x)8 ∂ f (x) (∆x) +2 + O(∆x10 ) +2 ∂x6 6! ∂x8 8! ∂ 4 f (x) (2∆x)4 ∂ 2 f (x) (2∆x)2 + 2 f (x + 2∆x) + f (x − 2∆x) = 2 f (x) + 2 ∂x2 2! ∂x4 4! 6 6 8 ∂ f (x) (2∆x)8 ∂ f (x) (2∆x) +2 + O(∆x10 ) +2 ∂x6 6! ∂x8 8! ∂ 4 f (x) (3∆x)4 ∂ 2 f (x) (3∆x)2 + 2 f (x + 3∆x) + f (x − 3∆x) = 2 f (x) + 2 ∂x2 2! ∂x4 4! 6 6 8 8 ∂ f (x) (3∆x) ∂ f (x) (3∆x) +2 + O(∆x10 ) +2 6 ∂x 6! ∂x8 8! ∂ 2 f (x) (4∆x)2 ∂ 4 f (x) (4∆x)4 f (x + 4∆x) + f (x − 4∆x) = 2 f (x) + 2 + 2 ∂x2 2! ∂x4 4! 6 6 8 8 ∂ f (x) (4∆x) ∂ f (x) (4∆x) +2 + O(∆x10 ) +2 6 8 ∂x 6! ∂x 8! f (x + ∆x) + f (x − ∆x) = 2 f (x) + 2 (A.21) (A.22) (A.23) (A.24) ここで,x1 ,x2 ,x3 ,x4 を式 (A.25)∼(A.28) のようにおくと, x1 = ∂ 2 f (x) (∆x)2 ∂x2 (A.25) 183 A.4 8 次精度 ∂ 4 f (x) x2 = (∆x)4 4 ∂x ∂ 6 f (x) (∆x)6 x3 = ∂x6 ∂ 8 f (x) (∆x)8 x4 = 8 ∂x (A.26) (A.27) (A.28) 式 (A.29) を得る. ⎛ 2 4! 1 ⎜ ⎜ ⎜ ⎜ 2 · 24 ⎜ ⎜4 ⎜ 4! ⎜ ⎜ ⎜ 2 · 34 ⎜ ⎜9 ⎜ 4! ⎜ ⎜ ⎝ 2 · 44 16 4! 2 6! 2 · 26 6! 2 · 36 6! 2 · 46 6! 2 ⎞ ⎛ ⎞ ⎛ ⎞ 8! ⎟ x1 b1 ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ 2 · 28 ⎟ ⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ 8! ⎟ ⎜x2 ⎟ ⎜b2 ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎟ = ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ 2 · 38 ⎟ ⎜x3 ⎟ ⎜b3 ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 8! ⎟ ⎟⎝ ⎠ ⎝ ⎠ ⎟ ⎠ x4 b4 2 · 48 8! (A.29) ここで,b1 = f (x + ∆x) + f (x − ∆x) − 2f (x),b2 = f (x + 2∆x) + f (x − 2∆x) − 2f (x), b3 = f (x + 3∆x) + f (x − 3∆x) − 2f (x),b4 = f (x + 4∆x) + f (x − 4∆x) − 2f (x) である. 式 (A.29) より,式 (A.30) が得られる. ⎞ ⎛ 8 1 8 1 ⎛ ⎞ ⎛ ⎞ − − ⎟ ⎜ 5 x1 5 315 560 ⎟ b1 ⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎜ ⎜ ⎟ ⎜ ⎟ 169 2 7 122 ⎟ ⎜ ⎜b2 ⎟ ⎜x2 ⎟ ⎜− ⎟ − ⎜ ⎟ ⎜ ⎟ ⎜ 15 60 5 240 ⎟ ⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎜ ⎟=⎜ ⎟ ⎟⎜ ⎜ ⎜ ⎟ ⎜ ⎟ ⎟ ⎜b3 ⎟ ⎜x3 ⎟ ⎜ 1 ⎟ ⎜ ⎟ ⎜ 29 ⎟ −13 3 − ⎟⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 4 ⎝ ⎠ ⎜ ⎟⎝ ⎠ ⎠ ⎝ x4 b4 −56 28 −8 1 (A.30) 式 (A.30) より,式 (A.31) の 2 階偏微分に対する空間 8 次精度の中心差分式が得られる. ∂ 2 f (x) 1 = − 9 f (x + 4∆x) + f (x − 4∆x) + 128 f (x + 3∆x) + f (x − 3∆x) 2 2 ∂x 5040∆x − 1008 f (x + 2∆x) + f (x − 2∆x) + 8064 f (x + ∆x) + f (x − ∆x) − 14350f (x) + O(∆x8 ) (A.31) 184 付録 A.5 10 次精度 式 (A.1) において,x = x + ∆x,x = x − ∆x,x = x + 2∆x,x = x − 2∆x,x = x + 3∆x, x = x − 3∆x,x = x + 4∆x,x = x − 4∆x,x = x + 5∆x,x = x − 5∆x とおき,それぞれを加 算すると,式 (A.32)∼(A.35) を得る. ∂ 2 f (x) (∆x)2 ∂ 4 f (x) (∆x)4 ∂ 6 f (x) (∆x)6 + 2 + 2 ∂x2 2! ∂x4 4! ∂x6 6! 8 8 10 10 ∂ f (x) (∆x) ∂ f (x) (∆x) +2 + O(∆x12 ) +2 (A.32) 8 10 ∂x 8! ∂x 10! ∂ 4 f (x) (2∆x)4 ∂ 6 f (x) (2∆x)6 ∂ 2 f (x) (2∆x)2 + 2 + 2 f (x + 2∆x) + f (x − 2∆x) = 2 f (x) + 2 ∂x2 2! ∂x4 4! ∂x6 6! 8 8 10 10 ∂ f (x) (2∆x) ∂ f (x) (2∆x) +2 + O(∆x12 ) +2 (A.33) ∂x8 8! ∂x10 10! ∂ 4 f (x) (3∆x)4 ∂ 6 f (x) (3∆x)6 ∂ 2 f (x) (3∆x)2 + 2 + 2 f (x + 3∆x) + f (x − 3∆x) = 2 f (x) + 2 ∂x2 2! ∂x4 4! ∂x6 6! 8 8 10 10 ∂ f (x) (3∆x) ∂ f (x) (3∆x) +2 + O(∆x12 ) +2 (A.34) ∂x8 8! ∂x10 10! ∂ 2 f (x) (4∆x)2 ∂ 4 f (x) (4∆x)4 ∂ 6 f (x) (4∆x)6 f (x + 4∆x) + f (x − 4∆x) = 2 f (x) + 2 + 2 + 2 ∂x2 2! ∂x4 4! ∂x6 6! 8 8 10 10 ∂ f (x) (4∆x) ∂ f (x) (4∆x) +2 + O(∆x12 ) (A.35) +2 ∂x8 8! ∂x10 10! ∂ 4 f (x) (5∆x)4 ∂ 6 f (x) (5∆x)6 ∂ 2 f (x) (5∆x)2 +2 +2 f (x + 5∆x) + f (x − 5∆x) = 2 f (x) + 2 ∂x2 2! ∂x4 4! ∂x6 6! 8 8 10 10 ∂ f (x) (5∆x) ∂ f (x) (5∆x) +2 + O(∆x12 ) +2 (A.36) ∂x8 8! ∂x10 10! f (x + ∆x) + f (x − ∆x) = 2 f (x) + 2 ここで,x1 ,x2 ,x3 ,x4 ,x5 を式 (A.37)∼(A.41) のようにおくと, x1 = x2 = x3 = x4 = x5 = ∂ 2 f (x) (∆x)2 2 ∂x ∂ 4 f (x) (∆x)4 ∂x4 ∂ 6 f (x) (∆x)6 6 ∂x ∂ 8 f (x) (∆x)8 ∂x8 ∂ 10 f (x) (∆x)10 ∂x10 (A.37) (A.38) (A.39) (A.40) (A.41) 185 A.5 10 次精度 式 (A.42) を得る. ⎛ 2 4! 2 6! 2 8! 2 · 24 4! 2 · 26 6! 2 · 28 8! 2 · 34 4! 2 · 36 6! 2 · 38 8! 2 · 44 4! 2 · 46 6! 2 · 48 8! 2 · 54 4! 2 · 56 6! 2 · 58 8! 1 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜4 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜9 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜16 ⎜ ⎜ ⎜ ⎝ 25 2 ⎞ 10! ⎟ ⎛ ⎞ ⎛ ⎞ ⎟ x1 b ⎟ ⎜ ⎟ ⎜ 1⎟ ⎟ ⎟ ⎜ ⎟ 2 · 210 ⎟ ⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜b2 ⎟ x 10! ⎟ ⎜ 2 ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 10 ⎟ ⎜ ⎟ ⎟ 2 · 3 ⎟⎜ ⎟ ⎜ ⎟ b ⎟ ⎜x3 ⎟ = ⎜ 3 ⎜ ⎟ 10! ⎟ ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎟ ⎜b4 ⎟ x 2 · 410 ⎟ ⎜ 4 ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 10! ⎟ ⎠ ⎝ ⎠ ⎝ ⎟ ⎟ b5 ⎠ x5 2 · 510 10! (A.42) ここで,b1 = f (x + ∆x) + f (x − ∆x) − 2f (x),b2 = f (x + 2∆x) + f (x − 2∆x) − 2f (x), b3 = f (x + 3∆x) + f (x − 3∆x) − 2f (x),b4 = f (x + 4∆x) + f (x − 4∆x) − 2f (x),b5 = f (x + 5∆x) + f (x − 5∆x) − 2f (x) である. 式 (A.42) より,式 (A.43) が得られる. ⎛ 5 3 5 − 21 5 126 ⎛ ⎞ ⎜ x1 ⎜ ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ 1669 4369 541 ⎜x2 ⎟ ⎜− − ⎜ ⎟ ⎜ 180 1260 840 ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ 39 87 ⎜x3 ⎟ = ⎜ 323 − ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ 8 2 16 ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ ⎜x4 ⎟ ⎜ ⎜ ⎟ ⎜ −126 68 −23 ⎜ ⎟ ⎜ ⎝ ⎠ ⎜ ⎜ ⎝ x5 210 −120 45 5 − 1008 1261 15120 − 19 24 13 3 −10 ⎞ 1 ⎛ ⎞ 3150 ⎟ ⎟ b1 ⎟⎜ ⎟ ⎟⎜ ⎟ 41 ⎟ ⎜ ⎟ ⎟ ⎜b2 ⎟ − ⎜ ⎟ 7560 ⎟ ⎟⎜ ⎟ ⎟⎜ ⎟ ⎟⎜ ⎟ 13 ⎟ ⎜b ⎟ ⎟ ⎜ 3⎟ 240 ⎟ ⎜ ⎟ ⎟⎜ ⎟ ⎟⎜ ⎟ ⎜b4 ⎟ 1 ⎟ ⎜ ⎟ − ⎟ ⎟⎜ ⎟ 3 ⎟⎝ ⎠ ⎟ ⎠ b5 1 (A.43) 式 (A.43) より,式 (A.44) の 2 階偏微分に対する空間 10 次精度の中心差分式が得られる. 1 ∂ 2 f (x) = 8 f (x + 5∆x) + f (x − 5∆x) − 125 f (x + 4∆x) + f (x − 4∆x) ∂x2 25200∆x2 + 1000 f (x + 3∆x) + f (x − 3∆x) − 6000 f (x + 2∆x) + f (x − 2∆x) (A.44) + 42000 f (x + ∆x) + f (x − ∆x) − 73766f (x) + O(∆x10 ) 187 付録 B ニュートン法による分散関係式からの数値波数 k̃ の計算 B.1 ニュートン法による非線形多項式の解の計算 ニュートン法は,非線形多項式 f (x) = a0 xn + a1 xn−1 + · · · + an−1 x + an (a0 = 0) の f (x) = 0 の解を求める方法である.f (x) = 0 の解を x = α とすると,第一近似解 x1 は式 (B.1) で表さ れる. x1 = x0 − f (x0 ) f (x0 ) (B.1) これを x2 ,x3 · · · と x = α になるまで繰り返す.これより,ニュートン法の公式は式 (B.2) で表 される. xk+1 = xk − f (xk ) f (xk ) (B.2) B.2 WE-FDTD(2,4) 法の数値波数の計算 空間 4 次精度の WE-FDTD(2,4) 法の数値波数をニュートン法により計算する.WE-FDTD(2,4) 法の分散関係式は式 (B.3) で表される.ここで,θ は x 軸とのなす角である. 1 c∆t 2 1 − cos(2 k̃ cos θ∆x) + 16 cos( k̃ cos θ∆x) − 30 12∆x2 1 − cos(2 k̃ sin θ∆y) + 16 cos( k̃ sin θ∆y) − 30 + 12∆y 2 cos(ω∆t) − 1 = (B.3) 188 付録 式 (B.3) において,∆x = ∆y = ∆s,A = cos θ∆s,B = sin θ∆s とおくと式 (B.4) の非線形多 項式が得られる. ∆s − cos(2Ak̃) + 16 cos(Ak̃) − cos(2B k̃) + 16 cos(B k̃) − 60 = 12 c∆t 2 cos(ω∆t) − 1 (B.4) ここで,式 (B.4) から数値波数 k̃ を求めるときに,ニュートン法を用いる.式 (B.4) は式 (B.5) の ように変形できる. 2 ∆s f (k̃) = cos(2Ak̃) − 16 cos(Ak̃) + cos(2B k̃) − 16 cos(B k̃) + 60 + 12 cos(ω∆t) − 1 = 0 c∆t (B.5) 式 (B.5) を k̃ で微分すると,式 (B.6) を得る. f (k̃) = −2A sin(2Ak̃) + 16A sin(Ak̃) − 2B sin(2B k̃) + 16B sin(B k̃) 式 (B.5),(B.6) を式 (B.2) に代入して反復計算すれば,数値波数 k̃ が得られる. (B.6)
© Copyright 2025 Paperzz