野鳥の生態調査のための画像データセットの構築 吉橋亮太 † 川上玲 † 飯田誠 ‡ 苗村健 † † 東京大学 大学院情報理工学系研究科 ‡ 東京大学 先端科学技術研究センター E-mail: yoshi@nae-lab.org 図 1 データセット の構造 図2 画像例 1 はじめに 風力発電所における鳥とブレードの衝突(バードス トライク)による生態系への悪影響が懸念されている. 対策のため,周囲を飛行している鳥の種類や飛行経路 を明らかにする生態調査が必要であるが,人手による 調査は高コストであり,物体認識による自動化が期待 されている.物体認識には大量の学習用画像が必要で あるが,既存の画像データセットの内鳥画像を含むもの [1][2] は,鳥を遠方から撮影した画像や時系列が含まれ ず,風車周囲の生態調査目的には十分でない.一方で, 生態調査に向けた鳥検出システムとして,背景差分法 と識別器を組み合わせた手法 [3] が提案されているが, [3] の学習用鳥画像は,専門家でない者により作成され ているため,鳥の種類が不明な点,画像枚数が 3000 枚 弱と機械学習用としては完全でない点,撮影場所が風 車の周囲ではなかった点などのために,人手による調 査との相関が評価できなかった. そこで本稿では,風力発電所での生態調査に向けた 基準となる野鳥画像データセットを提案する.データ セットは,風車のある風景の連続写真を含み,各画像に は鳥の位置を示すバウンディングボックスと,鳥の種 類を示すラベルが付加されており(図 1),合計 15725 枚の鳥画像が含まれる.ラベル付けは日本野鳥の会会 員らによって行われており,詳細な鳥の種類が参照で きる.このデータセットは生態調査のための鳥検出や, 多クラスの詳細な画像分類の研究に利用できる.デー タセットはウェブ公開する予定である. 2 鳥画像データセットの構築 データセットの画像は,近畿地方の風力発電所に固 定カメラを設置して撮影した.検出に必要な鳥画像の 解像度は 20 ピクセルであるとの [3] の知見から,カメ ラの解像度は 5616 × 3744 ピクセル,望遠レンズを用 い画角は 27 °× 18 °とした.これにより 700m 離れた 図3 鳥認識の ROC 曲線 大きさ 1m の鳥が 20 ピクセルで写る.2 秒間隔で 7 時 間撮影を行い,10815 枚の画像が得られた.日本野鳥の 会会員らに依頼し,人手により画像中の鳥の周りにバ ウンディングボックスを設定し,種類の入力を行った. 結果として 15725 羽の鳥が発見された.また鳥以外の 飛行物体も記録し,飛行機や昆虫などが 2399 体発見 された.これは鳥認識のための負例として利用できる. 図 2 はバウンディングボックス内の鳥画像の例である. 様々な解像度の画像が含まれ,鳥の種名が詳しく判明 している.現在も継続してデータを増やしており,写 真 30000 枚分までデータセットを拡張する予定である. 3 鳥認識の実験 データセットの応用の一例として,鳥/非鳥の二クラ ス分類を行った.テストサンプルとして,画像の時系 列から背景差分法により切り抜かれた領域を利用した. 学習用の正例としては鳥領域,負例としては 1. 背景領 域,2. 鳥でない飛行物体の領域,の二種類を用いた.特 徴量として Haar-like または HOG,識別器として Real AdaBoost を用いた.図 3 に示すように,負例に関わら ず Haar-like によって HOG より良い認識結果を得た. Haar-like を用いて負例を変えたときの精度を比べると, 1. 負例が背景のときは偽陽性率が 0 のとき真陽性率が 0.99 という良い結果が得られるものの,2. 負例が飛行 物体のときは偽陽性率が 0.1 でも真陽性率が 0.86 と精 度が低い.鳥と飛行機,昆虫といった似た画像の識別 精度を向上していくことが課題であることが分かる. 参考文献 [1] J. Deng et al., “ImageNet: A Large-Scale Hierarchical Image Database,” Proc. CVPR,pp. 248–255 (2009). [2] P. Welinder et al., “Caltech-UCSD Birds 200” (2010). [3] 白石ら,“バードストライク防止のための画像認識を用い た鳥の検出”,風力エネルギー学会,pp. 96–103(2012).
© Copyright 2024 Paperzz