発表論文 - 株式会社NTTデータ数理システム

『東北の声』のテキストマイニング分析
-死に関する表現の有無を手がかりにして-
和光大学 下条照世
1
問題
井上・いとう (2014)によると『東北の声』プロジェクトとは、東日本大震災及び津波の
発生1年後に始まったプログラムで、心理・社会学ワーカーらが被災者のトラウマの予防、
回復力の増加、対処メカニズムの基盤強化を手助けするために始められた。このプロジェ
クトには経験豊かなイスラエル人スタッフや他の国々のトラウマ治療家によるトラウマ予
防活動も含まれている。さらにこのプロジェクトでは、地元自治体やグローバル企業の日
本支社の協賛の下、仮設住宅内における文化イベントも行われている。
『東北の声』プロジェクトの主な内容としては、大震災以前のコミュニティの記憶、東
日本大震災を乗り越える体験の記録を残していくことが目的であり、現在までに 200 名位
上のインタビューが記録されている。このインタビューでは、実際に東日本大震災を体験
された方々のお話を映像に残し、貴重な史的資料として保存していき、10 年後、20 年後の
次の世代のために記憶から記録へ移行していくという役割を担っている。主に宮城県亘理
町、山元町、石巻市など、岩手県・福島県などに拡大し、国内 6 つのコミュニティでプロ
ジェクトを進めている。
上記のように、震災の経験はトラウマ的な場合も多く、震災関連死者にもそのようなス
トレスの影響が考えられる。その一方で震災を経験したことにより、語りを通して死につ
いて言及しているかどうかも重要な事柄である。本研究では、さまざまな被災者の語りの
中から死について言及しているかどうかの有無を見出し、震災が人々にどのような影響を
もたらしたかを明らかにしたい。
2
目的
本研究の目的は、
『東北の声』プロジェクト(2012)の被災者のインタビューを対象にして、
語りの中死について言及しているかどうかの有無を見出し、震災が人々にどのような影響
をもたらしたかの特徴をテキストマイニングの手法を用いて明らかにすることを目的とす
る。
(1) 分析対象
NPO 日本 IsraAID による被災体験アーカイブ作成のための『東北の声』プロジェクトで得
られた、200 名以上のインタビューの内、宮城県の亘理町、山元町、石巻市の 3 地域からの、
14 組 15 人(男性 8 人、女性 7 人)の面接映像を井上・いとう (2014)と同様に対象にした。
その映像の音声はすでにテープ起こしをされており、その文字データに転記されていたも
のを対象に、内容分析とテキストマイニングの手法により分析を行った。
1
(2)分析手順
分析手順としては、
『東北の声』プロジェクトで得られた、200 名以上のインタビューの
内、宮城県の亘理町、山元町、石巻市の 3 地域からの、14 組 15 人(男性 8 人、女性 7 人)
の面接映像を対象にした。すでにテープ起こしをされており文字データに転記されテキス
トファイル化されたものを、Microsoft Office Excel により、テキストマイニング用に CSV
(タブ区切り)データを作成して Text Mining Studio5.0 に読み込ませた。
テキストマイニングによる分析は(1)基本情報、
(2)単語頻度解析、(3)係り受け頻度
解析、
(4)特徴語分析、(5)原文における「死」についての語りの分析の順に行った。
3
結果と考察
(1)基本統計量
基本情報とは表 1 に示されたような 14 事例から得られたテキストの基本的な情報である。
一事例あたりの文字数は 3606.8 であり、総文数は 1927 文で平均当たりの文字数は 26.2 で
あった。また、内容語の延べ単語数は 20647 であり、単語種別数は 4673 であった。タイプ・
トークン比は、0.226 であった。
表 1 テキスト全体の基本統計量
(2)単語頻度解析
(2-1)名詞
単語頻度解析とは、テキストに出現する単語の出現回数をカウントすることによる分析
である。ここから、
『東北の声』に特有の表現(に登場した単語)を明らかにできる。図 1
は『東北の声』プロジェクトのインタビューの面接映像のテープ起こしをされており文字
データに転記済みのテキストファイル化されていたものを、Microsoft Office Excel によ
り、テキストマイニング用に CSV(タブ区切り)データを作成し、Text Mining Studio5.0
に読み込ませたものを単語頻度分析し、上位 20 の単語を横棒グラフで表したものである。
図 1 はテキストファイル内で使われた単語を集計し、順位付けをする単語頻度分析を行
い、具体的な数値を出した結果である。
全データでは、最も多用された形容詞は「良い」(87 単語、以下略)であり、
「すごい」(70)、
2
「寒い」(27)、「多い」(20)、「大きい」(20)、「早い」(17)、「強い」(16)、「辛い」(16)、
「高い」(15)、
「長い」(15)、
「明るい」(15)、
「欲しい」(15)、
「若い」(13)、
「悪い」(12)、
「小さい」(12)、
「嬉しい」(9)、
「悲しい」(8)、
「暗い」(8)、「楽しい」(8)、「近い」(8)、
「少ない」(8)、
「無い」(8)、
「有り難い」(8)であった。
「それ」という単語は「私」という単語と比べ、死について言及無しの人たちの方が低
いとあった。
「私」と言う単語は死について言及無しの人たちが一番単語頻度が高いとあっ
た。次に、
「人」の単語は「それ」よりも死について言及無しの人たちが多くみられた。
図 1 単語頻度解析(上位 20 単語)(名詞)
「いる」という単語は「来る」という単語と比べ、死について言及無しの人たちが僅か
に多いことが読み取れる。
「やる」と言う単語は「行く」という単語と単語頻度がほぼ僅差
であることがみられた。次に、
「作る」の単語は死について言及無しの人たちが一番少なく
みられた。
3
図 2 単語頻度解析(上位 20 単語) (死について言及している有無)(動詞)
2-2 形容詞
図 1 は『東北の声』プロジェクトのインタビューの面接映像のテープ起こしをされてお
り文字データに転記済みのテキストファイル化されていたものを、Microsoft Office Excel
により、テキストマイニング用に CSV(タブ区切り)データを作成し、Text Mining Studio5.0
に読み込ませたものを単語頻度分析し、上位 20 の単語を横棒グラフで表したものである。
1 番目にある「良い」が(死生観有り 45)(死生観無し 42 以下略)『東北の声』のキーワ
ードで、最も多く出現し、それに次いで「すごい」(死生観有り 64)(死生観無し 6)、そし
て「寒い」(死生観有り 21)(死生観無し 6)と続いていた。
「有り難い」(死生観有り 5)(死生
観無し 3)という単語も上位 23 以内に入ったことから、震災が起こった中でも感謝の気持ち
を持てていたということが読み取れる。
「すごい」という単語は「良い」という単語と比べ、死について言及有りの人たちの
方が圧倒的に単語頻度が高いとあった。
「良い」と言う単語も死について言及有りの人たち
4
の方が単語頻度が高いとあったが割合としては「すごい」の単語に比べ死について言及有
無の極端な差は見られなかった。
図 3 単語頻度解析(上位 23 単語)
(形容詞)
(3)係り受け頻度解析
係り受け頻度解析とは、テキストに出現する係り受け表現の出現回数をカウントするこ
とによる分析である。図4は『東北の声』プロジェクトのインタビューの面接映像のテー
プ起こしをされており文字データに転記済みのテキストファイル化されていたものの単語
の中で、どの単語との係り受けが多いのかを係り受け頻度分析を行って横棒グラフにして
更に色付きで死生観の有無を表したものである。横軸の数値は係り受け関係にある単語の
出現項数を表している。また、表3は係り受け頻度分析を行った結果を具体的な数値で表
したものである。
1 番目にある「人―いる」が最も多く、(死生観有り 13)(死生観無し 16 以下略)の計(29)
5
回であった。次に、
「津波―来る」(有 13)(無 10)計(23)、
「声-かける」(有 9)(無 3)計(12)、
「人-来る」(有 8)(無 3)計(11)、
「津波―くる」(有 10)(無 1)計(11)、
「話-聞く」(有 6)(無
4)計(10)、
「避難所-行く」(有 5)(無 4)計(9)、「家-帰る」(有 3)(無 5)計(8)、
「避難所-
いる」(有 7)(無 1)計(8)、
「2 階-生活」(有 1)(無 6)計(7)、
「瓦礫-撤去」(有 3)(無 4)計
(7)、
「人たち-いる」(有 5)(無 2)計(7)、
「2 階-上る」(有 1)(無 5)計(6)、「仮設-入る」
(有 3)(無 3)計(6)、
「家-入る」(有 5)(無 1)計(6)、
「絵-描く」(有 6)(無 0)計(6)、
「自分
たち-やる」(有 4)(無 2)計(6)、
「助け-求める」(有 1)(無 5)計(6)、
「人-いる+ない」(有
6)(無 0)計(6)、
「雪-降る」(有 6)(無 0)計(6)、
「地震-来る」(有 6)(無 0)計(6)、
「娘-い
る」(有 3)(無 3)計(6)といった係り受け表現が見られた。
図4 係り受け頻度解析 (死について言及しているかの有無)
6
(4)特徴語分析
特徴語分析とは、テキストに付随する属性ごとに、特徴的に出現する単語を抽出したも
のである。表 4-1 から表 4-3 は特徴語分析の結果をあらわしたものである。各セクショ
ンに対して属性の編集を行い、各項目を作成し、属性としてまとめた。
図 5 特徴語分析
(死の語りの有る場合)
図 5 は『東北の声』プロジェクトのインタビューの面接映像のテープ起こしをされてお
7
り文字データに転記済みのテキストファイル化されていたものを、Microsoft Office Excel
により、テキストマイニング用に CSV(タブ区切り)データを作成し、Text Mining Studio5.0
に読み込ませたものを特徴語分析属性頻度解析 (死生観の有無)し、上位 20 の単語を横棒グ
ラフで表したものである。
(5)原文における「死」についての語り
1菅原みさおさんの場合
「二度目の津波が来るとわかった際に、
「死ぬとしても自分だけだ、私が死んでも夫が残
れば大丈夫だな、両方死んだら可愛そうだけど夫は大丈夫だな」という気持ちがあった。
外にでると「頑張れ宮城!」というばかりで「私は生きているだけで頑張っているのに、
これ以上何を頑張ればいいの・・・」という気持ち。避難所にいるときは「しんどいです、
三人行方不明で二人亡くなって」という話を聞いても涙も出ないし、私はこんなに冷たい
人間だったのかなって、そんなふうにおもっていたりしていたが、絵本制作のため訪れた
荒浜で被災者の話を聞いた際、とても辛かった、話している途中で具合が悪くなったり、
帰ってきてから頭が痛くなったりしたため、一人に聞いたら3日くらい休んで聞く体勢を
整えてから聞きに行くなどの工夫をしていた。今後は絵本制作などを通して震災の状況を
伝えることが今自分に出来ることであれば(やっていきたい)。それをしないと辛い。
」
2伊藤一朗・静枝さんの場合
「自宅2階で震災にあい、津波に巻き込まれたが幸い瓦の屋根ではなく、トタンだった
ためバラバラにならず死なずにすんだことや、お巡りさんに津波がくると教わった10秒
か15秒後には津波が家に着いていたためその10秒、15秒の差で命が助かったことを
考えると、ラッキーというか運が良かったなあと思った。6メートル、10メートルとい
う数字がとなり町のスピーカーから聞こえてきて多分我々は助からないと思っていた。当
日は救助されず、夜には雪も降りものすごく寒かったため多分命はないなと思っていた。
本当にいろんな人が援助してくれるため日本に生まれて本当に良かったなと思った。逆に
言うと楽しかった、人の優しさにはものすごく触れたと感じた。
」
3千尋義和さんの場合
「女房が海の方のスーパーに買い物に行っていた際、津波に遭い運転中に水が入ってき
てしまった。たまたまあいていた空家の2階で一晩過ごした際に寒いし、もうだらだらだ
し空き家だから何もなくてたまたまプラスチックのごみ袋がありそれに足を入れて体をさ
すり凍えないようにした。
「生きなくちゃ生きなくちゃって、死にたくない」とそればっか
りで一晩過ごしてなんとかかんとか自分で朝を待った。そして自身の息子が遺体で見つか
った。そのことを山形にいる母親に伝えると、夜になると86歳になる母の枕元に孫が出
て眠れないんだって。霊感っていうのかな。夜の12時頃に待ち合わせをして母親をあわ
せに言ってそれでやっと落ち着いたっていう。
」
4増沢真理子さんの場合
「もうなってしまったことはしょうがないんだから、っていうとあんたは被災してない
8
んだからって言われるかもしれないけれど、それはそれで仕方のないことだから、生きて
る以上は前を向いて進んでいかなければなと思います。そしてみんなに生きてて欲しいし、
元気になってほしいと思う。だから私もみんなと一緒に頑張りたいと思っています。
」
5渡辺修次さんの場合
「校長として避難所を手配していたが、地域の人で周りも7~8人亡くなった人たちも
いるし、生徒も4人ほど亡くなって。4人亡くなった思いとかは友達とかクラスメイトで
いたと考えると非常に心に整理がつかなかったですかね。その後は毎日同じ生活を繰り返
すことの大事さが身に染みてわかるんですよ。山元町で亡くなった約700名も、きっと
亡くなった人たちも今日生活したいと思っていたはずなんですね。そういうことを考えた
ら私は私なりに一生懸命生きてそういう人たちの気持ちを伝えていかなければならないと
いう役割を担っているのではないかなと思っています。ですから皆で力を合わせて山元町
の復興のためにも頑張っていきたいなっていうふうに思っています。
」
6竹内栄喜さんの場合
「震災は凄く悲しい出来事でした。いまだに引きずっていることですとかいまだに夜に
なると思い起こすこととかはいっぱいあるんですけど、それと同じくらい、いろんな人の
励ましとか、優しさとか温かい想いに触れることができたので、それがあるからこそなん
か、前に進めるかなっていう風に思えます。だから、ある想いを持ったけれども震災で絶
えてしまった人生とか、想いを持った人たちの分まで頑張って行かなきゃいけないのかな
っていう想いでこれからの一日一日を重ねて行きたいなっていう風に思います。
」
7亀山貴一さんの場合
「自分の実家で母親と祖父母と4人、津波で亡くなりまして。もう最初はてっきり浜に
いるものだと思っていたんですけれど、まあいなかったので、もうひたすら探しに出て、
見つかったのは結局3週間後くらいに、遺体安置所でみつけたんですけれどもまあそれで
1人で住むのも学校も被災していましたので、自分の生活もままならない感じでしたので。
実家に戻って浜からは1年離れていましたね。生徒も大半が被災して、親が亡くなったり、
家が無いっていう生徒が多かったんですよね。震災の時も色々なものを奪われたんですけ
れども、やっぱり色々な方に助けて頂いて、改めて人の繋がりと人の有り難さっていうの
は本当に感じまして。」
8橋元伸一さんの場合
「今回の津波によって父が亡くなりました。1時間以上水に浸かりっぱなしだったので
うちの父はそれで低体温症で亡くなってしまいました。私の目の前で。結局逃げた物置の
屋根の上から娘と妻がずっと見ているわけですよ。二人は私たち二人を見ていて、たぶん
あの二人が一番辛い思いをしていると思う。目の前で祖父が死んでいくのを見ているから、
最初の内は娘もうちの妻も私たちが殺したと言ってたんですよ。助けてあげられなかった
って。
」
9
9佐々木恭子さんの場合
「父親がリビングのところで溺死していた。ソファーに横にして亡くなっていたってい
う報告を聞いてその時はまだ「えーそうなの?うーん。信じられない」っていう状況で、
それから病気で危篤状態の母親にいうかどうかで悩み、母親に父親が亡くなったことを伝
えると「えぇ!」っとだけしか言わなかった。次の日の朝に母親の元へ行くと母親は亡く
なっていた。思ったのは、母親は温かい病院で亡くなってよかったなって、父親は冷たい
ところで亡くなって、申し訳なかったなって思ったんですけど、でも他の方はまだ遺体が
みつからない状況でとか、それに比べればうちは恵まれている方って感じました。」
10小野明さんの場合
「まさかあれくらい大きな津波が来るとは思っていなかったため、自分の心に隙も実際
ありました。目の前に津波が見えましたので動揺もありましたし、ここで自分の一生が終
わるのかなとも思いました。わたしの義理の兄も、お父さん、お母さん、わたしの近い親
戚2人も津波で行方不明という情報がすぐ入ってきましたので、当然私個人としてはその
方の捜索、探しに行きたいという気持ちが当然ありますよね、しかし、仕事は地域住民の
ための仕事ですのでそこに行けない。個人的に義理の兄の捜索も行けない、本当に近しい
親戚の人を探しにいけないという無念さがたしかにありましたけれど、でも仕事柄しょう
がないですよね。無事数日後に遺体で見つかったんですけども、それはよかったのかなと
思いますけども、そういう時消防としての災害に対して働くのが私たち消防の使命ですの
で、それはいたしかたがないことかなと割り切って仕事はしましたけれど、若干心残り、
探してやりたいなという心残りはありました。
」
5
まとめー『東北の声』における分析
(1) 「東北の声」の語りにおける死の言及とポジティブな内容
人々の語りは地震で被災する前と後では命の大切さや生きることの意味について色々
な人の励ましや、優しさ、温かい想いに触れることができたことで前に進める感情がでて
きて、被災をしたことを肯定的に捉えられるようになった。
行方不明になった後、遺体で見つかった事に対し遺体が見つからない人に比べ、恵まれ
ているといえるといったポジティブな意味合いをもつ感情を感じていることが見えてきた。
震災の出来事を形にして伝える傾向もみられる。
(2) (井上 2014)援助者セラピー原則と死の語りの比較
井上(2014)「東北の声」の語りにおける援助者セラピー原則(HTP)について検討している。
援助者セラピー原則とは、(1)援助する人はより自立的になる、(2)似た問題を抱える人の
援助をすることで、距離を置いて自分の問題を考えることができる(3)援助の役割を持つこ
とにより社会的有用性の感覚が得られるという利点がある。本研究では死の語りがあるか
どうかに着目した。井上の分類によれば、職業的援助者な場合、死の語りを語っていたの
は6人中3人であった。ボランティア援助者に関しては、4人中3人であった。これらの
死を語る非援助者に関しては、4人中4人であった。これらの人数割合を見てみると、職
10
業的援助者、ボランティア援助者、非援助者の中で非援助者の人数割合が一番高いことが
判明した。つまり、職業的援助者は身近な死については語らない人も半数近くいるという
ことが分析できた。更に男女別で仕分けると男性8人中7人、女性7人中3人が死につい
て語っている。よって女性のほうが死について語ることが少ないことが判明した。
職業的援助者は自分ができることはどんどんしていきたい、自己効力感が高いというこ
とが分かっている。
ボランティア援助者の語りでは、震災前と震災後で今まで気づけなかったことに気付くこ
とができ、震災がきっかけで今まで関わりのなかった人とのつながりができたということ
が分かっている。
非援助者の被災者の語りでは被災をしてものすごく大変な思いをしたけれど、人と話す
ことによりポジティブに考えられるようになった。(将来の希望)、生まれた土地であるた
めこれからも住み続けたいという地域につながりを求めるということが分かっている。
(3) 本研究の意義:死の中の命の語り
語りの中、死について言及しているかどうかの有無を見出し、震災が人々にどのような
影響をもたらしたかの特徴をテキストマイニングの手法を用いて明らかにすることを目的
としていたが、今回単語頻度の解析結果「良い」が(死についての語り有り 45)(死について
の語り無し 42)というように死についての語り有りの人々の語りの場合のほうが「良い」と
いうポジティブな単語が抽出された。ことにより被災をしたとしても悪いことだけではな
く、自身にとって良い方向へ向かうこともあるということが分析できた。
(4) 本研究の限界と今後の課題
15 人 14 組の対象のデータが少なかった。より多様な語りに基づいたデータの分析が今後
必要である。しかしながら、死の表現を手がかりにしながら前向きに生きている姿や死と
瀬戸際の経験をしたからこそ自ら見いだせた価値観などを学べたのはとても有益だった。
6
謝辞
学生研究奨励賞の原稿作成にあたり、
「Text Mining Studio バージョン 5.0」を使用させ
て頂きました NTT データ数理システム様に感謝いたします。また、本論文を作成するにあ
たり、指導教官の伊藤武彦教授から丁寧かつ熱心なご指導を賜りましたことに感謝いたし
ます。
7 文献
井上(2014)東北被災者における援助体験学(Helper experience research)~援助者セラ
ピー原則(Helper therapy principle:HTP)に着目して~,和光大学
講演と苦労体験学
(Suffering experience research)シンポジウム<語りに基づく患者体験学・被災体験
学・援助体験学の構築>
井上・いとう(2014)東日本大震災の被災者の語りの特徴~『東北の声』における心的外傷後
成長~(Posttraumatic Growth:PTG)第 21 回多文化間精神医学会学術総会
齋藤裕也(2013)ある数学者の精神病との戦い(NTT 数理システムサイトより)
11
安氏・いとう(2014)保育者養成教育における音楽授業を通しての生と死の教育鑑賞と作詞・
作曲活動の学生アンケートのテキストマイニング(Death education through music
class in early childhood teacher training A text mining analysis of students’
narrative on the music appreciation and composition activities)『全国大学音楽教育
学会三十周年記念研究論文』
12