和歌山大学独創的研究支援プロジェクト 紀伊半島における災害対応力の強化
-想定を越える災害への備え-
近年,地震や大雨などの自然災害の増加に伴い,防災や減災についての意識が高まっています.例えば経済産業省商務情報政策局がまとめた資料では, 災害時の情報に関する課題として「迅速な情報収集」,「デマに惑わされない分析」,「関係者への素早い情報共有」などが指摘されています.
防災・減災についての情報を入手する手段の一つに,インターネットを用いてブログ記事など,Web上の記事を取得し閲覧することが考えられます.しかしWeb上には災害についての記事が多数存在し,必ずしも欲しい情報が手に入るとは限りません.また,その内容が有益であるかの判断がすぐにはできないものもあります.Yahoo!ブログの災害カテゴリでは,毎月数千件の記事が掲載されていますが,記事の中には,「台風」や「雨」が書かれていても,内容は災害と関係の薄いものも見られます.
そこで,災害に関して読む価値のある記事を集約し,全文検索をはじめ様々な方法で容易に記事にアクセスできるようにすること,および記事分析を効率良く行えるためのプラットフォームの構築を目的として,災害記事データベースシステムを開発してきました.
本システムは,「収集分類プログラム」「収集記事データベース」「検索閲覧インタフェース」によって構成されます(図-1).収集分類プログラムは,サーバ上で稼働し,URLをもとに記事データを取得して,本文抽出を行います.本文を解析して単語に分割し,そこから災害記事であるか否か,また災害記事の場合は「地震」「大雨」などのうちどの分類に属するかを判定します.一連の処理をRuby言語で記述し,本文抽出や単語分割(形態素解析),記事分類にはそれぞれ既存のソフトウェアを呼び出すようにしました.
収集記事データベースは,任意の検索語による検索(全文検索)や,作成年月・分類による複合的な検索を瞬時に行えるよう,全文検索エンジンGroongaを導入して構築しました.