背景と目的
国や地方自治体は,Webサイトを通じて,様々な防災関連情報を提供していますが,近年では地方自治体がTwitterを活用した防災関連情報の収集・発信を行うなど,災害時における情報発信手段は多様化しています.また,災害時に人々が利用する情報収集手段としては,テレビに次いでインターネットが利用されています(参考:総務省|平成28年版 情報通信白書|アンケート結果).加えて,収集する情報には,災害規模,安否情報,警報・注意報,避難関連情報,交通運行情報等,種類が多く,情報を見逃してしまう可能性があります.このような背景を踏まえ,本研究では災害の突発的な事例に対する情報収集手法を模索します.
突発的な事例として,2017年10月の台風21号をあげます.南海本線(参考:ホーム|南海電鉄,大阪~和歌山間を結ぶ南海電気鉄道の鉄道路線)では,大雨の影響により樽井駅~尾崎駅間で橋脚が陥没し,線路が歪曲してしまいました.このとき,利用者に電車の運行情報やバスの振り替え輸送の案内がなされました.しかし,それらの情報は公式ページ上で即座に公開されず,利用者間でニュースやTwitterを利用して情報を収集するしかありませんでした.また,この出来事から,「南海本線」という語句は災害と関連する語句になったと考えられます.
そこで本研究では,インターネット上で提供される災害関連情報から,従来災害と関連することのなかった語句を抽出し,表示します.さらに,ユーザに検索を促すことで,大量に散在する情報の中での重要な災害関連情報が見逃されないようになることを目指しています.
情報見逃し防止手法
本研究で提案する手法について記します.手法は主に,(1)最新ニュース記事の収集,(2)形態素解析による単語の抽出,(3)記事のトピック解析,(4)トピックワードの画面表示,(5)災害情報の検索,の5項目から構成されます.
(1) 最新ニュース記事の収集
新聞社,放送社のニュースサイトから「社会」,「地域」カテゴリの記事を収集します.これらのカテゴリには災害情報が含まれる可能性が高いと考えたためです.収集にはRSSという,Webサイトの更新情報の日時やタイトル,その内容の要約などを配信するための文書形式を利用しています.
(2) 形態素解析による単語の抽出
(1)で収集した記事に対して,形態素解析を行います.形態素解析とは,文から意味を持つ最小単位の語句列に分割し,それぞれの品詞を判別するものです.形態素解析をすることで,収集したニュース記事から固有名詞と一般名詞のみを抽出することができます.
(3) 記事のトピック解析
(2)で抽出した語句をもとに,その記事が何について記述されているのかを推定します.推定にはLDA(潜在的ディリクレ配分法)というトピックモデルを用いています.図1に,LDAの概要例を示します.確率分布によってトピックモデルを生成します.具体的には,文書ごとのトピック分布(図1左:ある文書が,政治トピック25%,スポーツトピック50%,医療トピック25%,と推定される)と,トピックごとの単語分布(図1右:選挙が0.1%で,首相が0.1%で,採決が0.1%で,政治トピックと推定される)を生成することで,「このトピックには,この単語が出現しやすい」=「このトピックだと推定された単語が多数出現すれば,この文書はそのトピックになる」といったことが分かります.
図 1. LDA(潜在的ディリクレ配分法)の例 |
---|
(4) トピックワードの画面表示
(3)で生成したトピックモデルから,トピック毎に分類された単語のうち上位20個をシステム画面に表示します.このとき,あるトピックワード群の中に「台風」「噴火」などの災害語句が存在すれば,同一トピックに存在する単語は災害関連語句とみなすことができます.
(5) 災害情報の検索
災害情報検索ツールとして利用します.トピックに表示された災害関連語句や災害語句で,概況を把握することができます.また,災害関連語句や災害語句でのWeb検索をユーザに促進します.
情報見逃し防止システム Saipic (サイピック)
このシステムはWebブラウザ上のアプリケーションです.平常時は自分と異なる地域の災害情報を認知し,予備知識を蓄積します.非常時は災害情報収集の補助として,防災行動に役立てます.
図2に,システム構成を示します.手法内容のうち,(1)~(3)がサーバ側で定期実行され,(4)と(5)はクライアント側で実行します.
図 2. システム構成 |
---|
動画1に,システムのデモ映像を示します.ユーザはトピックタブを切り替えることで,それらに含まれるトピックワードから直感的に情報を把握することができます.また,トピックワード群にある語句をクリックで検索ボックスに入力し,Google検索またはTwitter検索を行うことができます.このように,本システムでは災害関連語句から情報を得ることができます.
動画 1. デモ映像 |
---|
今後は,収集するニュース記事のカテゴリを災害系により絞ることと,災害関連語句を分かりやすくユーザに提示することを目指します.
口頭発表
- 安田 大誠,吉野 孝 : 防災関連情報集約システムにおける関連表示を用いた情報見逃し防止手法の提案,情報処理学会第80回全国大会,6X-08,第4分冊,pp.127-128 (2018-03-15).
連絡先
- 安田 大誠 : s206269[at]center.wakayama-u.ac.jp
- 吉野 孝 : yoshino[at]sys.wakayama-u.ac.jp