1背景と目的
近年,訪日外国人数や在日外国人数がは増加しています.しかし,日本語が理解できない外国人への対応は十分なものとは言えません.特に医療分野では,正確な情報の共有が重要です.そこで,現在,医療分野への提供を目的とした用例対訳の収集が行われています.用例対訳は正確性の評価が必要です.しかし,医療現場で必要とされる用例の数は多く,十分な数の用例の作成は困難なため,用例の収集のための研究が多く行われています.
また,機械翻訳を用いた多言語間コミュニケーションの支援の研究も行われています.しかし,機械翻訳の翻訳精度は高いとは言えず,機械翻訳の結果のみを用いて多言語間コミュニケーションを行うことは難しいです.
そこで本研究では,クラウドソーシングを用いて機械翻訳後の用例を評価・訂正することで正確な用例対訳が作成できる可能性があると考え,クラウドソーシングを用いた用例対訳作成手法の提案を行いました.
2作成の流れ
(1)用例の取得
本研究では,多言語用例対訳共有システムTackPadにおいて収集された用例を使用します.
(2)機械翻訳
(1)で取得した用例を機械翻訳サービスを用いて別の言語の文に翻訳します.
(3)機械翻訳後の文の評価・訂正
(2)で作成した機械翻訳後の文を,クラウドソーシングを用いて評価と訂正を行います.この際,機械翻訳後の言語と,訂正・評価を行う人の母語が一致させるため,多少誤った機械翻訳文でも正しく訂正が行える可能性があります.
図1. クラウドソーシングを用いた用例対訳作成の流れ |
---|
3クラウドソーシング
クラウドソーシング(crowdsourcing)とはインターネットを利用して不特定多数の作業者に業務を委託するという雇用形態のことです.委託する業務の種類は多様で,低コスト,短時間で業務を行うことが可能です.
ヒューマンコンピュテーション(Human Computation)
ヒューマンコンピュテーションは,人の知や力を利用することで計算機には難しい処理を行うことです.たとえば,画像からの文字の読み取りこの仕組みは,クラウドソーシングで業務を依頼する際に利用されることがあります.
図2. クラウドソーシングの仕組み |
---|
4用例対訳作成のためのタスク画面
機械翻訳前の処理
本研究では,どの用例を機械翻訳にかけるかを決定したり,機械翻訳後の文の評価を依頼する画面に表示する情報を決定したりするための処理にもクラウドソーシングを用いました.
図3では,用例が正しいかどうか,正しくない場合は何が間違っているのかを判定するタスクと,用例の使用者の判定を行うタスクを示しています.
図3. 機械翻訳前の用例について依頼したタスク画面 |
---|
機械翻訳後の用例の評価・訂正
図4では,使用者が判定された用例に対して行った機械翻訳後の文の評価と訂正を行うタスク画面を示しています.
図4. 機械翻訳後の用例の評価・訂正を依頼するタスク画面 |
---|
口頭発表
- 山本里美,福島拓,吉野孝: マイクロブログとクラウドソーシングを用いた用例評価手法および多言語用例対訳作成手法の提案, グループウェアとネットワークサービスワークショップ2013,セッション4, No.12, pp.1-8(2013-11).
- 山本里美,福島拓,吉野孝: クラウドソーシング上における使用者の属性情報を用いた用例対訳生成手法の提案, 異文化コラボレーション研究会, pp.7-12(2014-2).
連絡先
- 山本 里美:s165058 at sys.wakayama-u.ac.jp
- 吉野 孝:yoshino at sys.wakayama-u.ac.jp
リンク
- 多言語用例対訳共有システムTackPad
ログイン後,上部にあるメニューの「用例の森」から利用できます.