成果抜粋(2010年以前)
- 聴覚による寸法・形状分離抽出(スケール)計算理論と検証実験
[音声から、声道寸法情報(話し手の体の大きさの情報)と声道形状情報(ど
の母音かの情報)の分離抽出を行う聴覚機能の解明]
- 入野俊夫, 河原英紀, "聴覚認知過程の数理," in 数理科学辞典(第2版)
(広中平祐 他 編), pp. 1045-1047, 丸善,
ISBN 978-4-621-08125-9, 1080p., 2009年12月26日.
- 入野俊夫、津崎実, "聴覚初期過程の機能モデル," in 新編感覚知覚心理学ハンドブック Part 2 (大山正・
今井省吾・和氣典二・菊池正 編) , 誠信書房,615p, 2007年9
月.
(「聴覚の目的とは?」という問いから、一つの研究方向の解説・提案。
音色と寸法知覚との関連。)
- 入野俊夫,"初期聴覚系におけるスケール理論,"(招待講演), 日本音響
学会:春季研究発表会講演論文集, I, pp.511-514, 早稲田大学,
2003年3月18日 (日本語での研究解説。) [ PDF ]
- Toshio Irino and Roy D. Patterson,
"Segregating information about the size and shape of the vocal
tract using a time-domain auditory model: The Stabilised Wavelet
Mellin Transform," Speech Communication, 36 (3-4),pp.181-203,
March 2002.
(聴覚による寸法と形状情報の抽出機能についての計算理論。メリン変
換が聴覚経路で取られていることを理論仮説として予測。安定化ウェー
ブレット・メリン変換として定式化。以下の論文を手始めに、実験的検
証がされつつある。)
[ 被引用数 77 (2011/11)]
- David R. Smith, Roy D. Patterson, Richard Turner, Hideki
Kawahara, and Toshio Irino,"The processing and perception of size
information in speech sounds," J. Acoust. Soc. Am.,
117(1), pp. 305-318, Jan., 2005.
(聴覚には話者の寸法の情報を抽出する機能があることを実験的に明ら
かにした論文。上記文献の聴覚初期過程の計算理論のメリン変換仮説を
支持する。高品質分析合成システムSTRAIGHTによって、精密な実験が可
能となった。
[ 被引用数 99 (2011/11)]
- ガンマチャープ聴覚フィルタ
- Toshio Irino and Roy D. Patterson,
"A time-domain, level-dependent auditory filter: the gammachirp,"
J. Acoust. Soc. Am.,
101 (1), pp.412-419, January 1997.
(聴覚フィルタ関数を、メリン変換によって張る空間において最小不確
定性を持つ関数として理論的に導出。ガンマチャープフィルタと命名。
同時マスキングの心理実験データを定量的に説明できることを示した。)
[ 被引用数 157 (201
1/11)]
- Toshio Irino and Roy D. Patterson, "A compressive gammachirp
auditory filter for both physiological and psychophysical data,"
J. Acoust. Soc. Am., 109 (5), pp.2008-2022, May 2001.
(ガン
マチャープ聴覚フィルタを変形し、内耳における圧縮特性も導入した。
圧縮型ガンマチャープ聴覚フィルタ。心理実験と生理実験の両方のデー
タを1つの枠組で定量的に説明できることを示した。)
[ 被引用数 79 (2011/11)]
- Roy D. Patterson, Masashi Unoki, and Toshio Irino
"Extending the domain of center frequencies for the compressive
gammachirp auditory filter,"
J. Acoust. Soc. Am.,
114 (3), pp.1529-1542, Sept 2003.
(圧縮型ガンマチャープ聴覚フィルタを、大量の同時マスキングデータ
(1000個以上) に適合させた。6係数と、きわめて少ないパラメータ数で
データを定量的に説明できることを示した。)
[ 被引用数 31 (2011/11)]
- Toshio Irino and Roy D. Patterson, "A dynamic compressive
gammachirp auditory filterbank" IEEE
Trans. Audio, Speech, and Language Process.,
14(6), 2222-2232, Nov. 2006.
(人間のさまざまな聴覚心理データに定量的/定性的に合うようにパラメー
タ設定がなされ、現在使いうるフィルタバンクモデルの中で最も信頼で
きると考えられる。特徴: 1) 同時マスキングデータの定量的適合、2)
瞬時的な圧縮特性の導入と定性的適合、3) 2音抑圧現象の定性的適合。)
[ 被引用数 32 (2011/11)]
[gammachirpソフトウェアはGitHubからdownload可能]
- 聴覚フィルタ自体の解説:
入野俊夫,"聴覚フィルタの測定と定式化について,"
日本音響学会聴覚研究会資料, H-2009-73, Vol. 39, No. 6, pp.413 - 418,
[聴覚研究会、レクチャー招待講演], 和歌山, 2009年10月9〜10日,
(発表日10月9日)
[ PDF ]
- 音声信号処理
- Tomohiro Nakatani and Toshio Irino,"Robust and accurate
fundamental frequency estimation based on dominant haramonic
components," J. Acoust. Soc. Amer.,
116(6), pp.3690-3700, Dec., 2004.
(基本周波数(F0)推定法の耐雑音性を高めた。世界でもトップレベルの
性能を持ち、SNR 0 dBでも十分機能する。工学的応用ばかりではなく、
たとえば、韻律(プロソディー)情報分析に不可欠なツールで、幼児
から大人の声に対して適用した例もある。)
- Toshio Irino, Roy D. Patterson, and Hideki Kawahara "Speech
segregation using an auditory vocoder with event-synchronous
enhancements," IEEE Trans. Audio, Speech, and Language Process.,
14(6), 2212-2221, Nov. 2006.
[ Demonstration page for the segregated sounds ]
(聴覚の計算理論に基づいた、音源分離処理手法。分析合成系のボ
コーダを聴覚版に拡張。)
Last modified: 2022-12-12 11:12:40 JST