教員紹介

伊藤 克亘 教授

伊藤( ITO) 克亘( Katunobu) 教授

Ph.D. (Computer Science)

メディア科学分野 音・言語メディア研究室

主な研究領域

  • 音声認識
  • マルチモーダル対話システム
  • 音声インタフェース

[YouTube]伊藤研究室紹介動画

研究室の学び

主に音やことばを対象とした研究に取り組んでいます。人間は、コンピュータが作られる前から、楽器を作ったり、ことばを使ったりしています。しかし、実は、それらのしくみの全てが完全にわかっているわけではありません。そこで、実際の音やことばのデータを記録してコンピュータを使って分析しています。その結果、現象が起きるしくみをコンピュータの中に作り上げる、つまり、コンピュータの中にそれらの現象の「模型」を作るのが研究の目標です。

社会との接点

夢のような研究であればあるほど、社会との接点は何年も後に生じます。私が学生時代から手がけていた音声認識の研究も、iphone の siri やロボットなどで一般的になるまでに20 年以上もかかりました。したがって、今、皆さんが目にできるような研究と社会との接点は、全て過去のものです。音声やことばの分野での、そういった輝かしい過去としては、siri のような音声対話、初音ミクや DTM,シンセサイザーのような音楽音響情報処理、google のような情報検索などがあげられます。これらの技術を実現するためには、実は、物理や数学、国語などの分野が役に立っています。これらの分野の規則をプログラムにすることで、コンピュータでいろんなことを実現しています。逆にいえば、音声の技術が遺伝子解析に役立つなど、いろんなことに役立ちます。したがって、卒業生も、IT 企業はいうまでもなく、電機メーカーや通信系企業の研究所から、レコード会社やテレビ番組の制作会社まで多様な場で活躍しています。オープンソフトウェアの開発を手がけて、それに関連する書籍を執筆したOB もいます。

卒業研究から積極的に学会や国際会議で発表して成果を世の中に発信しています。

主な卒業研究テーマ

  • 音響ライフログの分類(国際会議ベストペーパー賞)
  • 弦楽器演奏の数理的分析(FIT 船井ベストペーパー賞)
  • ハイトーンボイスの評価システム(学会学生奨励賞)
  • 歌声によるDTM の演奏表現入力(学会学生奨励賞)
  • ラジオ放送向け話者認識(学会学生奨励賞)
  • アニメーション声優の音声変換(学会学生奨励賞)
  • よい発声への歌声変換システム(学会学生奨励賞)

研究室をもっと知る

「人の言葉から能楽の謡まであらゆる音の正体を解析」へ(2018年10月25日掲載記事)

研究室紹介動画「音やことばが生じる仕組みを解き明かそう」(2021年度掲載)