
RESEARCHERS
先端技術応用研究所
瀬川 修
OSAMU SEGAWA
PROFILE
所属 | 先端技術応用研究所 |
---|---|
研究・専門分野 | 音声言語処理、画像処理 |
学位 | 修士(工学)横浜国立大学 博士(工学)名古屋大学(注)入社後、博士課程に在籍し取得 |
趣味・好きなこと | 車、読書、映画鑑賞 |
研究キーワード | AI、音声認識、自然言語処理、画像処理、テキストマイニング |
(注)2024年7月取材時
瀬川さんの専門分野を教えてください。
言語、音声、画像などの様々なメディアを扱うAI技術を専門としています。もともと人間の知性の根源である言語というものに興味があり、言葉をコンピュータで扱う「自然言語処理」や「音声認識」は、学生時代から長期にわたり手がけているテーマです。
最近では画像分野も含め「ディープラーニング」と総称されるAI技術全般を対象とした研究を進めています。これらの先端技術を用いて、電力業務の幅広い支援技術を開発するのがミッションです。
これまで、どんな研究に取り組んできたのでしょうか。
入社以来、研究職として電力分野の業務課題をAI技術で解決するための研究に取り組んできました。
所属する研究部署では特定の部門にとどまらず、系統、送変電、発電、配電、営業など、幅広い領域の研究開発にたずさわってきました。
まず、「音声認識技術」については電話音声の分析が主要なターゲットで、コールセンターや給電制御所の通話録音を対象として、通話内容のテキスト化と検索を実現するシステムを開発しました。
自然言語処理技術については、主に「テキストマイニング」と総称される言語情報の分析技術の開発をおこなってきました。
テキストマイニング技術のニーズとしては、顧客意見や設備の巡視記録などのビッグデータの分析があり、カテゴリ分類、評判分析、特異事象抽出、因果関係分析など多様な分析ニーズに対応できる汎用性の高いシステムを開発しました。
「画像処理技術」については、本格的に取り組みはじめたのは2010年代からで、主に電力設備の巡視の支援技術の開発をおこなってきました。具体的には、コンピュータで生成した情報を実世界に重ね合わせる可視化技術である「拡張現実(AR)」や、複数の画像情報から物体の3次元点群を推定する「 3次元構造復元」などの要素技術開発をおこないました。
2010年代初頭までは要素技術が十分に確立されておらず、ニーズに対する要求性能を満たすのに苦労しました。昨今のニューラルネットワーク(注)全盛の時代になって、本来やりたかったことが短期間で実現できるようになってきたという気がします。
(注)ニューラルネットワーク
人間の脳の神経細胞(ニューロン)から着想を得た機械学習モデル。適切な学習データさえあれば、多様な数理モデルを近似的に実装可能と言われており、パターン認識や時系列予測などの諸問題に多大なインパクトを与え続けている。
現在の取り組みは。
自社の各部門やグループ会社からのニーズに基づく依頼研究、および、将来を見据えたシーズ技術の開発と評価を目的とした発意研究をおこなっています。
現在の取り組みとして、大きく4つのテーマがあります。
まず一つ目は、ベテランの技を技能継承するための教育支援技術で、原子力部門からの依頼研究として、ベテランの発話内容、注視点、身体動作を統合的に解析する「暗黙知」のデジタル記録技術の開発をおこなっています。実務経験の少ない若年層への技術継承という課題に対し、「ベテランの技」を追体験する教育効果が期待されます。

二つ目は、中部電力パワーグリッドの送変電部門からの依頼研究として、設備の異常検出技術の開発をおこなっています。一般に異常データの収集は困難な場合が多く、正常データのみから異常状態の判別を学習する「教師無し異常検出技術」の実用化に向けた検討をおこなっています。
三つ目は、業務の安全管理に寄与するテキストマイニング技術で、「ヒヤリハット」と呼ばれるヒューマンエラーに関する大量の事例を用い、各部門の業務や期間に固有のキーワードや発生傾向、因果関係などを分析する技術の開発をおこなっています。数十万件に及ぶビッグデータを今後の安全管理に役立てたいと考えています。
四つ目は、音声認識や自然言語処理の応用技術として、会議の音声録音データから話者を識別して自動書き起こしおこない、その発話内容の要約を自動生成する議事録作成の支援技術の開発をおこなっています。基本的なスタンスとして、企業情報を内部で処理できるローカルな解析手法の検討を進めています。
AI技術への想いは。
昨今の生成AI技術は、15世紀のグーテンベルクの活版印刷発明に匹敵するくらいのインパクトを社会に与えており、今後もその影響力を増していくと考えています。
まだまだ出力結果の誤りやコントロール性など課題は多いですが、その学習能力や推論など潜在性能は驚くべきものがあり、今後の発展をフォローしていきたいと思います。
今後の目標について教えてください。
研究開発部門として、最先端の研究の技術的なキャッチアップに努めていくとともに、応用技術の開発に取り組み、中部電力グループをはじめ電力業界の「お役立ちの研究」に邁進していきたいと思います。
今後も、特に大規模言語モデルをはじめとする生成AI技術は、ますます加速的な進化を遂げていくことが予想されています。ただ、その進化スピードは極めて早く、数年先程度ならば予測できるかもしれませんが、10年先はもう未知数。今後の社会実装の形態がどのようになっていくか目が離せないですね。

技術報告(技術開発ニュース)
国際会議等発表
- O.Segawa, K.Takeda and F.Itakura, “Continuous speech recognition without end-point detection”, Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2001), pp.245-248 (2001)
- O.Segawa, J.Kawai and K.Sakauchi, “Automatic generation of link collections and their visualization”, Proc. of The 14th International World Wide Web Conference WWW2005, pp.942-943 (2005)
- O.Segawa, “Web annotation sharing using P2P”, Proc. of The 15th International World Wide Web Conference WWW2006, pp. 851-852 (2006)
- O.Segawa, T.Hayashi and K.Takeda, “Attention-based speech recognition using gaze information”, Proc. of IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU2019), pp.465-470 (2019)
- T.Kobayashi and O.Segawa, “Estimation of degradation curves for substation equipment using text mining”, CIGRE SCIENCE & ENGINEERING N°31 December 2023, pp.133-143 (2023)
特許等
関連情報共有装置及び関連情報共有方法(特許第4891571号)
入力情報分析装置(特許第5162151号)
入力情報分析装置(特許第5171087号)
文章情報グループ判別支援装置(特許第5245062号)
音声信号処理装置(特許第5627109号)
入力情報分析装置(特許第5657338号)
架空設備判別装置および架空設備判別方法(特許第6661869号)
物体識別装置(特許第7345355号)
マルチモーダル音声認識装置およびマルチモーダル音声認識方法(特許第7414231号)
画像生成支援装置(特許第7497791号)
所属学会
情報処理学会
日本音響学会
人工知能学会
電気学会
この研究者へのお問い合わせはこちら