技術開発ニュース No.168

- ページ: 97
-
研 究 紹 介
4
生成系 AI による整文・要約
て要約させ、最後に繋ぎ合わせている。
本項では、文字起こし後のデータをもとに、生成系 AI を
用いた文字起こし結果の修正(整文)・要約処理の内容に
ついて解説していく。本アプリでは整文・要約処理に、米
OpenAI 社が開発した大規模⾔語モデル、GPT-4 を用いて
いる。GPT-4 は近年話題となった ChatGPT と呼ばれる AI
第 3 図 要約用プロンプト一例
(3) 整文・要約例
最後に、簡単な文字起こし例を用いて、本アプリで整
チャットサービス内で用いられており、執筆時点で様々な
文・要約した結果を第 1 表に示す。要約方法は箇条書き
ベンチマークで最高の性能を出している最先端のモデルの
を指定した。整文処理では誤字等の修正やケバの削減、
。このモデルではユーザのプロンプト(入力
要約処理では大幅な文字数の削減が行われていることが
一つである
(2)
文章)に応じて、日常会話や文書作成、翻訳等、入力内容
確認出来る。
に応じた様々なテキスト生成が可能である。また、GPT-4
では入出力の文字数 ( 注 1) が制限されていることから、本ア
プリ内で文字起こし結果・整文後結果をそれぞれ一定文字
第 1 表 アプリによる処理結果例
項目
数に分割した後、使用している。
( 注 1)
開発した議事録はく製支援アプリのことを説明します。うん。
このアプリでは、懐疑の音声データをもとに、議事録作成を支援する簡易議事録を作成するこ
正確には「トークン」と呼ばれる、単位テキストを分割する最小単位を用
いて制限されている。日本語の場合、ひらがな 1 文字で約 1 トークン、英
語の場合 1 単語で約 1 トークンなど、⾔語や文字によって数え方が異なる。
とが出来ます。
具体的な処理としては、音声データから音声認識 AIのWhisperで文字起こしを行い、その後
文字
起こし例
果ガダウンロード出来ます。
がサクゲ出来ます。
えー、感嘆ですが以上で説明します。ありがとうございました。
のー」「ああ」「うんうん」等のケバやフィラーと呼ばれ
えー、聞こえますか。聞こえます。お疲れさまです。追良瀬です。あー、今日の議題ですが、
る、文脈上意味を持たない⾔葉が多く含まれている。ま
開発した議事録作製支援アプリのことを説明します。
このアプリでは、会議の音声データをもとに、議事録作成を支援する簡易議事録を作成するこ
た、文脈上意味の通らない漢字変換も含まれる。例え
とが出来ます。具体的な処理としては、音声データから音声認識 AIのWhisperで文字起こし
を行い、その後生成系 AIであるGPT-4を使った文字起こし結果の修正、そして修正結果の要
整文後
約を行います。
ユーザはデータをアップロードした後、要約方法の指定をして、スタートボタンを押すだけで
処理を開始することが出来ます。処理が終わったら、ダウンロードボタンが表示されるので、
これを押すことで各処理の結果がダウンロード出来ます。
し結果が多く含まれていると、意図しない結果となるな
ユーザは要約結果をもとに、適宜修正を加えるだけで議事録を作成でき、議事録作成の時間
が削減出来ます。
ど生成系 AI による要約結果に悪影響を及ぼすため、意味
以上がアプリの説明です。ありがとうございました
の通った文章に修正する、整文処理を行う。
整文処理を行うため、GPT-4 に与えるプロンプト(生成
理を開始することが出来ます。
ユーザは要約結果をもとに、適宜修正を加えるだけで議事録を作成でき、記事六作成の時間
文字起こし後のテキストデータには、「えーと」「あ
は改めた方が良い」となる等である。こうした文字起こ
生成系 AIであるGPT-4を使った文字起こし結果の修正、そして修正結果の要約を行います。
ユーザはエータをアップロードした後、要約方法の指定をして、スタートボタンを押すだけで処
えー、処理が終わったら、ダウンロードボタンが洗われるので、これを押すことで各処理の結
(1) 文字起こし結果の整文
ば、「その行動は改めた方が良い」が誤って「その公道
内容
えー、聞こえますか。聞こえます。お疲れさまです。追良瀬です。あー、今日の議題ですが、
- 本日の議題:開発した議事録作製支援アプリの説明
要約後
系 AI に与える命令文)を第 2 図に示す。プロンプト中の
- アプリの機能:会議の音声データを元に、簡易議事録を作成
- 処理の流れ:音声データからWhisperによる文字起こし → GPT-4による修正 → 要約
- ユーザの操作:データアップロード → 要約方法の指定 → 処理開始 → 結果のダウンロード
- 利点:要約結果を元に修正を加えるだけで議事録作成可能、議事録作成の時間削減が可能。
{ 分割後文章 }となっている部分に分割した文字起こし結果
を入力し、当該プロンプトを用いてGPT-4 により整文さ
れた結果を繋ぎ合わせ、後に続く要約処理に入力する。
5
おわりに
本稿では議事録作成の負荷軽減を目的に、近年話題の生
成系 AI と音声認識 AI を組み合わせ開発した、議事録作成
支援アプリを紹介した。本アプリは昨年から社内の一部部
第 2 図 整文用プロンプト
(2) 整文結果の要約
GPT-4 によって整文された文字起こし結果を簡易的な
署に対して公開しており、使用者からは概ね良好な評価を
得ている。今後も本アプリの改良やその他生成系 AI の業務
適用方法の検討を続け、様々な業務を効率化する研究開発
を続けていきたい。
議事録とするため、整文と同様 GPT-4 を用いて要約をし
ていく。本アプリ内では要約方法を指定(箇条書きか文
章形式)できるようにしており、文章形式の場合、目安
となる文字数も指定することが出来る。
要約処理を行うため、GPT-4 に与えるプロンプト例を
第 3 図に示す。この例は文章形式で文字数を指定しない
場合のものである。整文時と同様、{ 分割後文章 } となっ
6
参考文献
(1)“Introducing Whisper”, Research | OpenAI, https://openai.com/
research/whisper, ( 参照 2024-01-15)
(2)“GPT-4”, Research | OpenAI, https://openai.com/research/gpt-4, ( 参 照
2024-01-15)
ている部分に、一定文字数で分割した整文結果を入力し
技術開発ニュース 2024.03/No.168
96
- ▲TOP