AIで議事録を自動作成する方法|録音→文字起こし→要点整理まで完全ガイド
会議の録音データをAIで議事録に変換する手順を解説。Whisper・ChatGPTを組み合わせて、会議後10分で議事録を仕上げる方法を紹介します。
AIで議事録を自動作成する方法|録音→文字起こし→要点整理まで完全ガイド
会議の議事録作成って、実際にやってみるとかなりの時間を取られますよね。手作業での文字起こしと要点整理は、特に長い会議だと丸一日潰れることもあります。ただ、ここ数年のAI技術の進化で、この作業が自動化できる段階に来ました。本記事では、会議の録音から議事録の完成まで、僕が実際に試した方法を順を追って説明します。
AI議事録自動作成の全体像
議事録をAIで作る流れは、シンプルに3ステップで考えるといいです。
まず会議を録音して音声データを用意する。次にその音声をテキストに変換する。最後に、テキストを整理して実用的な議事録に仕上げる。この3つですね。各ステップにはいくつかの選択肢があって、組み合わせ方で効率が大きく変わるというのが肝心で、自分の環境に合った選択が重要になります。
ステップ1:会議の録音方法
高品質な音声データの準備
ここで大事なのは、出来上がりの議事録の質は、入力する音声の質で決まるということです。不鮮明な音声からは、いくら優秀なAIでも正確な文字起こしは難しいので、最初の録音段階で手を抜かないことがポイントです。
専用デバイスを使用した録音
僕がよく使うのはハンディレコーダーです。ズームやローランドのものなら、会議室のサイズに対応した音声が取れます。スマートフォンの内蔵マイクは確かに手軽ですが、雑音が入りやすいというのが実感です。デスク上で使うなら、USBマイクをパソコンに直接接続するのがいい選択肢になります。
会議システム内での録音
オンライン会議を使ってるなら、わざわざ別のツールで録音する必要はありません。Zoomなら自動トランスクリプション機能があるし、Microsoft Teamsも同じように会議終了後にテキストを取得できます。これらを活用すれば、別途の録音機器は不要になるケースが多いです。
音声データの保存形式
AIのサービスは複数の形式に対応してますが、それぞれ特性が違います。
| 形式 | 特徴 | 推奨用途 |
|---|---|---|
| MP3 | ファイルサイズが小さい | クラウドにアップロードするとき |
| WAV | 音質が高いがサイズが大きい | パソコンで処理するとき |
| M4A | iPhoneの標準形式 | モバイルで録音したとき |
| FLAC | 音質を保ったまま圧縮 | 高精度が必要なとき |
ステップ2:AI音声認識による文字起こし
主要な文字起こしサービス
Google Cloud Speech-to-Text
Google謹製のサービスで、精度が高いのが特徴です。
何ができるか:
120以上の言語に対応してるし、リアルタイムでも非同期でも処理できます。会社の専門用語をあらかじめ登録しておくと、認識精度が上がるというのがいいポイントですね。
使い方:
Google Cloudコンソールでプロジェクトを作って、APIを有効にします。認証用のキーを取得すれば、プログラムから使えるようになります。
from google.cloud import speech_v1
import io
def transcribe_audio(audio_file_path):
client = speech_v1.SpeechClient()
with io.open(audio_file_path, "rb") as audio_file:
content = audio_file.read()
audio = speech_v1.RecognitionAudio(content=content)
config = speech_v1.RecognitionConfig(
encoding=speech_v1.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=16000,
language_code="ja-JP",
)
response = client.recognize(config=config, audio=audio)
for result in response.results:
print(result.alternatives[0].transcript)
transcribe_audio("meeting.wav")