Pythonでサウンドスペクトログラムを作ってみた。
どうも、日本酒ロスのグチナカです。
いきなりのカミングアウトすみません。
最近は音声処理や解析をマイブームにしております。(実は動画m)
音声の分類問題や特徴量を、、、、云々と勉強しておりますが、なかなか難しいです、たぶん。
Pythonでスペクトログラムを作ってみた。
ということで、スペクトログラムを作ってみました。
スペクトログラムってなんぞや!?はい、言語聴覚士なら知っているみたいですよ。普通は知らないですよね。
音声には振動があります。振動の波形と時間を可視化したものはこちら↓
上記の画像は、
「お寿司たべたーいなっ!」という言葉を可視化したものです。
(出来れば回らないシースーがくいてぇ、言葉のチョイスについては謝罪致します。)
上記画像は、たまに見かける事がありそうです。単純な音声の可視化なので、iPhoneならボイスレコーダーで録音する時にも確認できます。
スペクトログラムは、横軸が時間で縦軸が周波数になります。そして、色で周波数の強度を表します。
お寿司を食べたいの音声を一度聞いてみて下さい。↓↓
Dropbox - Sushi.m4a - Simplify your life
「お寿司たべたーいなっ!」のスペクトログラムはこちら↓↓
まぁ、こんな感じですよ。
Twitterのテキストデータを感情分析:感情スコアを出す。 - 人工知能・リハビリ・日記