2023-12-20
AI、機械学習を応用したステキなオープンソースライブラリ「MediaPipe」に新しいデモが増えていました。気になった音声識別「Audio Classification」を実験!完全ローカルで音の種類をそこそこ識別してくれてます。

ただ、音声名の記述が英語なのでよくわからないので、YAMNet audio classifierを日本語訳したものを用意して、日本語で表示するようにしたデモを作成しました。


「音声識別 by MediaPipe」

わかりやすくなりました!


「audio-classification on GitHub」

TensorFlow.jsで作られたESモジュールをインポートしているのでデモのプログラムはとってもシンプル!


「audio-classification/yammnet_label.csv at main · code4fukui/audio-classification」

変なものは直したつもりですが、もっと良い訳があればコメントまたはプルリクをお送りください。 オープンデータなのでご自由に活用ください。

シチュエーション毎に発生しうる音のみに絞って識別させるなどで精度は上げられるでしょう。

Let's create with AI!

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS