【AI】AIで複数の同時音声を分離、再現率は脅威の90% 深層学習で音声の分け方を学ぶ:
三菱電機は研究成果披露会で、同社独自のAI技術「ディープクラスタリング」を用いた音声分離技術を発表した。この技術では、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現できる。従来の技術では原音再現率が51%だったが、三菱電機の音声分離技術の場合90%以上となる。[辻村祐揮,EE Times Japan]
答えではなく、解き方を学ぶ
スマートフォンやカーナビなどの音声認識機能は、雑音や複数の人の声が混じると正しく機能しないことが多い。