このブログを検索

2019-02-10

雑記 - Google純正の音声文字変換アプリ

Android端末で音声を文字に変換するアプリがリリースされたので早速使ってみました。


Google、話相手の声をリアルタイムで文字化する「音声文字変換」アプリ

Googleは、聴覚障害を持つ人に向けた「音声文字変換」と「音声増幅」の Androidアプリの提供を開始した。音声文字変換は、発声できない人とのコミュニケーションをサポート、音声増幅は周囲の騒音を低減し、話し声を聞き取りやすくするアプリとなる。

聴覚障害を持つ方とのコミュニケーションを目的としたソフトで現時点ではベータ版に相当するそうです。
わたしの経験上、こういったソフトは実際に必要な場面に遭遇してから探すのでは遅いというのがよくあることです。
街中で困っている方から助けを求められてからソフトを探すのではなく、事前にインストールしておけばいつか役に立つこともあるでしょう。

ま、単純にテクノロジー的にもすごいなとも思ったのもあり早速インストールしてみました。

友人との会話を変換させてみた感触としてはマイクの有効範囲が非常に狭いということです。
相手に画面を見せながら会話しようとする時はスマホのマイクの位置と距離感に気をつける必要がありそう。
このアプリ紹介の記事にもあるように外部マイクで拾ってあげれば精度が上がりそうな印象でした。

他の目的でも流用できるだろうなと思い、書き起こし補助みたいな使い方を試してみました。

2019年2月10日に放送された仮面ライダージオウのジオウII変身後の黒ウォズの口上と黒ウォズOP口上を聞かせてみたところこんな感じになりましたw
単なる音声→文字変換ではなく、辞書内にある近い単語から選択しているような印象です。
ジオウよりは電王の方が人気ですもんねw

黒ウォズのセリフがかなり飛んでいるのはBGMとの分離やマイクにかかっているエフェクトによるものと推測されます。
テレビ収録されたBGM入りの音声と生の発声では情報量が違いすぎるのではないでしょうか?



次にマイクに余計なエフェクトがかかっていないであろうインタビュー音声を使用してみました。


2019/02/09放送の音ドキッ!からJuice=Juiceの出演シーンをアプリに聞かせてみました。
先程の仮面ライダージオウは録画時にレコーダー内で更に圧縮されているモードで、音ドキッ!の方は放送時のまま録画したものを使用しています。(地上波の放送なので当然MPEG2圧縮されているわけですけどね)


精度は低いものの文字に変換できているようです。
冒頭の正解は「考えるです」ではなく「段原瑠々です」なんですがねwww

使ってみた感触としてはリアルタイム性がかなり高く、多少精度が悪い部分があったとしても人間が訂正すればいいのでそれなりにコミュニケーションが取れそうだという感じがありました。
筆談や文字入力で会話するよりはよっぽど楽だし早いでしょう。
スマホの空き容量に問題がないならインストールしておいていいアプリだと思います。

0 件のコメント:

コメントを投稿