音声入力環境を作った

ここのところ家のサーバーの使い方を大きく変えている。Nextcloudをインストールしたのをきっかけに、いろんなものを取り込むようにした。去年買った M 1の Mac miniはリスクが小さいのだけど、容量を食う部分をNFS にしたり、その NFS を automount するようにしたり色々忙しい。

こういうのは記録しておかないと全部忘れるので、ブログを書かなきゃいけないことをまとめてみたらすごくたくさんある。多すぎてやってらんないなー…と思ったので入力が楽になるように音声入力環境をアップデートした。

一番大きいのは、Android のリモートマウスという、勝間和代さんが使っているものを使ってみたこと。これめちゃめちゃいいですわ。

何が良いって、テキストが入る所ならどこにでも入力できるところが良い。

Google Docs にしても、Macの音声入力にしても、特定のアプリケーションや決まったタイプのテキストペインでなければ入力できなかったものが、リモートマウスだと本当にどこにでも入力することができる。

これはこのはてなブログの入力画面にも適用できるし、チャットにももの凄いスピードで入力できるので早口な人みたいになってる。自分の場合は翻訳仕事も決まったツールでやってるんだけど、これはWindowsMac では音声入力できないし、AndroidiOS にはアプリが存在しない。そういうものが全く悩みではなくなるというのはかなり大きい。

あと何気に変換精度も高い。句読点入力をしょっちゅう間違えてくれるのはまああるんだけど、それはさておき本体の精度が良い。早口で普通に喋るほど高い変換精度で変換してくれる感じがある。これはパソコンの音声入力よりも良いような気がする。

句読点の変換精度だけはまだまだ気になるけど、あとはしばしばタイムアウトして入力されなくなるのは時々困るんだけど、それ以外は全く悪くないです。大きな問題はほとんど解決された感じ。

こうなってくると細かくて気がつきにくい間違いが問題になるかもしれません。

語彙としては漢語よりも和語の方がべらぼうに変換精度が悪いので(これは日本語がそういう言語だからかも。和語が入ると同音異義語の優先順位が混乱するので、より多くのコンテキスト情報を必要とする感じ。)、漢語を多めに使って技術文書っぽく書いていく癖がついていくかもしれない。これは自分の文章の好みではないんだけど、「個性は工夫して作るものではなく標準的なものを出力しようとした結果として滲み出てくるものだ」という話もあり、文章も同じことになっていくのかもしれない。

2021/11/17注: typoをいくつか直しました。