AIによる高精度の文字起こしが可能な「AutoMemo S」は単体で扱いやすいタッチパネルを搭載したICレコーダー

s-automemos_01.jpg

AI文字起こし機能付き ICレコーダー、SOURCENEXT(ソースネクスト)AutoMemo Sです。

2020年12月に初代の「AutoMemo」という製品が発売され、ディスプレイなどが無いながらもAIによる高精度な文字起こしが可能なICレコーダーとして各所で取り上げられていたわけですが、約1年の時を経て2022年1月に後継製品である「AutoMemo S」がリリースされました。

ビジネスシーンにおいて対面でのミーティングも徐々に復活しつつある昨今、再びICレコーダーで録音した音声の文字起こしという需要も高まってくるのではないかと思います。今回はモニターへの応募の結果、ソースネクスト様より本製品をご提供いただいたのでレビューしていこうと思います。

まず、本製品の特徴ですが、以下の通りとなります。

  • 操作しやく見やすいフルカラータッチパネル液晶搭載

  • キーワード検索・指定箇所のタップ・ブックマークといった様々な方法での録音の頭出しに対応

  • 句読点まで自然な位置に自動的に入る業界最高クラスの文字起こし精度

  • 保存件数も期間も無制限のクラウド保存

  • 72種類もの多彩な言語の文字起こしに対応

【付属品】

s-automemos_02.jpg

本製品の付属品は以下の通りです。

  • 製品本体

  • ACアダプター

  • 充電ケーブル

  • 取扱説明書など

【本体周り】

s-automemos_03.jpg

本体正面です。

大きなディスプレイとその下の中央に丸いボタンが印象的なデザインになっています。

昔流行った某音楽プレーヤーをなんとなく彷彿とさせますが、スタイリッシュで落ち着いたデザインだと思います。

s-automemos_04.jpg

手で持ってみるとこのくらいのサイズ感で、一般に売られているICレコーダーと比較しても大きすぎる・小さすぎるといったような違和感はありません。

重量は普通のICレコーダーよりは少し重いかな?と感じますが、あまり軽いと胸ポケットなどから落とした時にも気づきにくいため、ちょうど良いくらいかと思います。

ただ、見ての通り全体的にツルっとした質感のため、グリップ感はなく、手で握っての利用を想定する場合は滑って落としてしまいそうです。

新聞などの記者の方がいわゆる「ぶら下がり取材」でやっているような人に向けてインタビューをするような使い方では、ちょっと心もとないかもしれません。

あくまで会議室などの比較的静かな場所で、本体を机の上に置いて利用することを主に想定した製品、ということなのだろうと思います。

必要に応じて、オプション販売差rテイルケースなどを用いると良さそうな印象です。

s-automemos_05.jpg

s-automemos_06.jpg

続いて、本体の左右側面です。

左側には特にボタン類はなく、右側の上部に電源ボタンがあります。

s-automemos_07.jpg

次に本体上面です。

見るからにスピーカーだと分かるような無数の穴が開いていますが、ここにスピーカーとマイクが内蔵されているようです。

s-automemos_08.jpg

本体底面です。

左右に外部接続用のマイク端子とイヤホン端子があり、また中央には充電用のUSB TYPE-C端子があります。

s-automemos_09.jpg

本体背面です。

大きな「AutoMemo」のロゴと共にメーカーであるソースネクスト社のロゴがプリントされています。

正面以外はこのようにボディの金属の質感がそのまま生かされているため、正面のデザインと相まって所有欲を高めてくれるような高級感がありますが、いかんせんやっぱり滑りやすいです。撮影中も手から落とさないように気を付けながら慎重に・・・といった感じでした。

s-automemos_10.jpg

続いてACアダプタです。

ACアダプタにもAutoMemoのロゴがプリントされています。

s-automemos_11.jpg

仕様を見ると、出力はなぜか5V/1Aでした。

本製品は必ず付属のACアダプタとケーブルを使って充電するようにと書かれており、試しに手持ちの他のUSB充電器を使うと充電出来なかったのですが、原因はなんとなくこの辺りにありそうな気がしています。

s-automemos_12.jpg

最後にこちらがACアダプタと本製品を接続するためのUSBケーブルです。

片側(ACアダプタと接続)はいわゆるAタイプの形状、もう片側(本製品と接続)はTYPE-Cの形状になっています。

気になるのはその長さで、付属のものを使うようにと指示があるにしてはあまりに短いケーブルだと感じました。

もちろん全く使えない、というわけではないですが、ACアダプタをコンセントに挿してそのすぐそばで本体を充電する、というのは少々扱いづらいです。

もう少し長いものが付属していた方が良いのではないかと思います。

【初期設定】

細かいところが気になって色々と書いてしまいましたが、気を取り直して使用感を見ていきます。

s-automemos_13.jpg

電源を入れると製品のロゴと青い背景が画面一杯に表示されて起動が開始されます。

この色使いとデザインは外観と違和感がなく馴染むので非常に良いセンスを感じます。

s-automemos_14.jpg

しばらくするとセットアップが開始されます。

ディスプレイが付いている製品であるという利点を活かして、しっかりとしたナビゲーションが作りこまれていますね。

s-automemos_15.jpg

続いてWi-Fiを設定します。

ネットワーク利用が前提の製品ですので、やはりこれが無いと始まらない重要な一歩、というところでしょう。

パスワードは画面上のバーチャルキーボードを使って入力することになりますが、画面のサイズの割には感度が良いため、あまり押し間違いをしてイライラする、といったようなことは発生しませんでした。

なお、この画面を見た瞬間にピンとくる人はくると思いますが、ここで「Androidベースの製品だな」ということが分かります。

s-automemos_16.jpg

無事にネットワーク接続が終わっても、しばらくはまだ初回の設定が続きます。

利用規約とプライバシーポリシーが表示されますので、「同意する」を押して続けていきます。

s-automemos_17.jpg

次に、アカウントの選択を促されます。

既に持っている自分のGoogleアカウントもしくはAppleでログインを選択して進みます。

両方アカウントを持っているのですが、Androidベースの製品ならば、なんとなくGoogleアカウントの方が相性が良いかもしれない、という気がしましたので、今回はGoogleアカウントを選択しました。

s-automemos_18.jpg

この辺りまでステップが進むと、画面下のボタンが眩いばかりに点滅を始めます。

正直この機能は必要なのだろうか・・・と思いながらも、プランの選択をします。

本製品はクラウド上で音声の文字起こしを行うため、ベーシックプランかプレミアムプランのいずれかの加入が必須です。

プレミアムプランは月額サブスクリプションの形で有償になりますが30時間分までの録音を文字起こしすることができます。

ベーシックプランは無償で使うことができますが、月に1時間分までしか文字起こしを行うことができません。

実質プレミアムプラン一択のようにも思いますが、ひとまずテストとして使うためにベーシックプランを選択しました。

s-automemos_19.jpg

ここまででようやく初期設定が終わったようで、メニューが現れました。

電池残量やWi-Fiの強度などと共にメニューが表示されており、Androidベースの製品ながらも、組み込み用の専用ソフトが入っているかのような、分かりやすいインターフェイスに仕上がっています。

と、ここで緑色のビックリマークに気づくのですが「新製品あるある」で、更新版のソフトウェアの配布が既に始まっているようです。

s-automemos_20.jpg

97%も電池残量があるのであれば大丈夫だろうと思ってアップデートを試みると、「充電器を接続した状態でアップデートしてください。」との表示がされてしまいました。

ここで付属のACアダプタと短いケーブルを接続することになるのですが、コンセントの近くで短いケーブルを挿し、見づらい角度から本製品の画面を見ながらの操作が強要されるのはちょっと辛めでした。

s-automemos_21.jpg

無事にアップデートが終わると、再起動後に同じ画面が再び表示されます。

ここで上部のメニューにBluetoothのアイコンが増えていることに気づきました。

アップデートでこの対応が行われたのだと思いますが、やはりどのような製品でも購入時点で来ているアップデートはまず適用するのが良さそうですね。

【使用感】

s-automemos_22.jpg

初期状態では当然ながらこのように何も音声ファイルが無いという旨が表示されますのでまずは本製品を使って録音してみます。

s-automemos_23.png

録音の音源には、VOICEPEAKというAI読み上げソフトウェアを用いて、仮想的に複数の人間がやりとりをしているようなシーンを作ってみました。

このような会話をパソコンのスピーカーで再生させつつ、スピーカーから1m以内のところで録音をしてみました。

s-automemos_24.jpg

こちらは、録音が終わったところです。

この時点では録音が行われたのみで、書き起こしは実行されていませんので、録音の日付と録音時間(54秒)のみが表示されています。

※初期設定では、自動的に録音データがクラウドへ送信されて書き起こしが行われますが、失敗した録音も自動的に送信されて「残り時間」を消費してしまいます。そのため、今回は自動テキスト化の設定は事前にOFFにしています。また、自動テキスト化をOFFにしている場合でも、メールやクラウドドライブ連携をONにしていれば、録音した音声データをパソコン上で取り出すことが可能です。

s-automemos_25.jpg

録音をタップして開くと、画面の下部に再生コントロールが表示されて録音内容が確認(再生)できるほか、「音声をテキストに変換」というボタンが表示されました。

ここではこのボタンをタップしてみます。

s-automemos_26.jpg

すると、このようにテキスト化の確認ダイアログが表示され、残りのテキスト化可能時間はどれくらいあるのか、そのうち今回の録音データはどのくらい消費するのかを実行前に把握することができます。

有償サービスであるテキスト化の残り時間を無駄に消費しないようにするためにも、個人的にはこちらの設定が標準の方が良いと思うのですが、そこは色々と事情があるのだろうと思います。

s-automemos_27.jpg

OKボタンを押すとこのようにアニメーション画面が表示され、テキストへの変換が開始されます。

s-automemos_28.jpg

7秒ほど経過したのち、このように「テキスト化が完了しました。」というメッセージと共に書き起こされたテキストが表示されました。

s-automemos_29.jpg

パッと見た感じでは、しっかりと原文が書き起こされて再現されているように見えます。

s-automemos_30.jpg

また、録音の一覧画面に戻ると、このように先ほどは空白だった部分に読みとったテキストの冒頭が表示されるようになっていました。

s-automemos_31.jpg

音声をテキスト化することのメリットの一つには、やはり「検索が可能になること」が挙げられるでしょう。

このように、「読み取り」というキーワードで検索をしてみると、瞬時に録音データの該当する場所にジャンプしてハイライト表示してくれました。

「あの時、〇〇さんが確かこんなキーワードを言っていたような気がするなぁ」と思いながらも、最初から音声をすべて聞き直すのではなく、必要な情報の部分へ「頭出し」ができることには大きなメリットを感じました。

s-automemos_32.png

今回は1分足らずの音声でしたので本製品上でも十分全体が視認できるのですが、やはり実際に30分や1時間の会議を録音したりした場合などには、本製品のディスプレイでは情報量が少なく感じられることもあるでしょう。

そのような場合は、スマホにAutoMemoのアプリを入れておくと自動的に同期してくれます。

スマホであれば圧倒的にスクロール無しで見通せる情報量が増えますし、検索キーワードも使い慣れたインターフェイスで入力することができますのでさらに便利になります。

なお、改めて音声がテキスト化された結果をみたところ、以下の3点が原文との違いとして挙げられます。

  • 「読み取り精度」が「読み取り制度」になっていた

  • 「AI」が「ai」になっていた

  • 「一つひとつ」が「1つ1つ」になっていた

なんとなく、文脈から内容を判断する力があと一歩なのかなといった印象もありますが、少なくとも「音」としてはしっかりと識別できていることが分かりました。

【他のパターンも試してみた】

s-automemos_33.png

まず、気になるのは方言です。

このような文字起こしツールを使おうとしたときに、方言がネックになった経験をお持ちの方も意外とおられるのではないでしょうか。

というわけで、比較的テレビなどでも日本人に馴染の深い関西弁で試してみます。

※読み上げソフトの発音は関西出身者が頑張って限りなくネイティブな発音になるように調整しました。

s-automemos_34.png

実際に本製品で関西弁の会話を本製品で文字に起こしてみた結果がこちらです。

内容が全く推測もできない、というようなレベルではないですが、やはり方言が絡むと、かなり精度としては下がってしまうようです。

 

次に、本製品は多言語のテキスト化対応に対応していますので、英語設定に切り替え、以下の文章をMicrosoft Wordの読み上げ機能で読み上げさせたものを、本製品で録音してみました。

 

Good morning, everyone.

My name is Saki, I’m an instructor of this training course.

I think most of you guys are just a beginner for this area, but please don’t worry.

I’ll teach you the knowledge step by step from basic level. Let’s enjoy the course together.

 

s-automemos_35.png

“Saki”が”Sake”になってしまっていますが、これは仕方ないかなといった印象で、他はほぼ完璧です。

これだけのクオリティであれば文句なしだと思います。

【利用しての感想、その他】

良かった点としては、あくまで、比較的静かな部屋で話し手が複数被らずにしっかりと発音して話をしているという条件下においてですが、想像以上の精度でテキストへの書き起こしをしてくれました。

まさに、AutoMemoという製品名が表す通りの効果が得られるように思います。

月額の維持費がかかることに抵抗を感じられる場合もあると思いますが、人が手で書き起こす時間や人手の代わりに買うと考えれば決して高くないですし、有償製品だからこそのクオリティも考えればコスパは高いでしょう。

また、一般的なICレコーダーであればSDカードやICレコーダー本体をパソコンに接続して取り出さなければなりませんが、クラウドやスマホのアプリ経由で録音データやテキストデータが取り出せるのも意外と便利だと感じました。

一方で気になった点としては、方言であったり、そもそも人間が聞いても聞き取りにくい話し方の人の発言は、やはりAIと言えど人間と同様に、正確に聞き取って書き起こすことは苦手であるようです。

環境的な要因や、利用目的がぴったりとハマればとても良い製品だと思いますが、そこは実際に使ってみないと判断が難しいところではありますね。

残念ながら3月31日までで返金保証付きのフェアが終わってしまったようですが、短期であってもトライアルのような仕組みがあると、実際に買ってみたら全然フィットせずに実質放置されるといったような不幸なミスマッチは起きにくいと思いました。

気になっておられる方は、本記事が購入を検討される上での参考となれば幸いです。

SOURCENEXT(ソースネクスト)AutoMemo S

コメントする