Siri と Alexa の失敗: 音声検索に対するフラストレーション

公開: 2022-08-09

Sneh Ratna Choudhary さんは 2 つのことを知りたがっていました。それは、エベレスト山の高さと、インドのバンガロールでヘアブラシを購入できる場所です。

彼女は、クエリを入力して手根管を悪化させないように、音声検索に頼ることにしました。

彼女の最初の質問に対して、Google アシスタントはすぐに「8,848 メートル」と答えました。

しかし、ヘアブラシを買える場所に関する 2 番目の質問に対して、彼女は無関係な答えを受け取りました。Google アシスタントは彼女の化粧品店と近くの美容院を示しましたが、Siri は近くの薬局のリストを示しましたが、彼女が探しているものはありませんでした。

Beaconstac のコンテンツ マーケティング担当者である Choudhary 氏は、次のように述べています。 「私はゆっくりと話し、自分の言葉をはっきりと発音するように努めましたが、それでもやはり、クエリを入力して、はるかに早く答えを見つけることができたでしょう。」

検索が長くなると、アシスタントが私の言葉を完全に理解できないという問題がありました。

The Manifest は、音声検索を使用したことのある 501 人を対象に調査を行い、使用時に何を検索するか、結果に対する全体的な満足度、経験した技術に対する不満を調べました。

私たちの調査結果

  • 音声検索ユーザーのわずか 5% が、テクノロジーを使用してフラストレーションを感じたことはないと報告しており、このテクノロジーが完璧とはほど遠いことを強調しています。
  • 3 分の 2 近く (64%) の人が、先月誤って音声アシスタントにアクセスしたことがあります。
  • 間違ったボタンを押してしまった (49%)、音声アシスタントがその名前を聞いたと思った (29%)、要求せずに音声アシスタントについて話している (26%)、または似たような名前を言ったために、誤って音声アシスタントにアクセスしてしまう (例: Siri の場合は Sarah、Alexa の場合は Alex) (20%)。

音声検索に対する不満はよくあること

音声検索を使用したことのあるほとんどの人は、Choudhary 氏のフラストレーションに共感する可能性があります。たとえば、ヘアブラシを購入する場所など、単純なクエリのように見えるものでも、役に立たない結果が得られる可能性があります。

音声検索を使用してもイライラしないと答えた人はわずか 5% でした。

Only 5% of people say they never get frustrated using voice search.

残りの 95% は、誤って音声アシスタントを呼び出したり、音声アシスタントがクエリを理解または誤解したりするなどの理由を挙げて、音声検索を使用するときに不満を感じています。

MAMC ソーシャル メディアのディレクター、アンドリュー セレパック (Andrew Selepak) は次のように述べています。 「覚えておくべきことは、音声検索は、誰が、何を、いつ、どこで、という質問には対応できますが、それでも制限があり、なぜ、どのようにという質問には実際には対応できないということです。」

音声検索は、誰が、何を、いつ、どこで、という質問を処理できますが、それでも制限があり、なぜ、どのように質問を処理することはできません。

音声検索は、エベレスト山の高さなどの具体的で単純な回答を含むクエリには役立ちますが、ヘアブラシを購入できる場所などのより複雑なクエリを処理できない場合があります。

ユーザーがテキストベースの検索を行ったときに表示される結果の選択肢と比較して、音声検索の結果は 1 つの応答しか返さないため、これは特に問題です。

「単純な検索は音声検索に最適ですが、より複雑で微妙な質問は携帯電話やコンピューターに保存する必要があります」と Selepak 氏は述べています。 「しかし、天気やスポーツの試合結果が知りたい場合は、Google や Alexa に聞いてください。画面を見なくても、必要な答えが得られます。 「

多くの専門家は、より複雑な検索にはテキストベースの検索を使用することを推奨していますが、ユーザーは単純なクエリに対して満足のいく音声検索結果を得ることができます。 専門家は、音声技術が向上し、検索エンジンが自然言語をよりよく理解できるようになるにつれて、音声検索でフラストレーションを感じる人が減ることを期待しています。

音声技術は自然言語処理で向上しています

2019 年 10 月 25 日、Google は BERT (トランスフォーマーからの双方向エンコーダ表現) の更新のリリースを発表しました。 BERT は自然言語処理に重点を置いているため、音声とテキストの両方のすべての検索の精度が向上します。

BERT は、自然言語を処理し、フレーズの意味 (または方向) を変更できる「for」や「to」などの単語を使用する検索クエリを理解する Google の能力を向上させます。

たとえば、BERT の更新前は、「大人向けの数学の練習本」を検索した場合、「数学の練習本」を検索した人と同じ結果が表示されていた可能性があります。

With BERT, users that search for "math practice books for adults" will see math practice books specifically for adults, not students.

検索クエリの「for」という単語は、検索エンジンの方向性を示します。 この検索者は、6 年生から 8 年生の生徒ではなく、大人向けの数学の練習帳を求めています。

Extrabrains マーケティング エージェンシーのディレクターである Illia Termeno は、「ギリシャへの旅行日程」と「ギリシャへの旅行日程」の例を使用し、前置詞「to」と「in」がフレーズの意味をどのように変えるかを強調しました。



ギリシャへの旅行計画を検索しているユーザーは、別の国からギリシャに移動したいと考えています。一方、ギリシャへの旅行計画を検索しているユーザーは、興味深いことを探したり、すでにそこにいるときに見たりしたいと考えています。

「このアップデートは、このコンテンツを作成するターゲット オーディエンスの意図に正確に答えるコンテンツを作成し続ける必要があることを意味します」と Termeno 氏は述べています。



Google の自然言語処理とユーザーの意図の理解が向上するにつれて、音声検索を含む検索結果がより正確になります。

音声検索アシスタントが意図せず呼び出されることが多い

Joshua Liljenquist は、ミネソタ州マンケートにあるミネソタ州立大学の 4 年生です。彼の教授は 2 年生のクラスに足を踏み入れ、シラバスの復習を始めました。 彼は、学生が講義中にメモをとる目的で写真を撮ることを禁止し、退学を脅した.

Liljenquist はショックを受け、隣にいた人に「この男は一種の a------」とささやきました。

講義室が静まり返ったとき、突然、Liljenquist の Siri が助けようとして、「『この男は一種の ------』の結果が見つかりませんでした」と言った。



「私のジーンズのしわが Siri を動かしたに違いありません…自分の物をつかんで教室から全力疾走したかったので、私の顔は真っ赤になりました」と Liljenquist は言いました。 「タイミングがこれ以上悪くなることはないと思います。」



Liljenquist だけではありません。音声検索ユーザーの 64% が、先月誤って音声アシスタントにアクセスしたことがあります。

64% of voice search users have accidentally accessed a voice assistant in the last month.

誤って音声アシスタントにアクセスした人のほぼ半数 (49%) は、間違ったボタンを押してアクセスしました。

Top ways people accidentally accessed their voice assistant.

他の人が誤って音声アシスタントを呼び出し、誤検知を引き起こした場合、

  • 音声アシスタントは名前を聞いたと思う (29%)
  • 要求せずに音声アシスタントについて話す (26%)
  • 音声アシスタントに似た名前を言う (例: Alex for Alexa) (20%)

誤検知が頻繁に発生するため、一部の人々は音声アシスタントを混乱させないようにニックネームを採用する必要があります.



たとえば、Barbara Nevers の姪の Alexa が訪ねてくると、彼女の Amazon Alexa は混乱します。



「ある時、夫が(姪のアレクサに)どんなピザが欲しいかと尋ねたところ、エコーがドミノを注文するのを手伝ってくれました」と、子育てウェブサイトのネオリトルの創設者であるネバーズは言いました。



現在、Nevers は通常、姪が訪ねてきたときに Amazon Echo をオフにする必要がありますが、バックグラウンドで音楽を再生したい場合は、混乱を避けるために姪の名前を「Al」に短縮します。



役に立たない検索結果と同様に、誤検知は音声テクノロジー ユーザーのフラストレーションの原因となる可能性があります。 Siri や Alexa などの音声アシスタントに対するフラストレーションは非常に一般的であるため、ハッシュタグ #AlexaFails や #SiriFails を使用して、ソーシャル メディアで話題になっています。

Siri と Alexa Fails は、今日のポップ カルチャーで普及しています

意図せずに音声アシスタントを起動することは、今日のポップ カルチャーではよくあるジョークになっています。これは、サウス パークのエピソード「白人が家を改築する」で、スマート スピーカーを所有している視聴者に早期アラームを設定したり、Amazon の買い物リストに不適切なアイテムを追加したりしていたずらをしたことでさらに強化されました。

Southpark had an episode where they added inappropriate items to viewers' shopping lists on Amazon.

ほとんどの音声アシスタント ユーザーは誤検知を経験しており、多くの人がソーシャル メディアで Alexa の失敗と Siri の失敗を記録しています。



テクノロジー業界はこれらの不具合を認識しており、解決策を開発しているようです。 たとえば、Amazon は、Alexa のコマーシャルが視聴者の Amazon Echo をトリガーしないようにする戦略を発見しました。



2018 年の Amazon スーパーボウルのコマーシャル「Alexa Loses Her Voice」では、「Alexa」が 10 回発声されましたが、Amazon Echo はトリガーされませんでした。

The commercial "Alexa Loses Her Voice" said "Alexa" 10 times, but didn't set off anyone's Amazon Echo.

Amazon の広報担当者は、2018 年 2 月に Bloomberg に対し、Amazon は広告を変更して誤検知のリスクを軽減していると語ったが、その方法については説明しなかった.



しかし、Reddit ユーザーの aspyhackr は、Amazon がコマーシャルを 3,000Hz から 6,000Hz の範囲にミュートすることでこれを達成していると推測しています。 この静かな範囲は、「Alexa」に、話していることがコマンドではないことを知らせます。

専門家は、音声検索技術が 2020 年に改善されることを期待しています

ベル研究所の音声認識システムである Audrey が 1952 年に導入されて以来、音声検索技術は長い道のりを歩んできました。これは音声を理解できる最初のマシン (たとえ 0 から 9 までの数字であっても) ですが、Choudhary や Nevers のような経験は私たちに思い出させてくれます。まだ改善の余地があるということです。



ほとんどの人は音声テクノロジーにフラストレーションを感じています。これらのフラストレーションは、不完全な音声検索結果や、誤って音声アシスタントにアクセスしたことが原因であり、結果として恥ずかしい状況や不便な状況に陥る可能性があります。



しかし、テクノロジーは自然言語処理の能力を向上させており、企業は音声アシスタントをプログラムして、コマンドとパス コメントの違いをよりよく理解する方法を実験しています。



2020 年には、このテクノロジが改善され、人々がより頻繁に利用するようになるでしょう。

調査について

マニフェストは、米国の 501 人の音声検索ユーザーを調査しました

調査回答者のほとんどが女性 (55%) で、45% が男性です。

回答者の約 22% は 18 ~ 34 歳です。 33% は 35 ~ 54 歳です。 45% が 55 歳以上です。