音声サンプル:
https://www.instagram.com/reel/C9PHQzwJ0cs/
LINEヤフー株式会社(以下、LINEヤフー)が提供する基本無料で利用可能なカーナビアプリ「Yahoo!カーナビ」(iOS版、Android版)は、「LINEヤフーの高品質なオンデバイス音声生成AI」(以下、本技術)を初めて搭載した音声案内(以下、本機能)の提供を開始しました。
※アプリを最新版にアップデートしてご利用ください。
本技術は、オンデバイス型ニューラル音声合成技術により、従来よりも高品質な音声を生成し、声の抑揚や感情、発音の細かなニュアンスまで緻密に再現します。これにより、声の質と音量が改善され、より明瞭で聞き取りやすい音声の提供が可能になりました。また、インターネットに接続することなく、スマートフォンやタブレットなどのモバイルデバイス上で低遅延で動作するため、従来通り山奥やトンネル内など電波が届きにくい環境でもスムーズにルート案内が可能です。引き続き、利便性と安全性をこれまで以上にサポートします。
「Yahoo!カーナビ」は、ユーザーが快適なカーライフを実現するために、ユーザーの声を積極的に反映しながら機能拡充や改善、「ディスプレイオーディオ」(※1)や「雨雲レーダー」(※2)などの機能の提供を行っています。今回、より快適で安全なドライブを行ってほしいという思いから、音声案内の発話品質を向上した本機能の提供を開始しました。
■本機能の特徴
自然な発話: ニューラル音声合成技術を使用することで、より人の発話に近い音声を提供します。
これにより、音声を聞き取りにくいユーザーにも聞き取りやすく、聞き間違えなどによる判断・認識のしづらさ、使いづらさを軽減します。
<本技術を開発した担当者のコメント>
本技術は、2023年10月にLINEヤフー株式会社が発足してから、わずか約半年という短期間で提供を開始しました。
旧ヤフー株式会社は音声認識のiOS/Android上のオンデバイス推論技術(※3)を、旧LINE株式会社はCPU上で軽量動作する高品質なニューラル音声合成技術を保有しており、それぞれの技術を統合することで本技術は誕生しました。
本技術の音声合成のコア技術に関する研究成果は、音声・音響信号処理における世界最大の国際学会 「ICASSP 2023」にて論文が採択されています(※4)。
今後も本技術の高品質化・高速化を継続的に行い、複数話者選択、感情制御、プロンプトによる声質制御などの機能も含めてユーザーの課題解決にむけて柔軟にユーザーニーズに対応していきます。今後の展開にもご期待ください。
『「WOW」なライフプラットフォームを創り、日常に「!」を届ける。』をミッションに掲げるLINEヤフーは、「Yahoo!カーナビ」を通じ、今後もユーザーの安全安心なドライブをサポートできるよう、さらなるサービス強化・改善に取り組んでいきます。
※1:「Yahoo!カーナビ」「ディスプレイオーディオ」機能
Apple CarPlay
https://carnavi.yahoo.co.jp/promo/carplay/
Android Auto
https://carnavi.yahoo.co.jp/promo/android_auto/
※2:Yahoo!カーナビ、ルート上の雨雲の様子が確認できる「雨雲レーダー」機能を提供開始
(2024年5月30日 プレスリリース)
https://www.lycorp.co.jp/ja/news/release/008530/
※3:オンデバイス動作可能なEnd-to-End音声認識システムの開発
https://techblog.yahoo.co.jp/entry/2023020230408200/
※4:音声・音響信号処理における世界最大の国際学会 「ICASSP 2023」にて、8本の論文が採択
https://linecorp.com/ja/pr/news/ja/2023/4547