Η Xiaomi アクセシビリティの分野における高度なアルゴリズムと自己開発音声技術の最新のアプリケーションを紹介します
Η テクノロジー テキストを音声に変換するXiaomi AI Labによって開発された、は、音声障害のあるユーザー向けに独自のカスタマイズされた音声を作成するために使用されます。
ユーザーは、«を使用して他の人と通信できるようになりました彼自身の声»標準の電子音声の代わりに。 研究プロジェクトの一環として「私の声を所有する"、 Xiaomi技術委員会、この成功した取り組みは、Xiaomiの「テック・フォー・グッドそして、「革新的な技術を通じて全世界がより良い生活を享受できるようにする」という目標の達成。
Xiaomiがプロジェクトを開始した理由
Xiaomiは人々を気遣い、技術革新を通じて彼らの多様なニーズに応えようとしています。 この文脈で、彼は、言語障害を持つ多くのユーザーが日常のコミュニケーションのために独自の声を獲得したいという願望を発見し、グループを作成しました。私の声を所有する"、これは言語障害のあるユーザーに自分の声を習得するように勧めました。 THE 朱西、委員会のメンバー TechforGoodのテクノロジー Xiaomi Corporationに、次のように述べています。
Xiaomiがこのプロジェクトをどのように実装したか
受信者に最も適切でパーソナライズされた声を提供できるようにするために、プロジェクトチームは 200人のボランティア 彼らの声を貸したXiaomiの内部。 次に、音声タグ照合アルゴリズムを使用して、ボランティアの音声データを受信者の音声データと照合しました。
このアプローチを通じて、彼らは受信者の基本的な音声基準音として最も適切な音声を見つけました。 プライバシーを保護したいので、選択されたそれぞれの真の声は洗練されたオーディオメディアで処理され、新しいユニークな声の音を生み出しました。 次のステップでは、彼らは即時応答テクノロジーを使用しました テキスト読み上げ テクノロジー 訓練する AIモデル、この新しい声を徐々に自然なリズムとトーンになり、人の気持ちやトーンを正直に表現できるようになります。
プログラム "私の声を所有するXiaomiによって開発されたさまざまな最先端の音声アルゴリズムを組み合わせて、合成音声の独自性、セキュリティ、および高い信頼性を確保し、音声障害のあるユーザー向けのカスタム音声合成の新しいアイデアを作成します。
このプロジェクトの意義は何ですか?
このプロジェクトのバックボーンは、 XiaomiAIラボ。 から 2017 公開しました 37の研究 次のような主要な国際会議の議事録で話すことについて 音響、音声および信号処理に関する国際会議(ICASSP)。 「の成功私の声を所有する」は、主にチームによって開発されたテキスト読み上げテクノロジーに基づいています。 テクノロジーの自発的なスタイル テキスト読み上げ それは本質的に、合成音声をそのトーン、一時停止、速度、およびその他の特性に忠実にします。
これにより、電子音声の単調で不自然な感覚がより自然なものに置き換えられます。 これまでのところ、このテクノロジーは、Xiaomiの音声AIアシスタントであるXiaoAIを搭載した多くのスマートデバイスで利用できます。
遊び "私の声を所有する」は、 テキスト読み上げテクノロジー アクセシビリティ分野でも広く採用され、ユーザーエクスペリエンスを向上させることができます。 O 朱西 追加した:
今後、Xiaomiは各音声受信機のコメントに耳を傾け、プロジェクトをより広い範囲に拡大する可能性を検討していきます。 Xiaomiは、技術革新を通じて人々のさまざまなニーズに応えようと、新しいテクノロジーを通じてアクセシビリティをサポートし続けます。
それに従うことを忘れないでください Xiaomi-miui.gr に グーグルニュース すべての新しい記事についてすぐに通知されます! RSSリーダーを使用している場合は、このリンクをたどるだけで、リストにページを追加することもできます>> https://news.xiaomi-miui.gr/feed/gn
フォローしてください Telegram あなたが私たちのすべてのニュースを最初に学ぶように!