Xiaomi byla jednou z prvních značek, která oznámila hlasového asistenta s umělou inteligencí pro své mobilní telefony, i když je málo známý, protože funguje pouze v Číně. O sedm let později asijský gigant oznámil nový model hlasové AI, tentokrát se však nezaměřuje na mobilní telefony, ale na automobily a připojenou domácnost.
Xiaomi svůj nový model pojmenovalo tímto neatraktivním a těžko zapamatovatelným názvem. Skládá se ze dvou klíčových částí: Dasheng AI audio kodér a dekodéru Alibaba Qwen2.5-Omni-7B. Dohromady je systém schopen rozpoznat nejen náš hlas, ale také okolní zvuky, hudbu a šum v pozadí. Xiaomi se chlubí ,že poskytuje „špičkový výkon ve 22 veřejných benchmarcích“. Zejména v úlohách porozumění neverbálnímu zvuku překonal systém Whisper od společnosti OpenAI.
AI míří do aut a chytrých domácností
Společnost Xiaomi již našla 30 aplikací svého nového hlasového modelu pro různé produkty. Hlasové ovládání rozumí akustickému prostředí a reaguje podle kontextu, například pokud se v autě ozve neobvyklý zvuk. Přidali také funkci, která nám pomáhá zlepšit výslovnost a učit se tak jazyky za jízdy, a s možností „probudit“ auto hlasem ještě předtím, než nastoupíme do prostoru pro cestující. Díky schopnosti detekovat neobvyklé zvuky je užitečný i z hlediska bezpečnosti, a to jak v autě s výkonnějším režimem proti krádeži, tak v domácnosti prostřednictvím chytrých reproduktorů.
Nový model umožňuje aktivovat chytré funkce prostřednictvím zvuků, například rozsvícení světel při tlesknutí rukou nebo vypnutí klimatizace při odchodu ze dveří, aniž byste o to museli žádat hlasem. Společnost Xiaomi tvrdí, že její systém má velmi nízkou latenci a vysoký paralelní výpočetní výkon, což mu umožňuje běžet na zařízeních, která jsou náročná na zdroje, jako jsou kamery nebo reproduktory, a udržet si dobrý výkon v prostředí s mnoha připojenými zařízeními, jako je domácnost.
Otevřený zdrojový kód
Čína si v závodě o umělou inteligenci zvolila cestu otevřených zdrojů a nový hlasový model společnosti Xiaomi ji následuje. MiDashengLM-7B je open-source a funguje pod licencí Apache 2.0, která umožňuje komerční využití a volné úpravy. To otevírá dveře k jeho využití dalšími vývojáři a také v akademické sféře.
Společnost Xiaomi navíc zveřejnila všechna data použitá k trénování modelu. Cíl je jasný: přilákat vývojářskou komunitu a pro svůj zvukový ekosystém se stát standardem, což posílí jeho konkurenční pozici.
Konverzační zážitek
V automobilovém průmyslu dochází k posunu, při kterém se software staví do pozice diferenciátora číslo jedna. Už nejde jen o to, o kolik rychleji jezdí nebo jak pohodlně se řídí, ale o systémy autonomního řízení, rozhraní vaší obrazovky a zejména hlasové ovládání.

Zdroj: Youtube.com
Podle předběžných odhadů budou hlasoví asistenti s umělou inteligencí standardem v automobilech do roku 2033. Kdo bude mít nejlepší konverzační zkušenosti, bude mít jasnou výhodu a Xiaomi v tomto směru udělalo důležitý krok.
Dopad na trh
Představení zařízení MiDashengLM-7B společností Xiaomi znamená nejen průlom v technologii hlasových asistentů, ale mohlo by také významně ovlivnit trh s automobily a chytrými domácnostmi. S růstem internetu věcí (IoT) se očekává exponenciální nárůst poptávky po připojených a hlasem ovládaných zařízeních. Podle zprávy společnosti Statista se očekává, že celosvětový trh internetu věcí dosáhne do roku 2025 hodnoty 1,6 bilionu dolarů (33,6 bilionů korun). To představuje pro společnost Xiaomi příležitost, jak se nejen prosadit jako lídr v oblasti hlasových technologií, ale také jako klíčový hráč v ekosystému internetu věcí.