A Xiaomi saját fejlesztésű technológiával segít a beszédzavarral élő embereknek

forrás: Prím Online, 2022. május 21. 14:16

Az internetes szolgáltatásokat nyújtó, valamint IoT platformon keresztül kommunikáló okostelefonokat és egyéb intelligens eszközöket gyártó Xiaomi most rántotta le a leplet legújabb, az akadálymentesítés jegyében létrehozott, fejlett algoritmusokra és saját fejlesztésű beszédtechnológiára épülő alkalmazásáról. A Xiaomi AI Lab által kifejlesztett, a szöveget beszédhanggá alakítani képes Text-To-Speech technológiát arra használják, hogy egyedi és testreszabott hangot generáljanak beszédzavarral élő felhasználók számára. 

Az érintett felhasználók mostantól a "saját hangjukat" használva, nem pedig a szokásos monoton géphangon kommunikálhatnak másokkal. Ez a sikeres kezdeményezés a Xiaomi Műszaki Bizottság "Own My Voice" projektje előkészítő kutatásainak része. A cég "Tech for Good" kampánya illeszkedik a Xiaomi távlati céljaihoz, amelyek fő üzenete: az "innovatív technológia segítségével mindannyiunknak jobb élete lehet".

 

Miért indította el a Xiaomi ezt a projektet?

A Xiaomi törődik az emberekkel, és a technológiai innováció segítségével törekszik az igényeik kielégítésére. A cég felismerte, hogy az érintettek is egyedi, saját hangjukat használva szeretnének kommunikálni a mindennapok során, így az "Own My Voice" projektet előkészítő csapatnak lett egy beszédzavarral élő tagja is, hogy minél pontosabban megértsék a célcsoport szükségleteit.

 

Zhu Xi, a Xiaomi Technológiai Bizottsága Tech for Good nagykövete elmondta: „Mi is izgatottan figyeljük, mennyi értéket teremt számunkra a technológiai innováció és ezek miként segíthetik a felhasználókat abban, hogy minél inkább önazonosak lehessenek.”

 

 

Hogyan valósította meg a Xiaomi a projektet?

A legmegfelelőbb és a leginkább személyre szabott tónusok létrehozása érdekében a projektcsapat több mint 200, a cégnél dolgozó önkéntest kért föl arra, hogy kölcsönözze a hangját a kezdeményezéshez. Egy hanglenyomat-megfeleltető algoritmus segítségével vetették össze az önkéntesek által adományozott hangokat az adott felhasználó hangjának jellemzőivel. Így találták meg azt a legmegfelelőbb hangszínt, amely referencia lehet a felhasználó számára.

 

A személyre szabás érdekében – a személyiségi jogok védelmének szem előtt tartásával – a kiválasztott hangot úgy módosították, hogy abból egy új és eredeti, a befogadó hangszínéhez közelítő tónus keletkezzen. Ezután az élőbeszédhez hasonló stílusú, a szöveget beszédhanggá alakítani képes Text-to-Speech technológiát hívják segítségül a mesterségesintelligencia-modell betanításához is, hogy az így létrehozott beszédnek emberi érzelmek kifejezésére is alkalmas természetes ritmusa és intonációja legyen.

 

Az "Own My Voice" projekt a legfejlettebb algoritmusokat kombinálja a Xiaomi saját fejlesztésű beszédtechnológiájával, hogy az így létrehozott tónus különlegesnek és hitelesnek hangozzon, ezzel alapozva meg a személyre szabott beszédszintetizációt a beszédzavarral élők számára is.

 

Miért jelentős ez a projekt?

Az innováció legfontosabb elemét a Xiaomi AI Lab beszédtechnológiával foglalkozó szakértői csoportja biztosítja, akik 2017 óta 37 hangszintetizálással kapcsolatos tudományos közleményt publikáltak olyan nívós nemzetközi fórumokon, mint például az International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Az "Own My Voice" elsősorban az általuk kifejlesztett Text-To-Speech technológiára támaszkodik, és a sikerének kulcsa is ez lehet.

 

Ezzel a technológiával intonációjában, dinamikájában és sebességében a valódi emberi hanghoz hasonló szintetizált hang hozható létre, amelynek révén a mesterségesnek ható, monoton géphangot egy természetesebb tónus váltja fel. Jelenleg ez a technológia számos olyan okoskészüléken elérhető, amelyben ott van a Xiaoai, a Xiaomi MI-alapú hangasszisztense. Az "Own My Voice" projekt azt demonstrálja, hogy Text-To-Speech technológia miként válhat széles körben alkalmazhatóvá az akadálymentesítés érdekében, és hogyan javíthatja a felhasználói élményt.

 

Zhu Xi hozzátette: „Ha korán felismerjük és figyelembe vesszük a problémában érintett felhasználói csoportok igényeit, az a technológia elterjesztésének folyamatát is jelentősen lerövidítheti, azt is elősegítve, hogy a speciális igényekkel rendelkező felhasználók azonnal a részesei lehessenek a legújabb fejlesztéseknek.”

 

A Xiaomi a jövőben is szem előtt tartja majd az érintett felhasználói kör visszajelzéseit, törekedve a megoldás minél szélesebb körű hozzáférhetővé tételére. A Xiaomi célja továbbra is az, hogy elérhetővé tegye a legfejlettebb technológiát, és a műszaki innováció révén kielégítse a legkülönbözőbb igényeket.

Kulcsszavak: Xiaomi Own My Voice

Megoldás ROVAT TOVÁBBI HÍREI

Facility managementben erősít az ICON

Három kiemelkedő épülettel, két irodaházzal és egy logisztikai ingatlannal bővült az ICON Real Estate Management ingatlanüzemeltetési portfoliója. A BEM Irodaház, a D2 Szabadkikötő, és az ELTE egyik megújult ingatlanja nem csupán az építészeti megoldásaik tekintetében példaértékűek, de a fenntarthatóság és az energiahatékonyság terén is úttörő megoldásokat alkalmaznak.

2024. április 17. 18:09

Új korszak az elektromobilitásban

A Maserati „Folgore Day” névre keresztelt nagyszabású eseményén mutatta be első 100%-ban elektromos kabrióját, a GranCabrio Folgore-t, melyet az úgynevezett „IT TURNS YOU ON” kampánnyal népszerűsítenek, az olasz művész, Damiano David szerepelésével. A modenai székhelyű márka fennállásának 110. évfordulóján a szigonyos márka ismertette ambiciózus céljait az elektromos átállás terén, valamint lerántotta a leplet TRIDENTE elektromos motorcsónakjáról is. 

2024. április 17. 16:28

Mesterséges intelligenciával készítik össze az Unilever B2C webshopjának rendeléseit

Közel 800 cikkszámot kezel, illetve mesterséges intelligenciával ellátott eszközökkel végzi a komissiózási feladatokat a Waberer’s Csoport leányvállalata, a WSZL az Unilever Magyarország Unishop elnevezésű B2C webshopjában. Az új megbízásnak köszönhetően a Waberer’s eddigi tevékenysége bővült és egy 14.500 négyzetméteres raktári terület kezelése mellett immár az Unishop raktárlogisztikai és fullfilment kiszolgálását is végzi. 

2024. április 17. 14:50

Terjednek az alacsony kódú technológiák

Az elmúlt években állandó slágertéma volt a globális informatikushiány, majd elkezdtek záporozni a hírek a techszektorban zajló tömeges elbocsátásokról és a szakértők máris a vészharangokat kongatták. A fordulatot a legtöbben a mesterséges intelligencia számlájára írják, ugyanakkor egyre nagyobb szeletet hasítanak a piacból a low-code platformok is. Ezekkel minimális kézi kódolással fejleszthetünk gyorsan és hatékonyan, miközben rugalmasan alkalmazkodhatunk a változó igényekhez és egyszerűen hangolhatjuk össze az üzleti és technológiai szempontokat. 

2024. április 17. 10:05

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Itt a világ első, Swarovski kristályba ágyazott autós kijelzője

2024. április 10. 14:55

A csevegőprogramokat vizsgálta az NMHH

2024. április 2. 13:14

Megvannak az IAB 2023-as Legjobb szakdolgozat pályázatának nyertesei

2024. március 25. 15:50

A 2024-es év fordulópont lehet az IT munkaerőpiacon?

2024. március 20. 10:09