Anonim

Obrázek: Microsoft

Microsoft učinil další velký pokrok v oblasti umělé inteligence.

Výzkumní pracovníci ve společnosti vytvořili software pro rozpoznávání řeči, který je schopen slyšet jazyk tak přesně jako lidé. Vývoj, podrobně popsaný v dokumentu zveřejněném v pondělí, označuje nejmodernější software pro rozpoznávání řeči, jak uvádí společnost Microsoft.

VIZ TÉŽ: Facebook, Amazon, Google, IBM, Microsoft tvoří novou alianci AI

Ve studii měl software chybovost slova 5,9%, což je přibližně stejné množství jako u lidských transkriptů.

Jak to společnost Microsoft vysvětluje:

Výzkumný milník neznamená, že počítač dokonale rozpozná každé slovo. Lidé to ve skutečnosti také neudělají. Místo toho to znamená, že míra chyb - nebo míra, s jakou počítač neslyší slovo jako „mít“ pro „je“ nebo „a“ pro „tu“ - je stejné, jako byste očekávali od osoby, která slyší stejný výraz konverzace.

Dříve vědci dosáhli chybovosti 6,3 procenta a dále se zaměřili na dosažení úrovně lidské přesnosti. To bylo jen něco málo přes měsíc.

Software sám spoléhá na hluboké neuronové sítě - technologii, která interpretuje data podobným způsobem, jak funguje lidský mozek - stejně jako specializované grafické procesory (GPU), které umožňují softwaru naučit se v rychlostech, které dříve nebyly možné.

Milník má dalekosáhlé důsledky. Na praktické úrovni to znamená, že produkty společnosti Microsoft by mohly být brzy lépe pochopitelné pro lidi. Výzkumníci označují aplikaci Microsoft Cortana pro osobní asistent společnosti Microsoft a Xbox jako dva produkty, které mohou okamžitě těžit z výzkumu. Software pro usnadnění přístupu, jako jsou služby okamžité transkripce, by také mohl těžit z pokroku.

Milník má dalekosáhlé důsledky

Mohlo by to být také snadno začleněno do produktivních nástrojů společnosti Microsoft, jako je Office - představte si, jak mnohem lepší je funkce diktování aplikace Word s téměř lidskou úrovní přesnosti - nebo její podnikové nabídky.

Spotřební výrobky stranou, to je také zlomový bod pro výzkum AI. Geoffrey Zweig z výzkumné skupiny Microsoftu pro řeči a dialogy ve svém prohlášení konstatuje, že další fází je pomoci vytvořit software, který nedokáže pouze přepsat lidskou řeč, ale také ji pochopit. Ačkoli je to cíl, který je daleko dále, schopnost přesně přepsat lidskou řeč je velkým krokem vpřed.