Microsoft vient de s’offrir une réputation remarquable dans le domaine de la reconnaissance vocale, puisque son assistant virtuel égale désormais les capacités de compréhension humaine. Rien que cela…

cortana

On ne peut indéniablement pas nier les progrès colossaux de l’intelligence artificielle dans certains domaines et celui de la reconnaissance vocale est probablement le plus flagrant. Microsoft vient d’ailleurs de montrer par le biais de sa division Microsoft Artificial Intelligence and Research, que son assistant virtuel était arrivé au niveau de compréhension humaine.

La technologie de reconnaissance vocale de Microsoft égale celle de l’humain

Pour l’instant les résultats avancés par Microsoft concernent la langue anglaise et le taux d’erreurs de compréhension est de l’ordre de 5,9%. Un chiffre qui est similaire au taux d’erreurs de compréhension d’un être humain. Microsoft continue d’ailleurs de faire des progrès puisqu’il y a seulement un mois, le taux d’erreurs dans le domaine de la reconnaissance vocale de l’entreprise était de 6,3%.

Ces améliorations sont rendues possibles grâce aux avancées considérables effectuées dans le domaine du machine learning et du deep learning, qui compilent un grand nombre d’informations, afin d’offrir aux systèmes informatiques ou aux machines la capacité d’apprendre par elles-mêmes de leurs erreurs.

Cette technologie n’est pas encore intégrée à la version actuelle de Cortana, mais lorsque cela sera le cas, il ne fait aucun doute que cela sera l’assistant personnel le plus performant du marché sur ce point. Les versions concurrentes de Google, Apple, Amazon, IBM, Samsung, etc. auront donc d’importants progrès à réaliser pour parvenir à ce résultat, mais l’ensemble travaillant sur les technologies de réseaux neuronaux et de deep learning, la guerre n’est pas encore gagnée pour la firme de Redmond.

Microsoft fier de ce résultat ne compte pas en rester là et a déjà annoncé qu’il travaillait sur d’autres optimisations, notamment la reconnaissance vocale dans les milieux bruyants, la différenciation de plusieurs voix ou encore dans le domaine de la compréhension des machines non par l’association des mots (des sons), mais bien pour la compréhension logique.

Source