Google annonce la sortie de Meena, « le chatbot le plus performant du monde »

Dans cette catégorie

Ceci pourrait vous plaire

Google annonce la sortie de Meena, « le chatbot le plus performant du monde »

Puis-je parler à Meena ? Pas encore. Google dit qu’il ne publiera pas de démo publique tant qu’il n’aura pas vérifié le modèle en termes de sécurité et de qualité de réponse, ce qui est probablement une bonne chose. Lorsque Microsoft a publié son chatbot Tay sur Twitter en 2016, il a commencé à cracher des invectives racistes et misogynes en quelques heures.

Avec des plateformes d’IA comme Alexa et Siri qui s’améliorent de jour en jour, la prochaine étape naturelle pour les entreprises technologiques est de les rendre plus conviviales, au moins en termes de conversation. Nous avons vu Samsung essayer récemment avec sa plate-forme ‘Neon’ et maintenant Google essaie de faire de même avec son nouveau chatbot à domaine ouvert nommé ‘Meena’. Selon ses créateurs, Meena serait meilleur que tout autre chatbot sur le marché.
Meena a été formée sur une masse énorme de 341 gigaoctets de bavardage public issus des réseaux sociaux soit 8,5 fois plus de données que le GPT-2 d’OpenAI. Google dit que Meena peut parler de presque tout et peut même inventer de (mauvaises) blagues. La conversation ouverte couvre un large éventail de sujets que la plupart des chatbots ne peuvent pas suivre.
Souvent les chatbots disent des choses qui n’ont aucun sens ou révèlent un manque de connaissances de base de notre monde. Un chatbot qui évite de telles erreurs contribuera grandement à rendre les IA plus humaines et à rendre les personnages des jeux vidéo plus réalistes. Pour mettre Meena à l’épreuve, Google a développé une nouvelle métrique qu’elle appelle Sensibleness and Specificity Average (SSA) qui capte les attributs importants pour mener des conversations naturelles.

Meena est un modèle conversationnel neuronal de bout en bout qui apprend à répondre en tenant compte du contexte.  Au cœur du système se trouve l’architecture Evolved Transformer seq2seq, une architecture issue des recherches en machine learning et qui, en termes simples, est un réseau de neurones qui lit les mots placés côte à côte dans un paragraphe et vérifie si la relation entre ces deux est logique.

LAISSER UNE REPONSE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici