Microsoft renueva Copilot con nuevas funciones de voz y razonamiento
Agencias, Ciudad de México.- El gigante tecnológico Microsoft anunció que su inteligencia artificial (IA) generativa, Copilot, ahora cuenta con voz, ojos e inteligencia emocional para ser un “compañero” al que los usuarios puedan acudir no solo para pedir ayuda, sino también para conversar.
Mustafa Suleyman, el director ejecutivo de Microsoft AI, dijo en la presentación de estas nuevas funciones en un evento en Nueva York que ahora las computadoras han aprendido el lenguaje de las personas y que eso “cambia por completo el paradigma interactivo entre los humanos y las máquinas”.
“Estas máquinas ahora entienden nuestra voz. Pueden transcribir perfectamente lo que hemos dicho. Pueden reaccionar a nuestra entonación. Está en un nivel tan bueno que puedes tener una conversación fluida, relajada e informal, donde capta la inteligencia emocional de tu discurso y se siente como si estuvieras teniendo una conversación normal”, destacó el cofundador de Google DeepMind.
Según Suleyman, por el momento Copilot Voice, el chatbot en el que el usuario puede conversar con Copilot, no guarda las conversaciones ni la empresa guarda la información para entrenar la IA.
Esta IA tiene cuatro voces y sale hoy en Australia, Canadá, Nueva Zelanda, el Reino Unido y EE.UU. en las aplicaciones móviles iOS y Android, en la web en copilot.microsoft.com y a través de la aplicación Copilot para Windows.
De acuerdo con Microsoft Copilot Voice estará disponible inicialmente en inglés, pero en una demostración una periodista de EFE consiguió tener conversaciones fluidas con la máquina en francés y español.
Al igual que otras IA, sus respuestas pueden estar bien formadas, pero con información falsa. Algo que se conoce como alucinaciones, razón por la que el usuario no puede “conversar”, con la IA de algunos temas como las elecciones, consultas médicas o advertencias legales.
“Hasta que no tengamos índices de precisión muy altos y tasas de falsos positivos muy bajas, no nos extenderemos a estas otras áreas, pero llegará ese momento. Es cuestión de unos pocos años”, adelantó Suleyman.
Los ojos de la IA serán Copilot Vision, chatbot que es capaz de ver el navegador del usuario, entender tanto el texto como las imágenes, y dar consejos o hacer resúmenes sobre lo que ve.
Según Microsoft, esta aplicación puede ser útil para organizar el alojamiento de un viaje en Airbnb -ya que puede escuchar cuáles son las preferencias del usuario y basándose en eso recomendar una opción específica- o elegir una película según las opiniones que los críticos dejan en Rotten Tomatoes -pues puede hacer un resumen de todos los comentarios que hay en la web-.
Esta función no estará disponible en todas las webs de internet y aún está en desarrollo. Por ello, solo se puede acceder a la versión beta por Copilot Labs en EE.UU.
La empresa también presentó Think Deeper -que también solo está disponible en Copilot Labs- en la que la IA se toma más tiempo para razonar su respuesta, lo que, según la empresa, permite responder a una respuesta compleja en la que por ejemplo se cita una lista de pros y contras.
“Lo hemos diseñado para que sea útil para todo tipo de desafíos prácticos y cotidianos, como comparar dos opciones complejas una al lado de la otra. ¿Debería mudarme a esta ciudad o a aquella? ¿Qué tipo de automóvil se adapta mejor a mis necesidades? Y así sucesivamente”, explica Microsoft en un comunicado.
El titán tecnológico también anunció este lunes Copilot Daily, un resumen en audio de noticias e información meteorológica que Copilot lee como si fuera un pódcast.
“Trabajamos directamente con Reuters, Financial Times, USA Today y pagamos por este contenido. Pero con el tiempo, también incluirá correos electrónicos, eventos del calendario y tareas del día. La idea es realmente resumir solo las cosas que necesita saber (el usuario) al amanecer”, detalló Suleyman.
El despliegue de funciones es uno de los primeros que Suleyman supervisa desde que Microsoft creó su división en marzo para centrarse en los productos de consumo y la investigación tecnológica.
Identificada durante mucho tiempo con el software empresarial, Microsoft ha tenido un camino mucho más difícil en el ámbito del consumo, pero su motor de búsqueda Bing, por ejemplo, sigue siendo eclipsado por Google.
Suleyman confía en tener éxito con Copilot, que se lanzó el año pasado en un campo repleto de chatbots de IA, como ChatGPT de OpenAI y Gemini de Google.
Las nuevas funciones de voz de Copilot lo convierten en un oyente mucho más activo, que da señales verbales como “guay” y “eh”, explica Suleyman.
Según Suleyman, el producto se basa en modelos de inteligencia artificial de Microsoft (MAI) y en un conjunto de tecnologías de OpenAI.
Suleyman añadió que los consumidores que paguen 20 dólares al mes por Copilot Pro pueden empezar a probar la función “Think Deeper” (Piensa más), que permite razonar las decisiones, como la de mudarse a una ciudad u otra.
Una función de prueba adicional para los suscriptores de pago, Copilot Vision, equivale a “señalar digitalmente”, es decir, la posibilidad de que los usuarios hablen con la IA sobre lo que ven en un navegador Microsoft Edge.
Para más información puedes visitar la Web Oficial o seguir las redes sociales oficiales como la Cuenta de Twitter.