Microsoft está transformando Windows 11 en una”PC con IA”con una importante actualización de Copilot anunciada hoy, cuyo objetivo es hacer que la interacción con las computadoras sea más natural e inteligente.
Una nueva palabra de activación”Hey, Copilot”permite a los usuarios dar comandos de voz, mientras que Copilot Vision, ahora disponible globalmente, permite a la IA ver y comprender lo que hay en la pantalla para brindar ayuda.
Microsoft también está presentando una vista previa del Copilot experimental Acciones, que permiten al asistente realizar tareas directamente en la PC para el usuario. Estas actualizaciones, que se están implementando ahora, representan la visión de Microsoft de integrar profundamente un socio proactivo de IA en el núcleo de su sistema operativo.
El jefe de marketing de consumo de la empresa Yusuf Mehdi, el oficial ejecutivo Yusuf Mehdi, enmarcó claramente la ambición al afirmar que”la visión que tenemos es: reescribamos todo el sistema operativo en torno a la IA y construyamos esencialmente lo que se convierte en una verdadera PC con IA”. El objetivo es hacer de cada dispositivo con Windows 11 una plataforma para este nuevo paradigma, que también incluye conectores Copilot para servicios como Gmail.
‘Hey, Copilot’: la voz se convierte en una entrada central de la PC
Microsoft está dando un impulso renovado y ambicioso para establecer la voz como un método principal de interacción con la PC. La pieza central de este esfuerzo es la nueva palabra de activación”Hey, Copilot”, ahora disponible de forma generalizada, que elimina la fricción de hacer clic en un icono para iniciar una conversación. Esta característica es fundamental para la estrategia de la empresa de hacer que su potente IA sea más accesible para una audiencia más amplia.
Este no es el primer intento de la empresa de integración de voz. Los críticos se apresuran a señalar el espectacular fracaso de Cortana en Windows 10 hace una década. Sin embargo, Microsoft está apostando a que la sofisticación de la IA moderna finalmente convencerá a los usuarios de que hablar con su PC no es extraño, lo que provocará un cambio genuino en el comportamiento donde los esfuerzos anteriores no pudieron.
La confianza de la compañía está respaldada por datos internos que sugieren que cuando las personas usan la voz, interactúan con Copilot el doble que cuando usan texto.
Microsoft señala comportamientos existentes, como los miles de millones de minutos dedicados a hablar. Las reuniones de Teams y el uso de herramientas de accesibilidad, como evidencia de que los usuarios ya se sienten cómodos hablando con sus dispositivos.
La experiencia está diseñada para ser perfecta. Después de habilitar la función de suscripción en la configuración, decir”Hola, copiloto”hace que aparezca un ícono de micrófono y un timbre, lo que confirma que el asistente está escuchando. Los usuarios pueden finalizar la conversación diciendo”Adiós”o simplemente deteniendo su interacción. Esta facilidad de uso es lo que Microsoft cree que es el”desbloqueo mágico”de la voz.
[contenido integrado]
Yusuf Mehdi, jefe de consumidores de Microsoft, cree que este cambio será profundo.”En nuestra opinión, la voz se convertirá ahora en el tercer mecanismo de entrada para usar con su PC”, explicó en una sesión informativa.
Esta ambición va más allá del simple dictado, posicionando la voz como una herramienta para comandos y consultas complejas que pueden cerrar la brecha entre la intención de un usuario y la habilidad de la IA.
La visión final es la de una computadora verdaderamente conversacional y responsiva.”Deberías poder hablar con tu PC, hacer que te entienda y luego poder hacer que suceda magia a partir de eso”.
Añadió Mehdi. Esto representa una apuesta importante, apostar a que la IA finalmente ha hecho que la interacción de voz sea lo suficientemente convincente como para cambiar décadas de hábitos de usuario construidos en torno al teclado y el mouse.
Una IA que ve su pantalla: Copilot Vision se lanza a nivel mundial
Un componente clave de este futuro centrado en la IA es Copilot Vision, que ahora está disponible en todos los mercados donde se ofrece Copilot. La función permite a la IA”ver”y analizar la pantalla de un usuario, proporcionando ayuda contextual en cualquier aplicación.
Esta capacidad ha evolucionado rápidamente desde su primera vista previa limitada, que se limitaba al navegador Edge y requería una suscripción paga.
La función transforma Copilot de un chatbot pasivo a una guía visual activa. A diferencia de la controvertida función de recuperación, Vision es estrictamente voluntaria y no siempre está activada.
Los usuarios deben otorgar permiso explícitamente para cada sesión haciendo clic en un”ícono de gafas”distinto, esencialmente transmitiendo su vista de pantalla de manera similar a una llamada de Teams.
Una vez activado, Vision puede ofrecer instrucciones paso a paso, solucionar problemas de la PC o responder preguntas sobre el contenido en pantalla. La capacidad se ha expandido desde la visualización de aplicaciones individuales hasta un modo completo de”Compartir escritorio”, que permite a la IA comprender el contexto en todo el flujo de trabajo de un usuario.
[contenido incrustado]
El equipo de Microsoft Copilot explicó la funcionalidad, afirmando que”cuando comparte su escritorio (o cualquier navegador o ventana de aplicación específica), Copilot puede ver lo que ve y hablar con usted sobre ello en tiempo real”.
Las aplicaciones prácticas son extensas. Un usuario puede pedir consejos sobre un proyecto creativo, obtener ayuda para mejorar su currículum o recibir orientación mientras navega por un nuevo juego. Una función”Destacados”incluso permite a Copilot señalar visualmente dónde hacer clic para completar una tarea. Para aumentar la productividad, puede analizar una presentación de PowerPoint completa para obtener información valiosa sin que el usuario tenga que hojear cada diapositiva.
Si bien Vision puede ver y asesorar, no puede tomar medidas en nombre del usuario; esa capacidad está reservada para la función separada Acciones de Copilot. Para hacer que la experiencia sea más versátil, Microsoft también está preparando un modo”Entrada de texto y salida de texto”, que permite a los usuarios interactuar con Vision a través de texto en lugar de solo voz.
Esta conciencia en todo el sistema es crucial para brindar asistencia verdaderamente contextual. Al comprender lo que hace un usuario, Copilot puede ofrecer soporte relevante sin requerir largas explicaciones, acercándose al objetivo de ser un”compañero cotidiano”. Una barra de tareas renovada proporciona acceso con un solo clic a estas herramientas, integrándolas aún más en la experiencia principal de Windows.
De asistente a agente: acciones de copiloto Tome el control de su PC
Quizás el elemento más prometedor de la actualización sea la vista previa experimental de Copilot Actions para archivos locales. Disponible para Windows Insiders a través de Copilot Labs, esta característica permite a la IA realizar tareas de varios pasos directamente en la PC de un usuario. Esto marca un paso significativo hacia un futuro de IA agente, donde el asistente no solo responde sino que trabaja activamente en su nombre.
Esta nueva capacidad transforma a Copilot en lo que Microsoft llama un”agente de propósito general”. En lugar de simplemente responder preguntas, puede abrir aplicaciones, escribir, desplazarse y ejecutar cadenas complejas de acciones.
Los usuarios pueden describir una tarea con sus propias palabras (como clasificar fotos de vacaciones o extraer información de un PDF) y el agente intentará completarla interactuando con aplicaciones web y de escritorio.
El sistema está diseñado para funcionar como un verdadero colaborador digital. Mientras el agente trabaja en segundo plano, los usuarios son libres de concentrarse en otras cosas. En cualquier momento, pueden monitorear el progreso del agente, revisar las acciones específicas que ha tomado o incluso recuperar el control de la tarea por completo. Esta capacidad amplía las acciones basadas en web que Microsoft anunció por primera vez en abril, llevando el poder de la automatización directamente al escritorio de Windows.
Sin embargo, la compañía está siendo transparente sobre su naturaleza experimental y está comenzando con un conjunto limitado de casos de uso para optimizar el rendimiento y aprender del uso en el mundo real.
Navjot Virk, vicepresidente corporativo de experiencias Windows de Microsoft, advirtió que el sistema aún está aprendiendo.”Al principio, es posible que vea que el agente comete algunos errores o encuentra algunos desafíos al intentar utilizar algunas aplicaciones realmente complejas”, señaló.
Esta transparencia es parte de una estrategia deliberada para gestionar las expectativas de los usuarios respecto de esta poderosa pero incipiente tecnología.
[contenido incorporado]
Aprendiendo del retiro: un nuevo enfoque en la aceptación y la seguridad
Microsoft es enfatizando deliberadamente el diseño opcional y centrado en la privacidad de estas nuevas características. Este enfoque cauteloso es una respuesta directa y necesaria a la feroz reacción contra su función Windows Recall, que fue fuertemente criticada por sus importantes vulnerabilidades de seguridad después de su presentación.
Recall se vendió inicialmente con una promesa de privacidad en el dispositivo. En ese momento, Yusuf Mehdi declaró:”Recall aprovecha su índice semántico personal, creado y almacenado completamente en su dispositivo. Sus instantáneas son suyas; permanecen localmente en su PC”.
Esa promesa se hizo añicos cuando los investigadores descubrieron que la función almacenaba sus datos en una base de datos local no cifrada, creando lo que muchos llamaron una”mina de oro para el malware”.
Las intensas críticas forzaron La empresa pospuso la función y rediseñó su seguridad. Con Copilot Vision and Actions, Microsoft no corre riesgos.
La compañía ha publicado un conjunto claro de compromisos de seguridad, enfatizando que estas poderosas experiencias de agente se están introduciendo de manera responsable.
Crucialmente, Copilot Actions está desactivado de manera predeterminada. Los usuarios deben elegir explícitamente habilitarlo y pueden pausarlo, tomar el control o deshabilitarlo en cualquier momento.
Microsoft también promete visibilidad total, lo que permite a los usuarios monitorear el progreso del agente y revisar cada paso que da. Para decisiones delicadas, el agente puede incluso solicitar una aprobación específica antes de continuar.
Este alejamiento de la captura pasiva de datos de Recall es fundamental para generar confianza en el usuario. El nuevo modelo de Copilot Actions está diseñado para garantizar que el usuario siempre tenga el control, un marcado contraste con el enfoque inicial siempre activo de Recall. Esta cuidadosa implementación de vista previa está diseñada para recopilar comentarios y perfeccionar los controles de seguridad antes de un lanzamiento más amplio.
En última instancia, Microsoft está posicionando su PC con IA como un socio confiable. Como afirmó Mehdi,”queremos que cada persona que haga el cambio experimente lo que significa tener una PC que no es solo una herramienta, sino un verdadero socio”.
El éxito de esta ambiciosa visión dependerá no solo de la capacidad de la tecnología, sino también de la capacidad de la empresa para convencer a los usuarios de que sus nuevas y potentes herramientas de IA son seguras.
[contenido integrado]