La inteligencia artificial ya no se mide solo en la calidad de sus respuestas, sino en qué tan cerca puede estar de hacer cosas por nosotros. En este terreno, tres jugadores dominan la conversación: ChatGPT de OpenAI, Gemini de Google y el recién lanzado Comet de Perplexity. Cada uno tiene fortalezas, pero Comet busca diferenciarse con una propuesta que sus rivales todavía no ofrecen: pasar de la respuesta a la acción directa en la web.
ChatGPT se consolidó como el asistente conversacional más versátil. Sirve para escribir, analizar documentos, resolver problemas de programación o elaborar informes detallados. Con los agentes personalizados y la función Deep Research, da un paso hacia la automatización de flujos de trabajo, pero en esencia sigue siendo un chat que depende de la interacción del usuario. No toma la iniciativa de actuar en tu navegador, sino que te guía para que seas tú quien ejecute las tareas.
Gemini, por su parte, destaca por su multimodalidad. Puede procesar y generar texto, audio, imágenes y hasta video en tiempo real. La integración con Gmail, YouTube, Maps y el resto del ecosistema Google lo convierte en una herramienta muy completa para quienes viven dentro de ese entorno digital. Sin embargo, sus acciones siguen ligadas a las aplicaciones de Google, y rara vez se aventura a manipular la web abierta más allá de mostrar información.
Aquí es donde aparece Comet, que rompe el molde. En lugar de ser un chat o una app aislada, es un navegador con IA integrada, es decir, no quiere solo responder preguntas, sino ejecutar tareas por el usuario. Puede reservar un vuelo, llenar formularios de una página, traducir automáticamente un sitio o enviar un correo en Gmail, todo sin que tengas que salir de la pestaña. La promesa es ambiciosa: un asistente que entiende lo que necesitas y lo hace en tu lugar, con la misma naturalidad con la que uno usaría un buscador.
Esta diferencia lo convierte en un experimento único. Ni ChatGPT ni Gemini están tan profundamente integrados en el navegador como para “hacer clics” o “rellenar” formularios. Comet se mueve en esa línea gris entre motor de búsqueda y agente personal, ofreciendo una experiencia más cercana a tener un asistente digital que realmente toma decisiones sobre la pantalla.
Claro, esa innovación también trae retos, pues por ahora, el acceso a Comet está limitado a los suscriptores de su plan más alto, lo que lo convierte en una opción elitista frente a la disponibilidad gratuita de ChatGPT o Gemini. Además, especialistas en seguridad han advertido que un asistente con capacidad de actuar en la web podría ser más vulnerable a ataques de phishing o inyecciones maliciosas si no se controla con precisión. Y todavía se reportan fallas en la ejecución de tareas complejas, como reservas o envío de correos a los destinatarios correctos.
Comet todavía está lejos de ser perfecto, pero es el único que se atreve a dar el salto hacia un internet donde las órdenes no se quedan en palabras, sino que se transforman en acciones. ChatGPT domina en productividad y Gemini en multimedia, pero ninguno se ha arriesgado a meterse tan a fondo en la navegación. Esa osadía lo convierte en un proyecto caro, exclusivo y vulnerable, pero también en la propuesta más visionaria: una IA que ya no espera instrucciones, sino que empieza a mover los hilos de la web por nosotros.
Crédito: Enter.co
Comments are closed