El modo de voz de GPT-5 puede tener una conversación decente, pero no hables con Chatgpt en público

Sentado en el vestíbulo del taller de carrocería esperando un estimado de reparación, me di cuenta de que había olvidado mis auriculares. Normalmente, ese no es un problema importante, pero estaba hablando con mi teléfono. Y no estaba hablando con otra persona. Estaba hablando con Chatgpt. Se sintió tan vergonzoso como hacerle una pregunta a Siri desde el otro lado de la habitación o unirse a una reunión de zoom sin auriculares en una oficina abierta.
Estoy probando el modo de voz avanzado que viene con GPT-5La última versión de Openai del modelo AI generativo detrás de ChatGPT. GPT-5 cayó este verano después de muchos meses de especulación y retrasosLos usuarios de IA prometedores una experiencia de chatbot más rápida e inteligente. El jurado aún está sobre si OpenAi ha entregado o no. (Divulgación: Ziff Davis, la empresa matriz de CNET, en abril presentó una demanda contra OpenAi, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA).

GPT-5 incluye mejoras en su modo de voz avanzadoLo cual es esencialmente una forma de que literalmente hable con chatgpt y que responda en la voz de su elección. Los usuarios gratuitos como yo ahora tienen acceso a la versión avanzada (los usuarios gratuitos anteriormente solo tenían acceso al modo de voz básico), y los suscriptores de pago recibirán límites de uso más altos. Otra nueva característica GPT-5 le permite elegir qué tipo de personalidad desea que su IA imite, incluyendo atrevido, nerd y robótico Avatares.
Para usar el modo de voz, abra CHATGPT, toque el botón de audio junto a la ventana de solicitud donde ingresaría una instrucción y comenzaría a chatear. Puede cambiar qué Voice ChatGPT utiliza tocando el icono de configuración en la esquina superior derecha en la aplicación móvil (dos barras apiladas una encima de la otra con círculos en ellos).
¿Más voces de IA humana? Cómo fue mi experiencia
Decidí tratar de hablar con Chatgpt como lo haría con un amigo, como una versión más entusiasta de mí mismo. La IA se echó a reír cuando comencé la llamada con una espíritu «¡Hola novia!» que se sintió divertido y condescendiente.
La voz de Chatgpt fluyó de manera muy natural en una cadencia familiar, similar a la forma en que hablaría con un agente de servicio al cliente particularmente amigable. Eso tenía sentido cuando el chatbot en sí me dijo que el modo de voz avanzado actualizado ayudó a que suene más humano.
La voz que usé, Ember, a menudo tomaba pausas para respirar, como lo haría un humano durante una oración más larga. Pensé que era un poco extraño, ya que mientras ChatGPT estaba haciendo su mejor impresión de un humano, ambos sabíamos que en realidad no necesitaba detenerse para recuperar su aliento.
En mi conversación con ChatGPT, fue más empático de lo que esperaba. Me preguntó cómo estaba y dije que no bien y lo conté sobre mi accidente automovilístico. En nuestra conversación de cinco minutos, reservaría muchas de sus respuestas con declaraciones empáticas, como decir que lamentaba que estuviera teniendo una mala semana y acordando que tratar con el seguro puede ser un dolor de cabeza. (¿Chatgpt ha tenido que llamar a un agente de seguros o incluso experimentado un dolor de cabeza? Creo que no).
Si bien un oído robot simpático puede no parecer un gran problema, puede ser un signo de un problema mayor. La IA sycophántica, el término utilizado para describir cuándo la IA es demasiado cariñosa o emocional, puede ser frustrante para los usuarios que solo buscan información. También puede ser peligroso para las personas que usan AI como terapeutas o consejeros de salud mental, algo Openai CEO Sam Altman ha advertido Los usuarios de chatgpt en contra. Las versiones anteriores de chatgpt han sido tirado y relanzado después de problemas con tendencias sycofánticas.
También le hice a ChatGPT más preguntas objetivas, como el costo promedio de la mano de obra de reparación de automóviles en Carolina del Norte y a dónde podría ir para obtener una segunda estimación de reparación. Respondió más como un amigo que un chatbot, que puede no ser el más útil. Por ejemplo, cuando escribí la misma solicitud en ChatGPT en mi computadora portátil, sacó un mapa con la lista de tiendas, junto con más información, como información de precios y horas de almacenamiento. Pero cuando estaba chateando con el modo de voz ChatGPT, trajo menos opciones y las describió en base a lo que supongo que son el lenguaje de marketing de la tienda y las reseñas de los clientes, utilizando frases como «Han existido desde hace bastante tiempo» y diciendo que una tienda es «conocida por su servicio de calidad». Tampoco obtienes ningún enlace o fuente con modo de voz, que no me encanta.

ChatGPT transcribe automáticamente los chats de voz, para que pueda ver la diferencia en el nivel de detalle dado en las indicaciones de texto regulares (izquierda) y los chats de voz (derecha).
Usar la voz de chatgpt como tablero de sonido
Una de las cosas para el modo de voz es bien adecuado es ser un compañero de lluvia de ideas, un muro literal para rebotar las ideas. Le pedí que me ayudara a planificar una fiesta de cumpleaños con temas de cielo, y me ayudó a desarrollar nuevas ideas y refinar las que ya tenía.
Interrumpí el chatgpt mientras hablaba un par de veces, y fue capaz de pivotar rápidamente. También tiendo a hablar rápidamente, y el chatbot se mantuvo y no se perdió ninguno de mis pensamientos. Me dejé divagar y alejar la conversación fuera de la pista, y ChatGPT no parpadeó un ojo virtual. Lo más importante, cuando le hice una pregunta sobre un tema anterior, podría retomar dónde lo dejamos. Las mejoras en la memoria de ChatGPT deben agradecer por esa importante consideración.
Mira esto: El impacto oculto del auge del centro de datos de IA
¿Deberías usar el modo de voz ChatGPT?
En general, creo que el modo de voz es bueno como otra forma de usar chatgpt, pero solo es situalmente útil. Si necesita una investigación en profundidad y una información más detallada, el modo de voz no será adecuado para usted. Pero si solo quieres hablar con alguien (más bien, algunoscosa) o trabajar a través de un problema en voz alta, el modo de voz es una buena alternativa para tener que articular sus pensamientos y escribirlos.
Todavía creo que no hemos normalizado hablar con AIS en espacios públicos, especialmente sin auriculares. Pero puede ser una alternativa útil para las personas que piensan mejor en voz alta. Para más, consulte cómo la IA está cambiando los motores de búsqueda y el Mejores generadores de imágenes de IA.