Deportes

AI se está haciendo cargo de su motor de búsqueda. Aquí hay un vistazo debajo del capó

Durante décadas, la forma en que encontramos información en Internet cambió solo de pequeñas maneras. Hacer una búsqueda tradicional de Google hoy no se siente tan diferente de cuando, en la década de 1990, le preguntaría a Jeeves. Claro, mucho ha cambiado debajo del capó, los resultados son mucho más relevantes y la interfaz tiene algunas características nuevas, pero aún está escribiendo palabras clave y obteniendo una lista de sitios web que podrían contener la respuesta.

Esa forma de buscar, al parecer, está comenzando a seguir el camino de Altavista, que descanse en paz.

En mayo, Google anunció el lanzamiento de su nuevo Modo AI para la búsqueda, que usa un modelo de IA generativo (basado en la empresa Géminis Modelo de lenguaje grande) para darle respuestas conversacionales que se sientan mucho más como tener un chat y menos como peinar a través de un conjunto de enlaces. Otras compañías, como Perplexity y OpenAI, también han desplegado herramientas de búsqueda basadas en Gen AI. Estas herramientas, que fusionan la funcionalidad de un chatbot y un motor de búsqueda tradicional, están ganando rápidamente vapor.

Ni siquiera puede escapar de la IA haciendo solo una búsqueda regular de Google: las descripciones de la IA han estado apareciendo sobre esas páginas de resultados desde el año pasado, y sobre uno de cada cinco búsquedas Ahora muestran este tipo de resumen, según un informe del Centro de Investigación Pew. Me sorprende que ni siquiera sea más que eso.

Estos Herramientas de búsqueda nuevos se siente muy parecido a tu típico chatbot, como ChatgptPero hacen las cosas un poco diferente. Esas diferencias comparten mucho ADN con sus antepasados de motor de búsqueda. Aquí hay un vistazo debajo del capó sobre cómo funcionan estas nuevas herramientas y cómo puede usarlas de manera efectiva.

Motores de búsqueda versus búsqueda de IA: ¿Cuál es la diferencia?

La tecnología subyacente de un motor de búsqueda es como un antiguo catálogo de tarjetas de biblioteca. El motor utiliza bots para rastrear las vastas extensiones de Internet para encontrar, analizar e indexar el número interminable de páginas web. Luego, cuando haces una búsqueda para preguntar quién interpretó a la Dra. Angela Hicks en ER, porque estás tratando de recordar en qué más la has visto, devolverá páginas para cosas como el elenco de ER o la biografía del actor, CCH Pounder. A partir de ahí, puede hacer clic en esas páginas, ya sea que estén en Wikipedia o IMDB o en otro lugar, y aprender que conoce CCH Pounder de su aparición invitada ganadora del Emmy en un episodio de The X-Files.

«Cuando los clientes tienen una cierta pregunta, pueden escribir esa pregunta en Google y luego Google ejecuta sus algoritmos de clasificación para encontrar qué contenido es el mejor para una consulta en particular», me dijo Eugene Levin, presidente de la compañía de herramientas de marketing y SEO Semrush.

En general, con una búsqueda tradicional, debe hacer clic en otros sitios web para obtener la respuesta que está buscando. Cuando intentaba descubrir de dónde reconocí CCH Pounder, hice clic en al menos media docena de sitios diferentes para rastrearlo. Eso incluyó el uso de la búsqueda de video de Google, que combina un índice de videos en diferentes plataformas de alojamiento, para encontrar clips de su apariencia en los archivos X.

Google anunció el modo AI en su conferencia de desarrolladores de E/S en mayo.

Google/Captura de pantalla de Joe Maldonado/CNET

Estas múltiples búsquedas no necesariamente tienen que suceder. Si solo quiero conocer el elenco de la sala de emergencias, puedo escribir «el elenco de ER» y hacer clic en Página de Wikipedia en la parte superior.

Por lo general, encontrará Wikipedia u otro sitio relevante y confiable en la parte superior de una página de resultados de búsqueda. Esto se debe a que funcionan los algoritmos de búsqueda de hoy en día es rastreando qué sitios y páginas obtienen la mayoría de los enlaces de otros lugares de la web. Ese modelo, que «cambió el juego para la búsqueda» cuando Google lo lanzó en la década de 1990, era más confiable que los sistemas de indexación que dependían de cosas como cuántas veces apareció una palabra clave en una página, dijo Sauvik Das, profesor asociado en el Instituto de Interacción de Computadores Humanos de la Universidad Carnegie Mellon.

«Hay muchas recetas de galletas en la web, pero ¿cómo sabes cuáles mostrar primero?» Dijo Das. «Bueno, si un montón de otros sitios web se vinculan a este sitio web para las palabras clave de ‘Receta de cookies’, eso es bastante difícil de jugar».

Los motores de búsqueda con AI funcionan de manera un poco diferente, pero operan con la misma infraestructura básica. En mi búsqueda para ver de dónde reconocí CCH Pounder, le pregunté al modo de IA de Google, literalmente, «¿de dónde reconozco a la actriz que interpreta a la Dra. Angie Hicks en ER?» En una conversación que se sintió mucho más como charlar con un bot que hacer búsquedas, la reduje. El primer resultado me dio una lista de programas y películas que no había visto, así que pedí una lista más amplia, que presentó sus apariciones invitadas en otros programas. Entonces podría pedir más detalles sobre su apariencia de X-Files, y eso lo redujo.

Si bien la forma en que interactué con Google era diferente, los mecanismos de búsqueda eran básicamente los mismos. El modo AI acaba de utilizar su modelo Gemini para desarrollar y procesar docenas de diferentes búsquedas web para recopilar la información necesaria, Robby Stein, Vicepresidente de Producto de Google Search, me dijo. «Un usuario podría haber consultado cada una de esas consultas ellos mismos».

Básicamente, el modo AI hizo lo mismo que hice, mucho más rápido.

Tantas búsquedas, tan poco tiempo

El enfoque aquí se llama «Fan-Out de consultas». El modelo AI toma su solicitud y la divide en una serie de preguntas, luego realiza búsquedas para responder a los componentes de la solicitud. Luego toma la información que reúne de todas esas búsquedas y sitios web y la junta en una respuesta para usted. En un latido.

Esas búsquedas están utilizando el mismo índice que una búsqueda tradicional. «Trabajan en la misma base», dijo Levin. «Lo que cambia es cómo extraen información de esta base».

Este proceso de ventilador permite que la búsqueda de IA extraiga la información relevante de los sitios que podrían no haber aparecido en la primera página de los resultados de búsqueda tradicionales, o extraer un párrafo de buena información de una página que tiene mucha más información irrelevante. En lugar de que bajas por una madriguera de conejo para encontrar una pequeña pieza de la respuesta que quieres, la IA baja por una amplia gama de agujeros de conejo en unos segundos.

«Anticiparán, si estás buscando esto, ¿qué es lo siguiente que te interesa?» Levin dijo.

Leer más: AI Essentials: 29 formas en que puede hacer que la Gen AI funcione para usted, según nuestros expertos

El número de búsquedas que realizará el modelo AI depende de la herramienta que esté utilizando y de cuán complicada es su pregunta. El modo AI que usa la búsqueda profunda de Google pasará más tiempo y realizará más búsquedas, dijo Stein. «Cada vez más, si haces una pregunta realmente difícil, usará nuestros modelos más poderosos para responder», dijo Stein.

Los modelos de idiomas grandes que alimentan estos motores de búsqueda también tienen sus datos de capacitación existentes para extraer o usar para guiar sus búsquedas. Si bien gran parte de la información proviene del contenido actualizado que encuentra al buscar en la web, algunos pueden provenir de esos datos de capacitación, que podrían incluir resmas de información que van desde sitios web como este hasta bibliotecas de libros. Que los datos de capacitación son tan extensos que las demandas sobre si las compañías de IA realmente tenían el derecho a usar esa información se están multiplicando rápidamente. (Divulgación: Ziff Davis, la empresa matriz de CNET, en abril presentó una demanda contra OpenAi, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA).

La búsqueda de IA no es solo un chatbot

No confiar en los datos de capacitación es una cosa que distingue a un motor de búsqueda con AI aparte de un chatbot tradicional, a pesar de que el modelo de lenguaje subyacente podría ser en gran medida lo mismo. Si bien la búsqueda en ChatGPT buscará Internet para sitios y respuestas relevantes, ChatGPT regular podría confiar en sus propios datos de capacitación para responder a su pregunta.

«La respuesta correcta podría estar allí», dijo Das. «También podría alucinar una respuesta probable que no esté en ninguna parte de los datos de pre-entrenamiento».

La búsqueda de IA utiliza un concepto llamado generación de recuperación augsada para incorporar lo que encuentra en Internet en su respuesta. Recopila información de una fuente a la que la señala (en este caso, el índice de motor de búsqueda) y le dice que busque allí en lugar de inventar algo si no puede encontrarlo en sus datos de entrenamiento. «Le estás diciendo a la IA que la respuesta está aquí, solo quiero que encuentres dónde», dijo Das. «Obtienes los 10 mejores resultados de Google, y estás diciendo a la IA que la respuesta probablemente esté aquí».

Perplexity ofrece una búsqueda a IA a través de su aplicación y a través de un navegador recientemente anunciado.

Stefani Reynolds/Bloomberg a través de Getty Images

¿Puedes realmente confiar en los resultados de búsqueda de IA?

Estas herramientas de búsqueda con IA pueden ser más confiables que solo usar un chatbot en sí, porque están extrayendo de información actual y relevante y dando enlaces, pero aún tiene que que Piensa críticamente al respecto. Aquí hay algunos consejos de los expertos:

Trae tu escepticismo humano

Considere cuán malas son las personas cuando seas sarcástica en Internet. Luego piense en lo malo que podría ser un modelo de idioma grande. Así es como las descripciones de la IA de Google se le ocurrieron la idea de poner pegamento en la pizza – sacando información de una publicación de Reddit humorística y repitiéndola como si fuera un verdadero consejo culinario. «La IA no sabe qué es auténtico y qué es humorístico», dijo Das. «Va a tratar toda esa información igual».

Recuerde usar su propio juicio y buscar las fuentes de la información. Puede que no sean tan precisos como piensa el LLM, y no quieres tomar decisiones importantes de la vida basadas en la broma de alguien en un foro de Internet que un robot pensó que era real.

Ai todavía puede hacer cosas

A pesar de que se supone que deben extraerse de los resultados de búsqueda, estas herramientas aún pueden aumentar las cosas en ausencia de buena información. Así es como comenzaron a crear resumen de la IA Definiciones falsas para dichos sin sentido.

La generación de recuperación auggada podría reducir el riesgo de absoluto alucinaciones Pero no lo elimina, según Das. Recuerde que un LLM no tiene una idea de cuál es la respuesta correcta a una pregunta. «Es solo predecir cuál es la próxima palabra inglesa que vendría después de esta secuencia anterior de otras palabras en inglés u otras palabras de idioma», dijo Das. «Realmente no tiene un concepto de verdad en ese sentido».

Revise sus fuentes

Los motores de búsqueda tradicionales son muy sin duda. Le darán una lista de sitios web que parecen relevantes para su búsqueda y le permitirán decidir si desea confiar en ellos. Debido a que una búsqueda de IA está consolidando y reescribiendo esa información en sí misma, puede no ser obvio cuando usa una fuente no confiable.

«Esos sistemas no van a estar completamente libres de errores, pero creo que el desafío es que con el tiempo perderá la capacidad de atraparlos», dijo Levin. «Serán muy convincentes y no sabrá cómo realmente ir y verificar, o pensará que no necesita ir y verificar».

Pero puedes verificar cada fuente. Pero ese es exactamente el tipo de trabajo que probablemente esperaba evitar usar este nuevo sistema que está diseñado para ahorrarle tiempo y esfuerzo.

«El problema es que si va a hacer este análisis para cada consulta que realice en ChatGPT, ¿cuál es el propósito de ChatGPT?» Levin dijo.



Enlace de origen

Publicaciones relacionadas

Botón volver arriba