Google generó un ‘podcast’ a partir de uno de mis artículos y es la IA que imita a humanos más convincente y espeluznante que he escuchado hasta ahora.

Google generó un 'podcast' a partir de uno de mis artículos y es la IA que imita a humanos más convincente y espeluznante que he escuchado hasta ahora.

Como jugador experimentado y entusiasta de la tecnología con más de dos décadas de experiencia, déjame decirte que he visto algunas innovaciones revolucionarias que me dejaron asombrado. Pero el último juguete de Google, NotebookLM, ha provocado conmociones en los cimientos mismos de mi ser digital. Es como toparse con un genio en una botella, solo para que emita un podcast de 10 minutos de duración sobre su último artículo con un extraño acento americano.


Con un solo clic, la innovadora herramienta de inteligencia artificial de Google, NotebookLM, puede crear un podcast para usted. Básicamente, funciona como una máquina de resumen. Simplemente carga un documento, presiona generar y, a cambio, recibe una versión condensada del documento, como una breve descripción general, una sección de preguntas frecuentes o una guía de estudio. Lo que hace que esta herramienta sea aún más fascinante es su capacidad para producir un podcast sobre el contenido del documento. Los presentadores de estos podcasts son entidades transitorias con alegre acento estadounidense.

Tomemos, por ejemplo, un artículo que escribí en 2023 titulado «La caché es el rey cuando se trata de diseñar CPU para juegos de los próximos 20 años». En el que hablé con un puñado de expertos en ingeniería de silicio sobre el futuro del diseño de chips. Introduje el artículo en NotebookLM, esperé unos cuatro minutos y apareció un podcast de 10 minutos de duración.

Escúchalo en el inserto de Soundcloud a continuación.

«¡Qué diablos!»

Debo admitir que dejé escapar una exclamación de sorpresa cuando lo escuché por primera vez: ¡lo siento! Lo que realmente me atrapó fue el flujo realista de la discusión y las emociones genuinas que transmitía. No es frecuente que te encuentres con algo como esto, así que me dejó una gran impresión.

Ellos (ya estoy actuando como si fueran personas reales) incluso presentan el podcast… como un podcast. Cuando escucho, tengo que recordarme a mí mismo que estas no son personas reales: son el producto de mi inserción de un hipervínculo en un cuadro de un sitio web. Una computadora que simula dos humanos que comparten pensamientos y sentimientos. No sé por qué, pero esto me resulta profundamente extraño.

Parece que no soy el único que tiene mis sentimientos hacia la nueva herramienta de IA. Al compartir una versión que probamos con nuestra RTX 4090 con todo el equipo de PC Gamer, recibimos comentarios como:

«Esto provoca una verdadera crisis existencial».

Y:

«Esto es jodidamente aterrador».

Y:

«Las interrupciones y respuestas del coanfitrión me están asustando».

Y:

«Me voy a mudar al bosque. No puedo soportarlo».

Lo que quiero decir es que NotebookLM es espectacularmente impresionante y aterrador a partes iguales. Es más, las analogías y referencias hechas a lo largo de la grabación no se extraen del tema en cuestión, en este caso, un artículo de PC Gamer. Están compuestos en su mayoría por la IA.

Por ejemplo, comparar 3D V-Cache con la construcción de un rascacielos en lugar de ampliar un almacén es bastante ingenioso, aunque se generó artificialmente. Y eso sólo aumenta su impresionante calidad.

Sin embargo, un podcast tiene tanto que ver con los presentadores como con el contenido. Y hasta ahora no hemos tenido ningún otro ‘anfitrión’ (vocaloids AI) que preste su voz a nada de lo que hemos subido a NotebookLM. Seguramente se desgastará un poco con el tiempo. Sin mencionar que es poco probable que haya errores divertidos con dos robots programados por Google detrás del micrófono.

Me parece que estoy transmitiendo la idea de que PC Gamer Chat Log no parece representar una amenaza genuina y confiable para los podcasts bien establecidos ni reemplazarlos por completo. Sin embargo, de manera similar a cómo el arte generado por IA no ha erradicado todo el arte humano, podría alterar potencialmente el panorama de lo que se considera valioso. Para ilustrar, es posible que no produzcas 300 obras maestras solo para una sola noche de juegos de D&D con amigos, pero con la IA, puedes crear dicho contenido si estás abierto a su uso, lo cual es perfectamente razonable.

Al igual que en este caso, no crearía un podcast para cada artículo que he escrito. Sin embargo, ¿si fuera tan simple como presionar algunos botones? Algo que hace meses parecía que no valía la pena, ahora es prácticamente sencillo.

No te preocupes, no te agobiaré con innumerables artículos antiguos sobre especificaciones de tarjetas gráficas. La esencia es clara: los avances se están produciendo rápidamente, cosas que parecían imposibles hace apenas unos meses ahora son alcanzables.

Sin embargo, hay un elefante en la habitación que finge ser un ser humano con pensamientos, emociones y cuerdas vocales. Este tipo de herramienta de lenguaje natural inquietantemente impresionante, al ser tan fácil y accesible, es una herramienta peligrosa en las manos equivocadas. Qué fácil sería engañar a alguien si pudiera expresar cualquier texto, cualquier documento, con un tono humano elegante y conversacional. Ahora eso es aterrador.

Sin embargo, no he descubierto ningún otro ejemplo que haya provocado una reacción en mí como NotebookLM, demostrando las capacidades de la IA de una manera convincente.

Entonces, ¿qué es NotebookLM?

La herramienta conocida como NotebookLM se puede encontrar y utilizar en NotebookLM.google. A pesar de su nombre poco interesante, su funcionalidad es bastante emocionante.

NotebookLM se construye utilizando el modelo Gemini AI de Google, que también se está implementando en nuevos dispositivos Android y se utiliza para crear resúmenes de AI dentro de las búsquedas web que podrían alterar el modelo de negocio de Internet tal como lo conocemos. Sin embargo, a diferencia de su poderosa contraparte, NotebookLM sirve como compañero de estudio: una IA diseñada para condensar documentos, transcribir audio y ahorrarle un tiempo valioso al tomar notas por usted. Si hubiera encontrado esta herramienta durante mis días escolares, habría revolucionado mi proceso de revisión, pero desafortunadamente nací veinte años tarde, apenas por debajo de la meta.

El producto estuvo disponible en los EE. UU. hasta 2024, pero con las mejoras realizadas durante el verano y un lanzamiento mundial, ahora lo utilizan más personas que antes.

Google generó un 'podcast' a partir de uno de mis artículos y es la IA que imita a humanos más convincente y espeluznante que he escuchado hasta ahora.

La función de podcast «Audio Overview» también se introdujo recientemente en el software en septiembre.

Como entusiasta, debo aclarar que a estas alturas el software se comunica únicamente en inglés. Un descargo de responsabilidad en la publicación de su blog sobre su lanzamiento menciona que podría «ocasionalmente mejorar la precisión». Dado mi conocimiento de los sistemas de IA, incluso los de primer nivel, pueden fabricar información sin querer de vez en cuando. Comúnmente se lo conoce como «alucinación», pero es esencialmente una forma sofisticada de decir que la IA no siempre acierta cuando las cosas no salen según lo planeado, por así decirlo.

Una posible nueva función en Audio Overview parece ser la capacidad de intervenir durante el discurso, posiblemente alterando el curso de la discusión o realizando ajustes inmediatos. Google insinúa esta posibilidad en su publicación de blog, aunque aclara que «aún no puedes hacerlo», lo que podría sugerir que esta característica alguna vez fue considerada.

Considere esto por un momento: tener el poder de saltar a una discusión de podcast en cualquier momento y sugerir temas: es como crear una transmisión en vivo inusual y personalizada con matices sutiles de asertividad indirecta…

No se trata sólo de que Google esté experimentando con chatbots impulsados ​​por inteligencia artificial que imitan el habla humana; OpenAI también participa y ofrece un asistente de voz que recuerda al que aparece en la película Her. Esta no es una interacción única entre humanos y robots, pero ciertamente agrega un giro inusual a nuestras interacciones.

Sin duda, todo este asunto de la IA conversacional se volverá muy extraño, muy rápido.

2024-10-02 19:18