paint-brush
Una nueva técnica de estimulación podría ayudar a la IA a pensar como los humanospor@mahakshah
658 lecturas
658 lecturas

Una nueva técnica de estimulación podría ayudar a la IA a pensar como los humanos

por Mahak Shah4m2025/01/15
Read on Terminal Reader

Demasiado Largo; Para Leer

La estimulación en cadena de pensamiento está revolucionando la forma en que interactuamos con la IA. Descompone los problemas complejos en fragmentos digeribles, lo que permite que el modelo aborde cada componente de manera sistemática. Este enfoque estructurado garantiza la precisión y demuestra el proceso de razonamiento, algo particularmente valioso cuando se trata de operaciones matemáticas complejas.
featured image - Una nueva técnica de estimulación podría ayudar a la IA a pensar como los humanos
Mahak Shah HackerNoon profile picture


¿Alguna vez te preguntaste cómo hacer que la IA piense más como un ser humano? Si bien los modelos de lenguaje grandes (LLM) son excelentes para predecir la siguiente palabra en una secuencia, a menudo tienen problemas cuando se enfrentan a problemas que requieren un pensamiento metódico. Aquí es donde entra en juego la técnica de incitación en cadena de pensamiento, una técnica innovadora que está revolucionando la forma en que interactuamos con la IA.

Descomponiendo la incitación a la cadena de pensamiento


Imagine que le enseña a un niño a resolver un rompecabezas complejo. En lugar de mostrarle la imagen final, lo guía a través de cada paso. Eso es básicamente lo que hace la incitación en cadena de pensamiento (CoT) para los estudiantes de maestría en derecho. Al brindar ejemplos que muestran el razonamiento paso a paso, ayudamos a estos modelos a llegar a soluciones precisas a través de una progresión lógica.


Fuente de la imagen: Wei et al. (2022)


La fórmula mágica: por qué funciona


Los métodos tradicionales de incitación suelen dar resultados aleatorios. Sin embargo, la incitación de CoT divide los problemas complejos en fragmentos digeribles, lo que permite que el modelo aborde cada componente de manera sistemática. Este enfoque ha demostrado ser tan exitoso que los modelos de vanguardia como las últimas ofertas de OpenAI lo han incorporado a su funcionalidad principal.


Aplicación en el mundo real: resolución de problemas matemáticos


Veamos un ejemplo práctico. Imagina que estás ayudando a una IA a resolver esta ecuación.

5x - 4 = 16


Así es como la estimulación CoT guía el modelo:

  1. Primer paso: Sumar 4 a ambos lados
    • 5x - 4 + 4 = 16 + 4
    • 5x = 20
  2. Segundo paso: Dividir ambos lados por 5
    • 5x/5 = 20/5

    • x = 4


Este enfoque estructurado garantiza la precisión y demuestra el proceso de razonamiento, algo particularmente valioso cuando se trata de operaciones matemáticas complejas.


Cadena de pensamientos versus estímulos de pocos intentos: comprender la distinción


Ambas técnicas pueden parecer similares a primera vista, pero tienen un propósito diferente:


  • Indicaciones de pocas preguntas : proporciona ejemplos que muestran la entrada y la salida, como una clave de respuestas de opción múltiple.

  • Incitación a la cadena de pensamiento : demuestra el proceso de razonamiento completo, como mostrar todo el trabajo en un problema de matemáticas.


El método Few-Shot Prompting se vería así:

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


La estimulación mediante cadena de pensamiento se vería así:

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

Cadena de pensamiento de disparo cero


Utilizando la sencilla pero poderosa frase de " Pensemos paso a paso", la incitación de Zero-shot CoT se utiliza en circunstancias en las que no se tienen ejemplos a mano. Por ejemplo, "Pensemos paso a paso: expliquemos la física cuántica".

¿Cuándo se debe utilizar la estimulación CoT?


La estimulación CoT brilla cuando se trata de:

  • Aritmética complicada
  • Razonamiento lógico de múltiples pasos
  • Sentido común
  • Manipulación simbólica


Los puntos de referencia más recientes de Claude demostraron que los métodos que utilizan indicaciones CoT de 3 o 5 disparos funcionan bien para tareas que requieren mucho razonamiento: GPQA y MMLU.

El futuro: cadena de pensamiento multimodal


El avance más reciente en el razonamiento de la IA integra componentes visuales y textuales en los procesos cognitivos. Imagine una IA que diagnostica una reparación de bicicleta, comprende el manual y ofrece orientación visual y auditiva a lo largo de cada etapa del proceso. El enfoque multimodal representa el próximo avance en el soporte de la IA.


Fuente de la imagen: Zhang et al. (2023)

Maximizar la eficacia de sus indicaciones de CoT


Si bien la incitación por cadena de pensamiento es poderosa, funciona con ciertas limitaciones. No se garantiza que la ruta de razonamiento que sigue el modelo esté libre de errores y los resultados varían marginalmente.


A continuación te dejamos algunos consejos para obtener mejores resultados:

  • Pruebe exhaustivamente con diferentes enfoques.
  • Considere combinar la estimulación CoT con otras estrategias de estimulación.
  • Utilice modelos más grandes con más de 100 mil millones de parámetros, si es posible.

Conclusión


Teniendo en cuenta el progreso de la IA, es evidente que la incitación en cadena de pensamiento (CoT) es una técnica eficaz para aprovechar capacidades de razonamiento más avanzadas. Es importante señalar que el uso de la incitación en cadena de pensamiento para el desarrollo de aplicaciones o para lograr resultados más óptimos en las interacciones con IA aumenta enormemente las posibilidades de lograr el éxito.


La intención no es sólo lograr la respuesta precisa, sino también comprender el procedimiento llevado a cabo para lograrlo, y esa es la belleza de la estimulación en cadena de pensamientos.

Notas al pie

  1. Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q. y Zhou, D. (2022). La incitación a la cadena de pensamiento provoca razonamiento en modelos lingüísticos amplios.
  2. Kojima, T., Gu, SS, Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Los modelos de lenguaje grandes son razonadores de disparo cero.
  3. Zhang, Zhuosheng, et al. "Razonamiento multimodal en cadena de pensamiento en modelos de lenguaje". Preimpresión arXiv arXiv:2302.00923 (2023).