La densidad de la retroalimentación como modulador de la variabilidad y estereotipia conductual

TitleLa densidad de la retroalimentación como modulador de la variabilidad y estereotipia conductual
Publication TypeAcademic Article
Short TitleLa densidad de la retroalimentación como modulador de la variabilidad y estereotipia conductual
Alternate TitleLa densidad de la retroalimentación como modulador de la variabilidad y estereotipia conductual en tareas de discriminación condicional en niños y jóvenes
AuthorsPérez-Ortíz, S, Martínez-Sánchez, H, Zepeda-Riveros, I
JournalConductual
Year2016
Volume4
Issue3
Pagination175-195
Date01/11/2016
Reception date

31/10/2016

Acceptance date

01/11/2016

ISSN2340-0242
LanguageEspañol
Author Address

Correspondencia: Héctor Martínez Sánchez. Instituto de Neurociencias. Universidad de Guadalajara. Francisco de Quevedo #180, Arcos Vallarta, 44130, Guadalajara, Jal. http://ineuro.cucba.udg.mx/ Tel.: (52) (33) 3818-0740 Ext. 33367

PublisherConductual
Keywordsconditional discrimination, discriminación condicional, estereotipia, feedback, humanos, humans, presión de teclas, pressure keys, retroalimentación, stereotyping, variabilidad, variability
Resumen

El propósito de este estudio fue evaluar si la retroalimentación intermitente  proporcionada cada tercer ensayo (parcial), o al final de la sesión (demorada) tiene una función inhibidora en comparación con la retroalimentación continua (i.e., cada ensayo) sobre la ejecución de niños y jóvenes en una tarea de discriminación condicional con requerimientos de variabilidad y estereotipia bajo distintas secuencias de entrenamiento. Se evaluaron doce grupos de niños y doce de jóvenes (n=5) combinando dos secuencias de entrenamiento alternando repetición y variabilidad y dos secuencias manteniendo la misma tarea de repetición o variabilidad con los tres valores de retroalimentación. En la tarea de variabilidad una elección diferente a la del ensayo previo era una respuesta correcta. En la tarea de repetir una elección era correcta si era igual a la del ensayo previo. Se encontró que la retroalimentación demorada no favoreció la adquisición ni el mantenimiento de la conducta variable pero sí fue efectiva en el mantenimiento de las respuestas de repetición. La retroalimentación continua mostró los mejores puntajes en la mayoría de las secuencias. La retroalimentación parcial no afectó la ejecución de la respuesta repetida o variable cuando se mantuvo la misma tarea pero si disminuyeron los aciertos cuando las tareas fueron alternadas. Los grupos con retroalimentación demorada fueron afectados negativamente por el entrenamiento inicial tanto en estereotipia como en variabilidad.  En ambos grupos de edad se observaron diferencias en el número de errores y las latencias, independientemente de la cantidad de retroalimentación recibida. Los resultados son discutidos con relación al papel de la retroalimentación como una variable que influye en las condiciones que inducen, controlan y mantienen las conductas de variabilidad y estereotipia en humanos.

Abstract

The purpose of this study was to evaluate whether intermittent feedback provided every third trial (partial), or at the end of the session (delayed) has an inhibitory function compared with continuous feedback (i.e, each trial) on the performance of children and young people in a conditional discrimination task (matching-to-sample) and stereotyping and variability requirements under different training sequences. Twelve children and twelve young people groups (n=5) combining two training sequences alternating repetition and variability and two sequences maintaining the same task (repeat or variable) under three feedback values ​​were evaluated. A different choice than one at a previous trial was a correct response for the variability task. In the stereotyping task a correct response was obtained if subject repeat the same choice as the previous trial. It was found that the delayed feedback does not favors acquisition and maintenance of the variable behavior but was effective in maintaining repetition responses. Continuous feedback showed the best scores in most of the sequences. The partial feedback did not affect the performance of repeated or variable response when task remained the same, but correct responses decreased when tasks were alternated. With delayed feedback groups were negatively affected by the initial training in stereotyping and variability. In both age groups differences in the number of errors and latencies, regardless of the amount of feedback received were recorded. The results are discussed in relation to the role of feedback as a variable that influences the conditions that induce, control and maintain behaviors variability and stereotyping in humans.

Full Text

Existe evidencia demostrando que la variabilidad y la estereotipia son dimensiones operantes de la conducta, las cuales han sido estudiadas bajo distintos métodos y tareas, con humanos y otras especies animales (Neuringer, 1992; 1993; 2009). La variabilidad operante es aquella que puede ser controlada directamente por las consecuencias contingentes a su producción (Lee, Sturmey & Fields, 2007; Neuringer 2009). Algunos de estos estudios han demostrado que efectivamente las consecuencias pueden ejercer un control riguroso sobre la conducta variable (para una revisión, ver Neuringer 2002). Por ejemplo, Page y Neuringer (1985) utilizando una cámara operante reforzaron exitosamente a palomas por variar sus picotazos entre secuencias de dos teclas y compararon dos condiciones de variabilidad. En una condición el reforzamiento era proporcionado siempre que los sujetos alcanzaran un criterio de variabilidad (VAR). En otra condición se replicó la distribución de los reforzadores obtenidos en la condición VAR independientemente de su respuesta (YOKE), de manera que los sujetos podían variar sus respuestas, pero no era un requisito para obtener el reforzamiento. Como resultado, en la condición YOKE los sujetos emitieron niveles de variabilidad menores que en la condición VAR. Esta fue la primera demostración experimental de que la variabilidad conductual podía ser reforzada directamente (Neuringer, 2009).  Este estudio también aportó evidencia de que la variabilidad es una dimensión operante del comportamiento similar a otras dimensiones operantes, como la topografía, localización, velocidad y fuerza (Lee, et al., 2007). Doughty & Galizio (2015) recientemente también han demostrado que la variabilidad puede ser reforzada directamente con palomas recibiendo comida por secuencias de cuatro respuestas (picotear una tecla).

De acuerdo con Stokes (2012) la estereotipia y la variabilidad conductual podrían ser consideradas formando parte de un continuo en el que un extremo lo constituye la total repetición y en el otro una alta impredictibilidad del comportamiento. Generalmente en procedimientos operantes los participantes se mantienen respondiendo a los requerimientos de la tarea debido al reforzamiento. Stokes (2012) ha señalado que la recompensa o reforzador suponen una doble propiedad: a) informativa acerca de qué clase de respuesta es seguida por la recompensa; y, b) como incentivo, es decir acerca de cuál es la recompensa. En los estudios con humanos el reforzador o recompensa frecuentemente es entregado en la forma de retroalimentación (e.g., información sobre si la respuesta del sujeto ha sido correcta o no). Neuringer (1986) documentó la importancia de la retroalimentación utilizando una tarea en que el criterio de variabilidad no era sencillo. Los participantes debían elegir “azarosamente” entre dos opciones de respuesta semejando un generador aleatorio de respuestas. Cuando sólo recibieron una instrucción, los participantes fallaron. Sin embargo, obtuvieron resultados positivos cuando se les proporcionó información continua sobre su desempeño en comparación con varios descriptores estadísticos. Para el final del entrenamiento con esta información, los participantes lograron emitir respuestas que no se distinguían de las producidas por un generador aleatorio.

De acuerdo con Zepeda y Martínez (2013) los procedimientos de discriminación condicional han resultado de utilidad para evaluar los cambios en la respuesta respecto de las contingencias programadas y como procede la adquisición y mantenimiento de una respuesta estereotipada o variable en una situación particular. En la literatura experimental, se denomina muestra al estímulo discriminativo condicional que está presente en todos los ensayos y se llaman comparaciones a los estímulos de elección en las tareas de igualación a la muestra (Cumming & Berryman 1961). En estos procedimientos de discriminación condicional, las relaciones entre los estímulos de muestra y comparación pueden cambiar completamente de un ensayo a otro pero la relación criterio se mantiene constante (e.g., igualación simbólica). Después de la respuesta del sujeto si es correcta se otorga un reforzador, si es incorrecta se omite la presencia del reforzador. La presentación de la retroalimentación dependiente de la ejecución, es importante para que los sujetos desempeñen con éxito una tarea de discriminación condicional (Martínez, 2001). Por lo tanto, la retroalimentación también  juega un papel funcional relevante para la adquisición y mantenimiento de un comportamiento eficaz, ya que proporciona al sujeto una referencia informativa sobre los resultados de su ejecución y favorece la identificación de las características invariantes como ocurre en las tareas de igualación a la muestra (Martínez, 2001). Sin esta retroalimentación se vuelve muy difícil que el sujeto pueda responder correctamente a la contingencia establecida como criterio.

En un estudio de Martínez (2011) la presentación de retroalimentación en cada ensayo (continua) o al final de una sesión (demorada) tuvo efectos diferenciales en el desempeño de niños y adultos expuestos a tareas de discriminación condicional. En los grupos de niños con retroalimentación continua se observó una alta variabilidad en la ejecución, mientras que en los grupos con retroalimentación demorada esta variabilidad fue menor. En contraste, la ejecución fue más variable en los grupos de adultos con retroalimentación demorada. Los grupos de adultos con retroalimentación continua mostraron respuestas estereotipadas, un patrón de respuesta que frecuentemente se obtiene bajo un programa de reforzamiento continuo.

Existe evidencia soportando la noción de que la historia de entrenamiento es relevante en la adquisición de una respuesta. Maes (2003) y Souza, Abreu-Rodrigues y Baumann (2010) obtuvieron resultados consistentes en cuanto a la importancia que tiene el orden de las fases de entrenamiento para el establecimiento de variabilidad inducida y operante. Sus hallazgos mostraron que una fase de extinción previa a un entrenamiento operante tiene un efecto perturbador en la adquisición de la respuesta en mayor medida que si es presentada después del entrenamiento operante. En cambio el reforzamiento no contingente no tuvo efectos significativos sobre la adquisición de la respuesta pero afectó en mayor medida si antecedía al entrenamiento operante. Estos datos están en la misma línea con los reportados en otros estudios demostrando que la variabilidad operante no es controlada por las mismas variables independientes que la repetición operante (e.g., Wagner & Neuringer, 2006). En los resultados del estudio realizado por Zepeda y Martínez (2013) en el que se alternaron secuencias de entrenamiento de variabilidad o estereotipia, también se encontró que la repetición fue más afectada por un antecedente de entrenamiento en variabilidad que la estereotipia precedida por variabilidad.

Los efectos de la cantidad de retroalimentación sobre la ejecución se ha estudiado en tareas de discriminación condicional pero sin requerimientos específicos de variación o repetición (e.g., Martínez 2011; Ribes & Martínez, 1990). Estudios con uno o ambos requerimientos de variabilidad o estereotipia operantes tampoco han evaluado de manera sistemática las variaciones en la cantidad de retroalimentación proporcionada. Aún no se han estudiado los efectos de proporcionar distintas cantidades de retroalimentación en la ejecución de humanos expuestos a tareas con criterios de variabilidad-estereotipia. Zepeda y Martínez (2013) han estudiado los efectos de las secuencias de entrenamiento sobre el aprendizaje de variabilidad o estereotipia en grupos de niños y jóvenes. Los participantes recibieron una de cuatro secuencias distintas de entrenamiento. Dos secuencias fueron constantes, es decir había dos fases de entrenamiento consecutivas de repetición (REP-REP), o bien de variación (VAR-VAR). Otras dos secuencias de entrenamiento eran alternadas incluyendo una fase de variación y otra repetición (REP-VAR o VAR-REP). La retroalimentación se presentó en cada ensayo. Los resultados revelaron efectos debidos al orden de presentación de las distintas secuencias, se obtuvieron ejecuciones mostrando que la repetición operante fue perturbada en mayor medida por la fase previa con requerimiento de variabilidad, mientras que la respuesta de variabilidad no fue óptima después de una fase previa de repetición. Otro resultado fue que después del entrenamiento en una secuencia constante (REP-REP o VAR-VAR), en una prueba posterior con estímulos nuevos y sin retroalimentación (transferencia), las respuestas de los participantes se emitieron de acuerdo con el entrenamiento correspondiente (i.e., variación o repetición). Un resultado más interesante, fue que después de las secuencias de entrenamiento alternadas (i.e., variación y después repetición o viceversa), con excepción del grupo de jóvenes que recibieron la secuencia REP-VAR, el resto de  los participantes emitieron respuestas repetitivas o variadas dependiendo de la última fase de entrenamiento que recibieron, un efecto que los autores denominaron de recencia. Zepeda y Martínez (2013) explicaron que este efecto pudo deberse  a las diferencias en el número de respuestas reforzadas durante el entrenamiento ya que en general los sujetos recibieron mayor reforzamiento por repetir. Un dato adicional fue que las latencias fueron más largas para las conductas de variabilidad en comparación con las de estereotipia. Lo que se podría interpretar asumiendo que existen diferencias en el grado de dificultad para responder con variabilidad o estereotipia.  Souza, Pontes y Abreu-Rodrigues (2012) estudiando los efectos de las instrucciones sobre las contingencias de variabilidad en humanos reportaron que los tiempos de reacción fueron más largos por responder de forma sistemática que en una forma semejante al azar.

En este estudio nos propusimos replicar las condiciones de entrenamiento de las secuencias de variabilidad y repetición del estudio de Zepeda y Martínez (2013) pero además de la presentación en cada ensayo de la retroalimentación (continua), se proporcionó a otros grupos de niños y jóvenes retroalimentación no acumulada cada tercer ensayo (parcial) o retroalimentación al final de la sesión con el total de aciertos (demorada) para evaluar los efectos de esta variable sobre la ejecución de niños y jóvenes adultos en tareas de discriminación condicional (igualación a la muestra).

Método

Participantes

Participaron voluntariamente 60 escolares de primaria de ambos sexos entre 10-12 años de edad y 60 jóvenes universitarios de ambos sexos entre 22 y 24 años, sin experiencia previa en la tarea experimental. Los participantes fueron seleccionados de escuelas primarias y universidades de la zona metropolitana de Guadalajara. Los padres de los niños firmaron una carta de autorización para la participación de sus hijos. En el caso de los jóvenes, además de firmar la carta de consentimiento debían cursar entre el quinto y el octavo semestre de licenciatura. El estudio fue aprobado por el Comité de Ética del Instituto de Neurociencias con el número de registro ET122011-117.

Aparatos y materiales

Se utilizaron dos laptop de marca comercial con pantalla de 14” para la presentación de la tarea y registro automático de las respuestas. La programación de los estímulos, las instrucciones, la aplicación de la tarea experimental y la recolección de los datos se llevó a cabo con el software E- Prime versión 1.3. El experimento se realizó en un cubículo en el  que los ruidos ambientales fueron minimizados para evitar interrupciones y distracciones.

Diseño Experimental

El diseño experimental incluyó tres fases. La primera consistió en exponer a cada uno de los participantes a una tarea de repetición (REP) o bien de variación (VAR) durante cinco sesiones consecutivas de 36 ensayos cada una. En la segunda fase, se expuso a una tarea de repetición o variación también durante cinco sesiones de 36 ensayos cada una en la que el requerimiento de variar o repetir fue igual o diferente al de la primera fase. De esta manera se formaron 4 secuencias distintas de entrenamiento: dos constantes, REP-REP, VAR-VAR y dos alternadas REP-VAR, VAR-REP. Durante las dos fases de entrenamiento, aunque la tarea cambiara, los estímulos fueron los mismos y dependiendo del grupo se proporcionó retroalimentación en cada uno de los ensayos (continua), cada tercer ensayo  (parcial) o al final de la sesión (demorada). La tercera fase correspondió a una prueba de transferencia en la que los estímulos fueron diferentes a los del entrenamiento y no se proporcionó retroalimentación a los participantes respecto de su ejecución. Los grupos experimentales (n=5) se formaron combinando una secuencia de entrenamiento en estereotipia (e.g.,  E-E) con una modalidad de retroalimentación (e.g., continua) de manera que se formaron 12 grupos diferentes de cada grupo de edad. El procedimiento se aplicó por igual a niños y jóvenes y se asignaron al azar a cada uno de los grupos.

Tarea Experimental

 Al igual que en el estudio de Zepeda y Martínez (2013) la tarea experimental consistió en una tarea de discriminación condicional de igualación de la muestra de primer orden, en la que se mostraron cuatro estímulos (figuras geométricas) colocados de la siguiente manera: un estímulo se colocaba en la parte central superior de la pantalla y otros tres estímulos se colocaban alineados debajo del estímulo superior. El estímulo superior funcionaba como estímulo muestra (EM) y los otros tres como estímulos de comparación (ECO). Los ECO mostraban tres relaciones diferentes con respecto del EM: identidad (igual forma y color), semejanza (igual forma y diferente color) y diferencia (diferente forma y color). Las figuras que se usaron durante el entrenamiento fueron círculos, triángulos, cuadrados y rectángulos. Para las pruebas de transferencia los estímulos empleados fueron rombos, pentágonos, cruces y pares de  líneas paralelas. Los colores de las figuras fueron blanco, verde, rojo y amarillo, durante el entrenamiento y prueba de transferencia. Los participantes debían responder seleccionando uno de los estímulos pulsando una de las teclas numéricas 1, 2, ó 3. La respuesta correcta dependía del requisito de repetición o variación. Para la condición de repetición se requería a los participantes a responder seleccionando siempre la misma relación de las tres disponibles. En la condición de variación la relación correcta era aquella diferente a la previamente elegida, excepto obviamente para el primer ensayo. Si en el primer ensayo se elegía el estímulo idéntico a la muestra, la siguiente relación elegida debía ser de diferencia o semejanza para ser correcta.

Procedimiento

Una vez que los participantes estaban sentados frente a la computadora, en la pantalla aparecía un letrero de bienvenida y agradecimiento por participar en el estudio. El texto del mensaje fue el siguiente en los grupos con retroalimentación continua:

Te damos la bienvenida a este estudio sobre aprendizaje. Te agradecemos tu participación y esperamos que pases un buen rato. En la pantalla aparecerán cuatro figuras, una arriba y tres abajo. De las figuras de abajo elige aquella que te permita obtener mayor número de respuestas correctas.

Para llevar a cabo tu elección deberás oprimir las teclas 1, 2 ó 3 que corresponden de la siguiente manera: la tecla 1 para la figura de la izquierda; la tecla 2 para la figura del centro; la tecla 3 para la figura de la derecha.

Si tienes alguna duda consulta al asistente, ya que una vez iniciada la sesión no será posible hacerlo. Oprime la barra espaciadora para continuar.

Se pedía una breve explicación de lo que el participante tenía que hacer. Si su respuesta era satisfactoria se continuaba con el procedimiento, en caso contrario se le pedía que volviera a leer las instrucciones hasta que emitiera la respuesta apropiada. En el caso de las otras modalidades de retroalimentación, se especificaban sus características en las instrucciones de la siguiente manera:

Retroalimentación parcial

Sólo en algunas ocasiones se te informará si tu elección ha sido correcta o no. Si no recibes información sobre tu respuesta, no quiere decir que sea incorrecta. Si tienes alguna duda consulta al asistente, ya que una vez comenzada la sesión, no será posible hacerlo.

 

Retroalimentación Demorada

Al final de la sesión, aparecerá en la pantalla un letrero con el total de respuestas correctas e incorrectas que obtengas a lo largo de la sesión. Si tienes alguna duda consulta al asistente, ya que una vez comenzada la sesión, no será posible hacerlo.

Al pulsar la barra espaciadora aparecían en la pantalla los estímulos del primer ensayo. Todos los estímulos del arreglo de igualación de la muestra se presentaban en la pantalla simultáneamente. Para los grupos con retroalimentación continua, si la respuesta era correcta, los estímulos desaparecerían y aparecía en la pantalla un letrero con las palabras “¡RESPUESTA CORRECTA!” en color blanco durante 3 segundos; si la respuesta era incorrecta aparecía un letrero con las palabras “¡RESPUESTA INCORRECTA!” en color rojo durante 1.5 s. Una vez presentada la retroalimentación daba inicio el siguiente ensayo. A los grupos con retroalimentación parcial, se les presentaba la pantalla de respuesta correcta o incorrecta cada tercer ensayo (no acumulativo). En el caso de los grupos con retroalimentación demorada, al final de la sesión se les presentaba una pantalla con el número total de respuestas correctas e incorrectas. Una sesión experimental de entrenamiento estaba conformada por 36 ensayos. No se estableció tiempo límite para la realización de la tarea, por lo que la duración de la sesión dependía del tiempo que tardara cada uno de los participantes en responder a los 36 ensayos.

Se programaron cinco sesiones de entrenamiento para la condición A y cinco sesiones de entrenamiento para la condición B. Una vez terminada la primera sesión y siendo advertido por el participante que había completado los primeros 36 ensayos, el experimentador procedía a entrar en el cubículo y programar la siguiente sesión en la computadora. Este procedimiento se realizaba cada vez que se finalizaba una sesión experimental.

Para la prueba de transferencia se programó una sola sesión (36 ensayos) con las mismas condiciones que en el entrenamiento, sólo que los estímulos eran diferentes en forma y no se proporcionaba ninguna retroalimentación. En las instrucciones se les informó a los participantes de esta situación. Las instrucciones para la prueba de transferencia se presentaban con un fondo de pantalla color azul claro y mostraban la siguiente leyenda:

Gracias por seguir participando.

En la pantalla aparecerán cuatro figuras, una arriba y tres abajo.

Elige una de las figuras de abajo que creas que tiene alguna relación con la de arriba. Para llevar a cabo tu elección deberás oprimir las teclas 1, 2 ó 3 que corresponden de la siguiente manera: la tecla 1 para la figura de la izquierda; la tecla 2 para la figura del centro; la tecla 3 para la figura de la derecha. En esta sesión no se te informará si tu respuesta es correcta o incorrecta.

Si tienes alguna duda consulta al asistente, ya que una vez iniciada la sesión no será posible hacerlo. Oprime la barra espaciadora para continuar.

Una vez terminada la prueba de transferencia en la pantalla aparecía el texto:

“GRACIAS POR PARTICIPAR”.

El experimento terminaba cuando el participante había completado las sesiones de entrenamiento y la prueba de transferencia, agradeciéndole su participación en el estudio.

Resultados

La columna izquierda de la Figura 1 muestra las gráficas con el promedio de aciertos de los jóvenes bajo retroalimentación continua (superior), retroalimentación parcial (central), y retroalimentación demorada (inferior).  Cada gráfica contiene los cuatro grupos de secuencias (E-E, V-V, E-V y V-E). La columna de la derecha representa los datos de los niños con las mismas secuencias.

Los jóvenes mostraron diferencias cuando iniciaron con la tarea de estereotipia en los tres tipos de retroalimentación. En la retroalimentación continua (RC) para las secuencias E-E y E-V su ejecución inicial fue óptima (35 aciertos) y se mantuvo en toda la fase. En la segunda fase el grupo E-E mantuvo esa ejecución; mientras que el grupo E-V en la tarea de variabilidad inició con 25 aciertos y terminó con 31 aciertos con RC. Los grupos con las secuencias que iniciaron con variabilidad (V-V y V-E) mostraron ejecuciones más bajas en la primera fase en comparación con los que iniciaron con estereotipia, ambos grupos iniciaron con 26 aciertos y terminaron la fase con 31 aciertos manteniendo este puntaje durante la segunda fase.

Bajo la retroalimentación parcial (RP) todos los grupos de secuencias mostraron menor frecuencia de aciertos que los grupos de RC.  El grupo E-E  fue el más alto con alrededor de 31 aciertos manteniendo nivel en el resto de la fase y durante la segunda fase. El grupo E-V mostró los puntajes más bajos con 15 aciertos al inicio de la primera fase alcanzando un máximo de 27 aciertos en la última sesión siendo muy similar el patrón de su ejecución durante la segunda fase (19 y 29 aciertos respectivamente). Los grupos con las secuencias V-V y V-E mostraron ejecuciones intermedias en la respectiva primera fase pero en la segunda fase ambos grupos tuvieron una ejecución óptima en las dos últimas sesiones.

Con la retroalimentación demorada (RD) en general los sujetos mostraron los puntajes más bajos si se comparan con los de grupos de RC y RP. Bajo esta condición se obtuvieron los datos más claramente diferenciados entre los grupos que iniciaron con la fase de estereotipia y los que iniciaron con variabilidad. Los grupos E-E y E-V tuvieron una adquisición lenta (22 aciertos inicialmente) aunque terminaron con un desempeño máximo. El grupo E-E mantuvo la máxima ejecución durante toda la segunda fase, pero el grupo E-V mostró un decremento dramático sin rebasar los 12 aciertos en la segunda fase.  Los grupos que iniciaron con variabilidad lo hicieron desplegando una ejecución aún más baja (12 aciertos) y no alcanzaron más de 24 aciertos. Este patrón se mantuvo durante la segunda fase. Los datos de los grupos equivalentes con los niños que aparecen en la columna de la derecha de la Figura 1 prácticamente replicaron las ejecuciones de los jóvenes. Sólo cabría destacar que los grupos  E-V y  V-E obtuvieron puntajes más bajos en la segunda fase con RC y RP en comparación con los grupos de jóvenes en las respectivas secuencias.

La Figura 2 representa el promedio de aciertos para los grupos de jóvenes (columna izquierda) y de los niños (columna derecha) bajo las condiciones de estereotipia y variabilidad y de retroalimentación sin considerar las secuencias que siguieron los grupos. Así E1 y E2 muestran los aciertos cuando estereotipia correspondió a la primera o segunda fase de la secuencia en el grupo y lo mismo ocurre con V1 y V2 para la condición de variabilidad.  Con excepción del grupo de jóvenes bajo RP las ejecuciones en estereotipia siempre fueron más altas cuando fue la primera condición y exceptuando la segunda condición de estereotipia en los niños bajo RP,  también fueron más altas en comparación con las de variabilidad. Confirmamos que bajo la retroalimentación demorada las ejecuciones en variabilidad fueron notoriamente inferiores sin importar si fueron en la primera o segunda fase.

Figura 1. Promedios (± SEM) de aciertos de los grupos de jóvenes (columna izquierda) y niños (columna derecha) con las respectivas secuencias de entrenamiento (E-E, V-V, E-V, V-E)

Figura 1. Promedios (± SEM) de aciertos de los grupos de jóvenes (columna izquierda) y niños (columna derecha) con las respectivas secuencias de entrenamiento (E-E, V-V, E-V, V-E). Grupos con retroalimentación continua (fila superior), retroalimentación parcial (fila central), retroalimentación demorada (fila inferior).  

 

Figura 2. Promedios (± SEM) de aciertos totales de los grupos de jóvenes (columna izquierda) y niños (columna derecha) independientemente de  las secuencias de entrenamiento.

Figura 2. Promedios (± SEM) de aciertos totales de los grupos de jóvenes (columna izquierda) y niños (columna derecha) independientemente de  las secuencias de entrenamiento. Grupos con retroalimentación continua (fila superior), retroalimentación parcial (fila central), retroalimentación demorada (fila inferior).  

 

La Figura 3 muestra los datos de las latencias en milisegundos para todos los grupos de jóvenes (columna izquierda) y niños (columna derecha). En general todos los grupos mostraron un patrón típico de duración de latencias, iniciando con latencias altas que gradualmente fueron disminuyendo a lo largo de la primera fase y manteniéndose durante la segunda fase. Con retroalimentación continua los niños en la primera fase de variabilidad (V-V y V-E) iniciaron con latencias más cortas que los jóvenes. Los grupos de jóvenes y niños con retroalimentación demorada iniciaron con latencias más cortas en la primera fase, mientras el resto de los grupos mostraron mayor variabilidad y de mayor duración en la primera sesión de la primera fase. Solamente los jóvenes del grupo V-V con retroalimentación demorada mantuvieron un patrón atípico ya que no redujeron sus latencias a lo largo de ambas fases.

Figura 3. Promedios (± SEM) de latencias de los grupos de jóvenes (columna izquierda) y niños (columna derecha) en todas las secuencias de entrenamiento (E-E, V-V, E-V, V-E)

Figura 3. Promedios (± SEM) de latencias de los grupos de jóvenes (columna izquierda) y niños (columna derecha) en todas las secuencias de entrenamiento (E-E, V-V, E-V, V-E). Grupos con retroalimentación continua (fila superior), retroalimentación parcial (fila central), retroalimentación demorada (fila inferior).

 

Los datos de la prueba de transferencia están graficados en la Figura 4, en la columna izquierda aparecen los grupos de jóvenes y en la columna derecha los de los grupos de niños. Las gráficas representan las elecciones de los sujetos de cada uno de los grupos con las respectivas secuencias y las tres condiciones de retroalimentación recibidas en las fases previas. Con esta prueba pretendimos identificar si los sujetos en ausencia de retroalimentación respondían de forma estereotipada o variada. El interés era evaluar si elegían una sola relación de forma mayoritaria o por el contrario distribuían sus elecciones entre las tres posibles relaciones disponibles (identidad, semejanza y diferencia). La relación de identidad fue elegida con mayor frecuencia tanto por los jóvenes (columna izquierda) como por los niños (columna derecha) cuando respondieron de forma estereotipada y distribuyeron sus elecciones entre las tres relaciones cuando respondieron a variabilidad.

Figura 4. Promedios  (± SEM) de las elecciones de relación (idéntico, semejante diferencia) durante la prueba de transferencia sin retroalimentación de los grupos de jóvenes (columna izquierda) y niños (columna derecha) en todas las secuencias de entrenamiento donde habían recibido retroalimentación (EE, VV, EV, VE).

Figura 4. Promedios  (± SEM) de las elecciones de relación (idéntico, semejante diferencia) durante la prueba de transferencia sin retroalimentación de los grupos de jóvenes (columna izquierda) y niños (columna derecha) en todas las secuencias de entrenamiento donde habían recibido retroalimentación (EE, VV, EV, VE).

 

Figura 5. Número de participantes que respondieron a estereotipia o variabilidad durante la prueba de transferencia sin retroalimentación y de acuerdo con el entrenamiento recibido (EE, VV, EV, VE).

Figura 5. Número de participantes que respondieron a estereotipia o variabilidad durante la prueba de transferencia sin retroalimentación y de acuerdo con el entrenamiento recibido (EE, VV, EV, VE).

 

Para evaluar si en la prueba de transferencia los participantes respondieron dependiendo de la condición de la última fase entrenada, en la Figura 5 se muestra el número de participantes de cada grupo de jóvenes (gráfica superior) y de niños (gráfica inferior) que respondieron a estereotipia o variabilidad.  Con excepción de los jóvenes de los grupos E-V con retroalimentación continua y demorada que respondieron a estereotipia, aún cuando variabilidad fue la segunda fase de entrenamiento, el resto de los participantes si respondieron totalmente o una mayoría de acuerdo con la segunda fase entrenada. Los datos de los niños fueron muy similares añadiendo al grupo V-E con retroalimentación demorada  que respondió a variabilidad demostrando consistencia entre ambos grupos etarios.

Discusión

El objetivo de este estudio fue evaluar los efectos de distintas modalidades de retroalimentación sobre la ejecución de niños y jóvenes en una tarea de discriminación condicional con requerimientos de variabilidad o estereotipia en distintas secuencias de entrenamiento. Se tomó como base un estudio previo que revisó los efectos de distintas secuencias de entrenamiento. En el presente estudio se replicaron las condiciones de ese estudio modificando la retroalimentación y presentándola en tres modalidades: continua, parcial y demorada. Los resultados más importantes con respecto a la modalidad de retroalimentación mostraron que ésta tiene distintos efectos en las ejecuciones bajo requerimientos de repetición o variación. La retroalimentación continua fue la modalidad más favorable para que los participantes tuvieran altos porcentajes de aciertos bajo cualquiera de los dos criterios de respuesta (variación, repetición) en distintas secuencias de entrenamiento. La retroalimentación parcial favoreció la adquisición y mantenimiento de la respuesta variable de manera similar a la retroalimentación continua. Esta modalidad de retroalimentación en ocasiones afectó negativamente la ejecución bajo el criterio de estereotipia. La retroalimentación demorada no permitió la adquisición y mantenimiento de una respuesta variable que cumpliera con el criterio operante de esta tarea pero fue efectiva en el mantenimiento de la respuesta repetitiva.

Con respecto a las secuencias de entrenamiento, se encontró que el  antecedente de variabilidad afectó la ejecución de los participantes en una fase posterior de estereotipia (secuencia V-R) en cualquier modalidad de retroalimentación, con un efecto mayor en los grupos con retroalimentación demorada. El antecedente de estereotipia afectó negativamente la ejecución bajo el criterio de variabilidad (secuencia ER-VR), sólo en los grupos con retroalimentación demorada. En los distintos grupos de edad se observaron algunas diferencias en las características de la respuesta (errores, latencias) independientemente de la modalidad de retroalimentación. Las latencias tendieron  a disminuir conforme avanzaron las sesiones de entrenamiento y aumentaron cuando cambiaron las condiciones de estereotipia y variabilidad; en algunas condiciones la latencia fue más alta en jóvenes que en niños. En la mayoría de los grupos la ejecución en la prueba de transferencia correspondió con la ejecución durante las condiciones de entrenamiento.

De acuerdo con lo reportado por Zepeda y Martínez (2013), los resultados obtenidos en los grupos con retroalimentación continua demostraron que la secuencia de entrenamiento tuvo efectos importantes sobre la ejecución de los participantes dependiendo si la secuencia era constante o alternada. En secuencias constantes, los grupos con secuencia de entrenamiento constante en variabilidad (V-V) mejoraron conforme transcurrió el entrenamiento, los grupos con la secuencia constante de estereotipia (E-E) tuvieron ejecuciones casi perfectas que permanecieron así durante todo el experimento. En secuencias alternadas el cambio de condición no siempre afectó la ejecución de manera notoria. Los grupos con criterio de variabilidad en la segunda fase (V-V, E-V) tuvieron una ejecución alta a pesar de la diferencia en la condición precedente, mientras que de los grupos con estereotipia en la segunda fase (E-E, V-E), sólo el grupo que tuvo la condición previa de variabilidad mostró una ejecución pobre con respecto al grupo que inició con estereotipia. La ejecución bajo el criterio de repetición fue afectada por la condición previa de variabilidad. En las primeras sesiones de la segunda fase en secuencias alternadas, el número de aciertos disminuyó recuperándose al final del entrenamiento en la mayoría de los casos.

Los datos del presente estudio muestran que la retroalimentación parcial no afectó la ejecución de los participantes bajo la condición de variabilidad, estos resultados son compatibles con aquellos reportados por varios estudios de discriminación condicional en los que, aun cuando no se imponga un criterio operante de variabilidad, bajo la retroalimentación parcial los participantes respondieron con un patrón variable, es decir, eligieron distintas opciones de respuesta (Martínez & Ribes 1996; Ribes & Martínez 1990). En estudios de variabilidad conductual humana y animal se ha encontrado que un programa de reforzamiento intermitente incrementa o tiene efectos inconsistentes sobre la variabilidad de la respuesta (Lee, et al., 2007; Stokes & Harrison, 2002). Estudios sobre variabilidad conductual humana más recientes, han reportado que el reforzamiento “independiente” no interfiere con la adquisición de la respuesta variable, tampoco la afecta cuando ha sido adquirida (e.g., Souza et al., 2010; Maes, 2003).

Estos resultados se han obtenido bajo el procedimiento de generación de secuencias usado comúnmente en la investigación sobre variabilidad conductual. La retroalimentación parcial es comparable con los programas de reforzamiento intermitente o reforzamiento “independiente” si se toma en cuenta la frecuencia con que se presenta el reforzador. Sin embargo, la comparación debe hacerse con precaución ya que el reforzamiento independiente no es idéntico a la retroalimentación parcial, en el primer caso el reforzador se otorga con una frecuencia determinada independientemente de si la respuesta ha sido correcta o no; los programas de reforzamiento intermitente refuerzan las respuestas correctas con un patrón de frecuencia establecido y la retroalimentación parcial se presenta después de un cierto número de ensayos y puede ser positiva o negativa dependiendo de la respuesta del sujeto.

En nuestro estudio, debido a que había tres opciones de respuesta, la retroalimentación parcial cada tres ensayos pareció favorecer la emergencia de patrones que implicaron una distribución de la elección en las tres teclas, ya sea en secuencias (3, 2, 1, 1, 2, 3) o en orden “aleatorio”. Responder de esta manera permitió a los participantes obtener la mayoría de los aciertos bajo el criterio de variabilidad ya que cambiaban la relación elegida entre ensayos. En las fases con criterio de repetición, las ejecuciones de algunos participantes se vieron afectadas de manera negativa mientras que otras no fueron perturbadas. Esta diferencia se puede atribuir a la combinación del efecto de la retroalimentación con las diferencias de la línea base. Al igual que en el estudio de Zepeda y Martínez (2013), muchos participantes iniciaron respondiendo en forma estereotipada. Cuando los participantes iniciaron respondiendo repetitivamente, sus respuestas cumplieron con el criterio operante de repetición y la retroalimentación parcial no tuvo un efecto negativo, el número de aciertos se mantuvo alto. En el caso de los participantes que no comenzaron respondiendo de manera estereotipada, o cuando los participantes tuvieron una fase previa de variabilidad, la retroalimentación parcial dificultó la adquisición del criterio de repetición, generando bajas ejecuciones.

Souza et al., (2010) encontraron que ciertos cambios en el programa de reforzamiento como el “reforzamiento independiente” o el “no reforzamiento”,  afectaron en mayor medida la repetición en comparación con la variabilidad. Los resultados son coherentes en un plano general ya que las condiciones de los estudios no son del todo equiparables. De acuerdo con Sidman (1960), las diferencias en la línea base explican los casos en que la ejecución bajo el criterio de estereotipia se vio afectada por la retroalimentación y por qué no afectó en otros casos. En nuestro estudio, la distribución de la retroalimentación cada tres ensayos, facilitó buenas ejecuciones bajo la condición de variabilidad mientras que hizo difícil la adquisición del criterio de repetición cuando los participantes no respondieron repetitivamente de manera “espontánea”. 

Estudios recientes (Maes, 2003; Neuringer et al., 2001; Souza et al, 2010) encontraron que el retiro del reforzador provoca cierta variabilidad en las respuestas de los participantes. En el estudio de Souza et al. (2010), se alternaron fases de “no reforzamiento” o “reforzamiento independiente” con fases que tenían un criterio operante de variabilidad o estereotipia. En el estudio de Neuringer, et al. (2001) se sometió a los sujetos a condiciones de extinción después de una fase operante con criterio de variación o repetición. En ambos estudios se observó una  variabilidad inducida por el retiro (total o parcial) del reforzador y los autores reportaron que la variabilidad operante no se afectó de manera importante por las condiciones de “no reforzamiento” que siguieron o antecedieron a las fases operantes.

La retroalimentación demorada usada en el presente estudio, semeja una condición de extinción ya que cada sesión de 36 ensayos transcurre sin retroalimentación alguna, hasta el final de la sesión se le informa al participante el total de aciertos y errores. Al revisar las elecciones de los participantes, se observaron distintas estrategias durante una sesión, cambios en la elección de los estímulos entre sesiones, elecciones de distintos estímulos en bloques durante una misma sesión, etc. Estas respuestas constituyen una forma de variabilidad asociada con la demora del reforzador (retroalimentación). Maes (2003) reportó el entrenamiento de la variabilidad sin retroalimentación, es decir, una condición de extinción seguida de una condición de retroalimentación contingente (Experimento 1) impide el aprendizaje de respuestas variadas, aunque posteriormente se proporcione retroalimentación la ejecución se mantiene baja en la condición de retroalimentación contingente y que la retroalimentación no contingente (Experimento 2) produce un efecto similar, esto es, una frecuencia baja de respuestas variadas, por tanto, un incremento de las secuencias repetitivas. Estos resultados pueden compararse con los obtenidos en la condición de RD en las secuencias V-V y V-E, en ambas se inicia el entrenamiento en la condición de variabilidad y no se observa una mejoría en ambas fases de entrenamiento. Llama la atención que en la secuencia V-E en la condición de estereotipia no se presentó la respuesta repetitiva de manera dominante como apareció en las condiciones de RC y RP. Esto es importante porque en los estudios de variabilidad la condición inicial parece ser determinante para responder de manera variada  (Stokes & Balsam, 2001; Zepeda y Martínez, 2013).

Se ha reportado que el reforzamiento continuo produce menor variabilidad y que ésta incrementa durante la extinción (Antonitis, 1951; Eckerman & Lanson, 1969; Notterman, 1959). Aunque en estos trabajos no se retroalimentó directamente la variabilidad, se han generado dos explicaciones, una propuesta por Antonitis (1951) en la que menciona que el  recondicionamiento (exposición en distintos momentos a reforzamiento continuo) produce menor variabilidad. Una segunda explicación elaborada por Herrnstein (1961) se refiere a que el reforzamiento intermitente puede considerarse como una combinación de condicionamiento y extinción, es decir, a mayor intermitencia menor variabilidad. Ambas explicaciones son contrarias a los resultados aquí expuestos para la RD, ya que la RD se asemeja a una condición de extinción y no se observa variabilidad de la respuesta, por el contrario a mayor intermitencia mayor variabilidad lo que implicaría una relación directa y no inversa como lo propuso Herrnstein. Considerando que nuestros hallazgos y los reportados por Antonitis (1951) y Herrnstein (1961) difieren en el tipo de variabilidad estudiada: variabilidad reforzada vs variabilidad inducida por el programa, se deben de tomar precauciones en el alcance de la explicación y por tanto generar evidencia que permita distinguir los efectos en ambas situaciones. Grunow y Neuringer (2002) reportaron mayor variabilidad cuando el requisito de variabilidad es alto y con reforzamiento continuo, comparado con VI 1 y VI 5, esto es, menor intermitencia, menor variabilidad. Esta evidencia pareciera confirmar que la variabilidad requiere del reforzamiento continuo para su adquisición y mantenimiento.

Distintos autores que estudiaron la variabilidad inducida debido a los cambios en el programa de reforzamiento (Maes, 2003, Neuringer et al., 2001; Souza, et al., 2010; Wagner & Neuringer, 2006) han reportado que la variabilidad inducida por la demora total o parcial del reforzador no tuvo efectos negativos sobre las ejecuciones de los participantes bajo criterios operantes de variabilidad. En el presente estudio, la retroalimentación demorada afectó negativamente la ejecución de los participantes bajo el criterio de variación. El número de aciertos estuvo por debajo del 50%, no lograron elegir un estímulo diferente al del ensayo anterior durante las sesiones de entrenamiento. Esta diferencia de resultados puede explicarse por las diferencias en las tareas experimentales. Los estudios mencionados, utilizaron la tarea clásica o alguna variación de la misma. El retiro del reforzador induce cierto tipo de variabilidad que, en la tarea clásica, se acopla al criterio operante generalmente marcado por un lag y/o por percentiles o frecuencias bajas.

La variabilidad inducida que produjo este estudio se puede apreciar en cambios de elección de una sesión a otra, o elecciones en bloques dentro de una misma sesión, incluso algunos sujetos reportaron al final del experimento que al no comprender el criterio elegían las figuras por su color o por el número de lados sin que esto tuviera un patrón o les aportara muchos aciertos. Sin embargo, en la tarea que se usó para este estudio, la variabilidad que se indujo mediante la retroalimentación demorada no logró cumplir con el criterio de respuesta correcta en variabilidad (elegir una relación diferente en cada ensayo). Algunos participantes mostraron cierta insensibilidad a la retroalimentación negativa que recibían al final de las sesiones y repitieron la elección de un mismo estímulo durante toda o la mayoría de las sesiones. Otros utilizaron estrategias que funcionaron parcialmente, cambiaban o repetían su elección sin mostrar un patrón de respuesta y se “conformaron” con cierta cantidad de aciertos. Lo que puede concluirse al analizar los registros individuales, es que ninguno de los participantes respondió al criterio de variabilidad bajo esta retroalimentación.

En el presente estudio, el criterio de variación implicó la no repetición de un ensayo a otro (lag 1) y las opciones de respuesta eran dos cambiando en cada ensayo. Este tipo de restricciones de la tarea influyen en la variabilidad de las respuestas. Page y Neuringer (1985) y Stokes y Harrison (2002) reportaron que las restricciones en el número de opciones de respuesta y un lag poco exigente dificultan la precisión de las respuestas bajo un criterio operante de variabilidad.  

En las fases de estereotipia de las secuencias E-E ó E-V, los participantes mostraron una ejecución similar a la realizada con retroalimentación continua. El fenómeno de “repetición espontánea” donde los sujetos eligen desde el inicio en cada ensayo el mismo estímulo (generalmente el idéntico) ocurrió con frecuencia en el caso de la retroalimentación demorada. Esta respuesta cumple “casualmente” con el criterio operante de repetición. La ejecución de los participantes bajo el criterio de estereotipia fue afectada negativamente por el antecedente de variabilidad en la secuencia V-E. Las ejecuciones no se recuperaron al final del entrenamiento como sucedió con los grupos de retroalimentación continua.

Los participantes que lograron recuperar su ejecución al final de la segunda fase fueron los que repitieron persistentemente, sin importar la retroalimentación negativa desde la primera fase, cumpliendo con el criterio operante de repetición de la segunda fase de entrenamiento. El número de aciertos de los participantes bajo el criterio de variabilidad siempre fue bajo (menor al 50%), sin importar la secuencia. Sin embargo, las ejecuciones fueron peores en la secuencia E-V, ya que la mayoría de los participantes tuvieron buenas ejecuciones en la primera fase (E) y no lograron responder al cambio de criterio en la segunda fase. En la secuencia V-E, los participantes tuvieron bajas ejecuciones durante la primera fase con criterio de variabilidad y continuaron emitiendo respuestas poco efectivas sin lograr adquirir el criterio de respuesta de repetición en la segunda fase. Al revisar las elecciones individuales los participantes que se recuperaron en la segunda fase, fueron los que repitieron persistentemente desde el principio, de manera que su respuesta cumplía eventualmente con el criterio de repetición.

Neuringer (1986) demostró la importancia de la información proporcionada por la retroalimentación en una tarea en que el criterio de variabilidad no era sencillo. En su estudio, los participantes debían elegir “azarosamente” entre dos opciones de respuesta semejando un generador aleatorio. Cuando sólo recibieron esta instrucción, los participantes fallaron. Se obtuvieron resultados positivos cuando se les proporcionó información continua sobre su desempeño en comparación con varios descriptores estadísticos. Para el final del entrenamiento con esta información, los participantes lograron emitir respuestas que no se distinguían de un generador aleatorio. El requerimiento de una respuesta “azarosa” es muy diferente del criterio de no repetición de esta tarea. Sin embargo, dadas las condiciones experimentales, cumplir con el criterio en esta tarea es difícil debido a las restricciones de la tarea, lo cual se corrobora con los resultados negativos de los participantes bajo la condición de retroalimentación demorada y variabilidad.

Por esta razón podemos suponer que la retroalimentación es indispensable para adquirir la respuesta y cuando se presenta demorada (al final de la sesión) interfiere con el proceso de adquisición. En el estudio de Neuringer (1986), a pesar de las instrucciones explícitas de elegir “azarosamente”, sin retroalimentación, los participantes no lograron igualar al generador aleatorio. Esta tarea, ya que no se da información adicional en las instrucciones, requiere de una cierta frecuencia de retroalimentación para que el criterio de variabilidad pueda ser adquirido por los participantes. 

La medida de relación seleccionada (identidad, diferencia o semejanza) aporta información sobre los estilos de respuesta de los participantes, las datos graficados muestran la distribución de las respuestas, las diferentes formas de responder bajo una misma condición y cuando la efectividad es más o menos la misma (condición de variabilidad). Esta medida de relación representa una forma de explorar la variabilidad inducida por la modalidad de la retroalimentación (parcial y demorada) que ocurre en condiciones de extinción o reforzamiento independiente y ha sido reportado en diversos estudios (Maes, 2003; Neuringer, Deiss, & Olson, 2000; Souza, et. al., 2010).

En este estudio se tomó esta medida como un dato adicional para analizar con mayor detalle las respuestas de los participantes, complementando los datos de aciertos y latencias durante el entrenamiento. En la prueba de transferencia la medida de relación sirvió para evaluar las respuestas de los participantes cuando ya no había criterio de respuesta ni retroalimentación después de un entrenamiento determinado.

En el estudio de Zepeda y Martínez (2013), en la prueba de transferencia se encontró que la mayoría de los participantes respondieron conforme al criterio de la última fase de entrenamiento, los que fueron entrenados en secuencias constantes (E-E o V-V) respondieron con mayor consistencia de acuerdo con el criterio entrenado (variación o repetición). En secuencias alternadas (E-V, V-E) predominaron las respuestas que se ajustaban al criterio entrenado durante la segunda fase. En nuestro estudio, durante la fase de transferencia los participantes emitieron respuestas que recibieron retroalimentación positiva durante el entrenamiento. La mayoría de las veces, sobre todo en retroalimentación parcial o continua, esta respuesta coincidió con uno de los criterios de respuesta, pero en ocasiones no fue así. Se ha reportado que la probabilidad de las secuencias se mantiene durante el periodo de extinción, es decir, las secuencias más frecuentes durante el reforzamiento son también las más frecuentes durante el periodo de extinción (Neuringer, Kornell & Olufs, 2001) esta explicación podría ser aplicable a lo encontrado en la prueba de transferencia, considerando que responder de manera estereotipada o variada depende del entrenamiento previo, aunque para la condición E-V en todas las densidades de retroalimentación no se observa este efecto de recencia, sino una predominancia de respuestas estereotipadas

En los grupos con retroalimentación parcial y demorada, los participantes respondieron conforme a alguno de los criterios de entrenamiento pero no dependió totalmente del orden de las fases o de si la secuencia fue alternada o constante. Las ejecuciones individuales de los participantes fueron emitidas claramente conforme a alguno de los criterios de respuesta en la prueba de transferencia sólo si su ejecución fue apropiada durante el entrenamiento y, por lo tanto, independientemente de la densidad obtuvieron retroalimentación positiva. Por ejemplo, los grupos con altas ejecuciones bajo la secuencia E-E, respondieron claramente de manera repetitiva durante la prueba de transferencia. Los grupos V-V con retroalimentación continua o parcial, respondieron de manera variable en la prueba de transferencia. Los participantes que tuvieron bajas ejecuciones durante todo el entrenamiento, en la prueba de transferencia emitieron respuestas que no coincidieron con alguno de los criterios de respuesta pero con las que obtuvieron cierta cantidad de retroalimentación positiva durante el entrenamiento. En algunos casos, los participantes respondieron repetitivamente en la prueba de transferencia después de tener pocos aciertos durante todo el entrenamiento (por ejemplo en las secuencias V-V o V-E). La repetición espontánea se presentó en ocasiones en la prueba de transferencia, tal vez como una respuesta previamente aprendida que se utiliza como alternativa cuando las nuevas condiciones no son claras (variabilidad en retroalimentación demorada). En la prueba de transferencia, que no tenía criterios ni retroalimentación, los participantes “ejercitaron” una respuesta que fue entrenada eficazmente (recibió algún tipo de reforzador) en el experimento o en otro contexto.

Las latencias mostraron un patrón de disminución conforme transcurrieron las sesiones de entrenamiento en secuencias constantes, con un ligero aumento al pasar a la prueba de transferencia. En las secuencias alternadas, hubo un aumento en la sexta sesión, cuando el criterio de respuesta cambió. La latencia fue menor bajo la condición de estereotipia (en secuencia constante) y mayor bajo criterios de variabilidad. En los grupos con retroalimentación demorada, el aumento de latencia en el cambio de fase no ocurrió ya que los participantes no identificaron el cambio de criterio en la sexta sesión de las secuencias E-V y V-E. Comparando los cambios en el número de aciertos con los cambios en la latencia, en algunas condiciones se afectaron ambos parámetros de la respuesta, siendo coherente con el supuesto de que una tarea más difícil implica una menor cantidad de aciertos y latencias más altas.

Los aumentos en las latencias cuando la tarea era más difícil ocurrieron sobre todo en los grupos de jóvenes. En los grupos de niños la latencia en ocasiones estuvo desligada de los cambios en la precisión de la respuesta. Varios participantes de los grupos de niños presentaron pocos aciertos al mismo tiempo que latencias bajas. En el experimento no se dieron instrucciones sobre el criterio para responder, los participantes debían “averiguar” el criterio sólo con la información que aportaba la retroalimentación. Una mayor dificultad de la tarea implicaba más tiempo para “decidir” en cada ensayo cuál era la respuesta correcta.

La medida de latencia permitió apreciar una diferencia más sutil en las ejecuciones de niños y jóvenes, los casos en que la latencia no aumentó a pesar de que los participantes tuvieron pocos aciertos y, por lo tanto retroalimentación negativa, se dieron sólo en los grupos de niños. Estos datos dan información sobre las diferencias del control ejercido por la retroalimentación. Se esperaba que hubiera diferencias entre niños y jóvenes por los efectos de la retroalimentación. Ciertas diferencias en las respuestas de ambos grupos apoyarían la hipótesis de que el control ejercido por la retroalimentación fue menos efectivo en los niños que en los jóvenes. En la secuencia E-E con retroalimentación continua fue más notorio este control. A varios niños les tomó dos ó tres sesiones alcanzar una ejecución “perfecta”; mientras que los jóvenes lo hicieron en dos sesiones como máximo. También en los grupos de niños, después de que lograron ejecutar de manera “perfecta”, algunos participantes eligieron una respuesta diferente, por lo tanto cometiendo errores. En los grupos de jóvenes no hubo participantes que realizaran esta conducta “indagatoria”.

En condiciones como V-V y retroalimentación demorada, los niños fueron más rápidos en responder que los jóvenes, a pesar de que la ejecución fue baja en aciertos en ambos grupos. En general, los jóvenes mostraron cambios coherentes en la latencia con respecto de sus ejecuciones, es decir, en las condiciones más difíciles las latencias fueron mayores; los jóvenes con menos aciertos fueron los que produjeron latencias más altas. Los niños no mostraron esta coherencia, en ocasiones, participantes con pocos aciertos tuvieron latencias bajas. De acuerdo con Martínez (2011) estas diferencias en la ejecución podrían deberse a su historia previa en que ambos grupos de edad han sido expuestos a este tipo de retroalimentación. Los jóvenes podrían ser más sensibles al control ejercido por la retroalimentación ya que han estado expuestos a ella por más tiempo que los niños.

La retroalimentación (reforzador condicionado) es usada comúnmente en estudios experimentales con humanos para sustituir un reforzador primario. En este estudio la variabilidad operante dependió de la densidad de la retroalimentación. Bajo las modalidades continua y parcial, la respuesta de variabilidad  fue “aprendida”  por la mayoría de los participantes mientras que la retroalimentación demorada no hizo posible este “aprendizaje”. 

Conclusiones

El estudio de la variabilidad y la estereotipia conductual es importante porque el equilibrio entre ambas es necesario para la adaptación del ser humano a su ambiente. Esta línea de investigación promete posibles aplicaciones en poblaciones clínicas con deficiencias en sus niveles de variabilidad (p. ej. autismo). Se han hecho algunos estudios en poblaciones clínicas, sobre todo en autismo y se han evidenciado diversas fallas debido a la falta de entendimiento de las funciones de las variables involucradas. Es necesario seguir generando conocimiento sobre las condiciones que producen, controlan y mantienen la variabilidad y estereotipia conductual para diseñar programas de entrenamiento con mayor efectividad. La información de previos estudios aplicados se puede complementar con la información de investigación básica para el diseño de programas de entrenamiento que logren manipular niveles de variabilidad y estereotipia promoviendo la adaptación al medio de poblaciones clínicas con niveles alterados de alguna de estas operantes como por ejemplo autismo, TDAH, esquizofrenia, depresión (Hopkinson & Neuringer, 2003; Lee, McComas, & Jawor, 2002; Mazefsky, Williams, & Minshew, 2008; Miller & Neuringer, 2000; Saldana, & Neuringer, 1998). Este estudio pretende aportar información sobre la interacción de las condiciones en las que puede favorecerse o no la variabilidad conductual, complementa la exploración sobre los tipos de variabilidad que pueden obtenerse con determinados programas de entrenamiento y sobre las restricciones de las tareas experimentales. Destaca la importancia de la densidad de la retroalimentación en una tarea con criterios de respuesta difícil y la importancia de la línea base en el desempeño en tareas de variabilidad. Corrobora la relevancia de las secuencias de entrenamiento y las interacciones que pueden presentarse entre un número de variables, por ejemplo la interacción entre las secuencias de las fases de entrenamiento y la densidad de retroalimentación que pone de relevancia la historia bajo contingencias de estereotipia y de variabilidad y la dificultad de controlar esa historia en situaciones naturales. Los datos que aporta este estudio, abren posibilidades para futuras investigaciones en la línea de variabilidad y estereotipia conductuales y complementan la información existente sobre las variables implicadas en el control de estas dimensiones operantes.

Referencias

Antonitis, J.J. (1951). Response variability in the white rat during condition, extinction and reconditioning. Journal of Experimental Psychology, 42, 273-281.

Cumming, W. & Berryman, R. (1961). Some data on matching behavior in the pigeon. Journal of Experimental Analysis of Behavior, 4, 281-284.

Doughty, A.H. & Galizio, A. (2015). Reinforced behavioral variability: Working towards an understanding of its behavioral mechanisms. Journal of the Experimental Analysis of Behavior, 104, 252-273.

Eckerman, D. & Lanson, R. (1969). Variability of response location for pigeons responding under continuous reinforcement, intermittent reinforcement, and extinction. Journal of the Experimental Analysis of Behavior, 12, 73-80.

Grunow, A. & Neuringer, A. (2002). Learning to vary and varying to learn. Psychonomic Bulletin and Review, 9, 250-258.

Herrnstein, R.J. (1961). Relative and absolute strength of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267-272.

Hopkinson, J. & Neuringer, A. (2003). Modifying behavioral variability in moderately depressed students. Behavior Modification, 27, 251-264.

Lee, R., McComas, J.J. & Jawor, J. (2002). The effects of differential and lag reinforcement schedules on varied verbal responding by individuals with autism. Journal of Applied Behavior Analysis, 35, 391-402.

Lee, R., Sturmey, P. & Fields, L. (2007). Schedule-induced and operant mechanisms that influence response variability: A review and implications for future investigations. The Psychological Record, 57, 429-455.

Maes, J.H. (2003). Response stability and variability induced in humans by different feedback contingencies. Learning & Behavior, 31, 332-348.

Martínez, H. (2001). Estudios sobre transferencia en comportamiento humano. En G. Mares, & Y. Guevara, Psicología Interconductual: Avances en la Investigación Básica (págs. 37-58). México: UNAM.

Martínez, H. (2011). Efectos de la retroalimentación bajo condiciones de aprendizaje y no aprendizaje en tareas de discriminación condicional humana. En H. Martínez,  J.J. Irigoyen,  F. Cabrera, J. Varela,  P. Covarrubias y  A. Jiménez (Eds) Estudios sobre comportamiento y aplicaciones: Vol. II (págs. 257-278). México: COECYTJAL.

Martínez, H. & Ribes, E. (1996). Interactions of contingencies and instructional history on conditional discrimination. The Psychological Record, 55, 633-646.

Mazefsky, C.A., Williams, D.L. & Minshew, N.J. (2008). Variability in adaptive behavior in autism: evidence for the importance of family history. Journal of Abnormal Child Psychology, 36, 591-599.

Miller, N. & Neuringer, A. (2000). Reinforcing variability in adolescents with autism. Journal of Applied Behavior Analysis, 33, 151-165.

Neuringer, A. (1986). Can people behave "randomly?": The role of feedback. Journal of Experimental Psychology: General, 115, 62-75.

Neuringer, A. (1992). Choosing to vary and repeat. Psychological Science, 3, 246-250.

Neuringer, A. (1993). Reinforced variation and selection. Animal Learning & Behavior, 21, 83-91.

Neuringer, A. (2002). Operant variability: evidence, functions and theory. Psychonomic Bulletin and Review, 9, 672-705.

Neuringer, A. (2009). Operant variability and the power of reinforcement. The Behavior Analyst Today, 10, 319-343.

Neuringer, A., Deiss, C. & Olson, G. (2000). Reinforced variability and operant learning. Journal of Experimental Psychology: Animal Behavior Processes, 26, 98-111.

Neuringer, A., Kornell, N. & Olufs, M. (2001). Stability and variability in extinction. Journal of Experimental Psychology: Animal Behavior Processes, 27, 79-94.

Notterman, J. M.(1959). Force emission during bar pressing. Journal of Experimental Psychology, 58(5), 341-347. http://psycnet.apa.org/doi/10.1037/h0042801

Page, S., & Neuringer, A. (1985). Variability is an operant. Journal of Experimental Psychology: Animal Behavior Processes, 11, 429-452.

Ribes, E. & Martínez, H. (1990). Interaction of contingencies and rule instructions in the performance of human subjects in conditional discrimination. The Psychological Record, 40, 565-586.

Saldana, L. & Neuringer, A. (1998). Is instrumental variability abnormally high in children exhibiting ADHD and aggressive behavior? Behavioural Brain Research, 94, 51-59.

Sidman, M. (1960). Variability. En M. Sidman, Tactics of Scientific Research (pages. 141-212). New York: Basic Books Inc.

Souza, A.S., Abreu-Rodrigues, J. & Baumann, A.A. (2010). History effects upon induced and operant variability. Learning & Behavior, 38, 426-437. doi:10.3758/LB.38.4.426

Souza, A.S., Pontes, T.N. & Abreu-Rodrigues, J. (2012). Varied but not necessarily random: Human performance under variability contingencies is affected by instructions. Learning & Behavior, 40, 367-379. doi: 10.3758/s13420-011-0058-y

Stokes, P.D. (2012). Creativity and operant research: Selection and reorganization of responses. En M. A. Runco, Handbook of creativity research (pages. 147-171). Cresskill, NJ: Hampton.

Stokes, P.D. & Harrison, H. (2002). Constrains have different concurrent effects and aftereffects on variability. Journal of Experimental Psychology: General, 131, 552-566.

Stokes, P.D., & Balsam, P. (2001). An optimal period for setting sustained variability levels. Psychonomic Bulletin and Review, 8, 177-184.

Wagner, K. & Neuringer, A. (2006). Operant variability when reinforcement is delayed. Learning & Behavior, 34, 111-123.

Zepeda, R. I., & Martínez, H. (2013). Entrenamiento de variabilidad y estereotipia en una tarea de igualación de la muestra y efectos de recencia sobre la transferencia en humanos. Conductual, 1, 51-71.

Journal keywords: 
Undefined

Add new comment

Plain text

  • No HTML tags allowed.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.
By submitting this form, you accept the Mollom privacy policy.