¿Què es el Condicionamiento operante?
El condicionamiento operante es una ciencia experimental de la conducta. El término condicionamiento operante se refiere a un proceso en el cual la frecuencia con que está ocurriendo una conducta, se modifica o se altera debido a las consecuencias que esa conducta produce. El condicionamiento operante ha pasado a ser una verdadera aproximación a la psicología científica. Lo que en general caracteriza a esta aproximación es, un determinismo en el comportamiento, y un análisis experimental de la conducta. Así mismo, se distingue por su interés en el estudio de la conducta operante o instrumental, sin descuidar el estudio de la conducta refleja. Como aproximación al estudio de la conducta, el condicionamiento operante consiste en: un conjunto de principios acerca de la conducta y del medio ambiente, los cuales pueden ser usados para dar una descripción científica y objetiva de la conducta y del medio ambiente dentro del cual se manifiesta; un grupo de técnicas y procedimientos destinados al estudio experimental de la conducta dentro del laboratorio; y en un abundante conjunto de hechos y principios que han sido demostrados experimentalmente (Reynolds,1977).
Tanto Thorndike como Skinner han desempeñado roles fundamentales en el desarrollo del conocimiento que ahora tenemos del condicionamiento operante. En tal sentido recordemos el conexionismo y la ley del Efecto de Thorndike, donde establecía que, cualquier acto que produzca un efecto satisfactorio en una determinada situación tenderá a ser repetido en esa situación.
De este modo Thorndike estableció la base para el condicionamiento operante, pero se debe a B.F. Skinner la responsabilidad del desarrollo del concepto de condicionamiento operante. Concretamente en 1938, publica su primer gran libro “La conducta de los organismos”, en donde se exponen por primera vez de manera sistemática los principios del condicionamiento operante acompañados de los primeros experimentos clásicos sobre el tema.
Puede decirse que el "Condicionamiento Operante" se refiere al conjunto de principios básicos y hallazgos teórico-experimentales producidos por la investigación skinneriana y que puede definirse como; un proceso en el cual la frecuencia con que ocurre una conducta depende de las consecuencias que tiene esa conducta. La conducta que tiene consecuencias agradables para el sujeto se ve fortalecida y tiende a repetirse, y la conducta que tiene consecuencias negativas para el sujeto se debilita y tiende a desaparecer.
La probabilidad de aparición de una conducta es, pues, una función de las consecuencias que esa conducta tiene para el sujeto, a diferencia de la conducta respondiente cuyas posibilidades de aparición sólo dependen de la presencia del estímulo incondicionado.
Se propone un aprendizaje basado en las respuestas del sujeto que aprende, bien para conseguir situaciones gratificantes o bien para evitar las desagradables. Para tal fin, se dedicó a estudiar y manipular los Refuerzos en situaciones de aprendizaje, mostrando un gran interés por las cuestiones aplicables, como en la educación.
En el condicionamiento operante la palabra "Refuerzo" es piedra angular en el planteamiento de Skinner, y este puede ser definido como el estimulo que al aumentar o desaparecer, aumenta la probabilidad de ocurrencia de una respuesta. Entonces una serie de estas acciones refuerzan la conducta en un sentido positivo o negativo.El principio fundamental es considerar que las respuestas operantes son una función de las contingencias de estímulos reforzantes. Aunque las respuestas no sólo dependen de estas contingencias, sino también de la presencia de los estímulos discriminativos. De ahí que habla que el operante se encuentra bajo el control del estímulo.
El control del estímulo se produce cuando hay una elevada probabilidad de que una respuesta aparezca en presencia de un estímulo antecedente. Para desarrollar el control del estímulo se utiliza el refuerzo diferencial reforzando la respuesta siempre que ocurra en presencia del estímulo discriminativo y dejando de reforzar la respuesta cuando se dé en presencia de otros estímulos.(Ej. Si un estudiante habla cuando se lo indica el profesor, su conducta será aprobada o reforzada, pero si habla sin que se le pregunte, su conducta no será aprobada). Las sugerencias del profesor, las instrucciones académicas y los textos son series de estímulos discriminativos.
El control del estímulo se suele ejercer reforzando estímulos o incentivos.
Conceptos básicos del condicionamiento operante:
*REFORZADORES PRIMARIOS:Son aquellos que no dependen de la historia del sujeto, sino de las características biológicas; son comunes a todos los sujetos de la especie y tienen un carácter altamente adaptativo, guardando relación directa con la supervivencia del sujeto y la especie. Como por ejemplo el sexo y la comida.
*REFORZADORES SECUNDARIOS: Al contrario que los Primarios, éstos no tienen relación directa con la supervivencia y dependen, más bien, de la historia individual del sujeto, son todos aquellos que son aprendidos como el elogio, el dinero, las calificaciones escolares, las condecoraciones.
Los dos tipos de refuerzos básicos en la teoría de Skinner son: positivo (los que aumentan la probabilidad de ocurrencia de una respuesta como la comida, el agua y el sexo. y negativo son estímulo desagradables que incrementa la probabilidad de ocurrencia de la conducta que anteceden.Para que el refuerzo sea aprendido debe ser inmediato de lo contrario no se producirá el aprendizaje.
Reforzadores Condicionados
Algunos estímulos como el agua y la comida tienen la propiedad de reforzar la conducta sin que el organismo haya tenido una experiencia previa con ellos. Estos estímulos se denominan primarios o reforzadores incondicionados. Otros estímulos adquieren la propiedad de reforzar la conducta a lo largo de la vida del organismo. Estos últimos se denominan secundarios o reforzadores condicionados. Los reforzadores condicionados adquieren el poder de reforzar las operantes mediante un procedimiento parecido al que se observa en el condicionamiento respondiente.
Los paradigmas básicos del condicionamiento operante son:
.- Reforzamiento positivo: Procedimiento a través del cual una conducta incrementa su probabilidad de ocurrencia cuando es seguida de un reforzador positivo. Por ejemplo : Un niño que està aprendiendo a leer y se le felicita cada vez que reconoce una vocal o consonante. Cada vez que el niño interviene en clases se le felicita.
.- Reforzamiento negativo : Procedimiento a través del cual se incrementa la probabilidad de ocurrencia de la conducta que elimina una estimulaciòn aversiva. Esto da lugar al escape o a la evitaciòn. Por ejemplo : Cada vez que el niño hace un berrinche porque quiere algo la mamá se lo compra para que deje de realizar el berrinche (llantos y gritos). En un primer momento la conducta de comprarle lo que el niño quiere puede ser por escape . La madre va por la calle el niño quiere un helado la madre le dice que no, el niño inicia llantos, gritos y pataletas (Estimulo aversivo para ella) que origina que le compre el helado (escape) y el niño deja de hacer el berrinche. se incrementa la probabilidad de ocurrencia de que cada vez que quiera algo la madre se lo compre en el futuro. Si esto ocurre antes de que se presente el berrinche estaríamos ante un reforzamiento negativo por evitaciòn de la madre.
.- Extinción: es el procedimiento a travès del cual se disminuye la probabilidad de ocurrencia de una conducta que no va seguida de un reforzador. Por ejemplo, el niño levanta la mano para intervenir en clases y la maestra lo ignora , extingue su conducta de participar en esa clase.
.- Castigo: es el procedimiento a travès del cual se administra una estimulaciòn aversiva a una conducta. Por ejemplo pegarle a un niño cada vez que haga un berrinche. Se ha descrito esto como castigo tipo I y no es efectivo puesto que la estimulaciòn aversiva suprime la conducta en el momento pero la dispara despuès. En este caso se recomienda el castigo tipo II o costo de respuesta que consiste qn quitarle al individuo algo que ya posea. Por ejemplo : un niño salio mal en los exàmenes y por ello se le quita el juego de DS por dos semanas.
PROGRAMAS DE REFORZAMIENTO
Los programas de reforzamiento son "reglas", que determinan cuando seguirá la entrega o presentación contingente de un reforzador a la presentación de una respuesta o conducta. Existen varios programas de reforzamiento Reynolds (1978) describe los siguientes:
PROGRAMAS SIMPLES DE REFORZAMIENTO POSITIVO
Como dijimos anteriormente, no es necesario reforzar todas las ocurrencias de una respuesta para poder incrementar o mantener su tasa, asì una sola emisión de la respuesta es reforzada, las demás no lo son. En el caso de pedir que le sirvan a uno de comer, deberá ser la hora de la comida para que esa respuesta sea reforzada; el número de respuestas relativamente no tiene importancia.
PROGRAMAS DE REFORZAMIENTO INTERMITENTE
Cuando el medio solo refuerza algunas de las respuestas emitidas por un organismo, decimos que está en operación un programa de reforzamiento intermitente. Bajo el reforzamiento intermitente, solo se refuerzan determinadas ocurrencias de la respuesta. El programa de reforzamiento es la regla que sigue el medio (dentro de un experimento, esa regla la sigue el aparato programador) al determinar cuáles serán las ocurrencias de una respuesta que van a ser reforzadas de entre un conjunto de ellas.
Los programas de reforzamiento tienen efectos regulares, ordenados y profundos sobre la tasa de respuestas de un organismo. La importancia de los programas de reforzamiento no puede pasarse por alto. A menos de que se especifique el programa de reforzamiento en operación, no será posible obtener una completa descripción o explicación de cualquier conducta operante.
Los programas son la fuerza principal del control conductual, y por lo tanto su estudio constituye una parte muy importante dentro del estudio de la conducta.
Las conductas atribuidas a supuestos impulsos o a necesidades o a expectancias o a meditaciones o a insights del organismo, frecuentemente pueden ser relacionadas de una manera más precisa, con las regularidades producidas por un programa de reforzamiento. Una gran cantidad de cambios aparentemente erráticos en la tasa de respuestas, mismos que originalmente habían sido atribuidos a variables motivacionales o al “libre albedrío”, han sido analizados experimentalmente, encontrándose que se debían a la influencia de los programas de reforzamiento.
Programas de Razón y de Intervalo
Los programas simples de reforzamiento pueden ser clasificados en dos grupos: programas de razón y programas de intervalo.
Los programas de razón establecen que deberá emitirse un determinado número de respuestas antes de que una emisión sea reforzada. El término razón se refiere a la razón que existe entre el número total de respuestas y la respuesta reforzada. Los programas de intervalo establecen que deberá pasar un determinado tiempo antes de que una respuesta sea reforzada. El intervalo podrá medirse a partir de cualquier evento; sin embargo se utiliza como criterio el final del reforzamiento anterior. Por ejemplo reforzar a un estudiante cada 5 intervenciones, asì se refuerza la intervención 5 luego la 10 luego la 15 y así sucesivamente.
Bajo los programas de razón, la cantidad de tiempo que le toma al organismo emitir el número de respuestas necesario, no es tan importante; de la misma manera, en los programas de intervalo lo importante no es el número de respuestas, siempre y cuando el organismo emita la única respuesta necesaria para obtener reforzamiento una vez que haya concluido el intervalo. En los programas de intervalo, el simple paso del tiempo trae consigo una oportunidad para el reforzamiento; siempre y cuando haya transcurrido el intervalo, solo se requerirá una respuesta para producir el reforzamiento. Por lo tanto, éste solo reforzamiento incrementa la tasa de respuestas y asegura que la ejecución no se extinga. En el mismo ejemplo anterior reforzar al alumno cada 5 minutos.
Programas Variables y Fijos
Los programas de razón y de intervalo pueden ser clasificados a su vez en dos grupos: variables y fijos. Cuando está operando un programa de razón variable, el número de respuestas requerido para el reforzamiento varía de un reforzamiento a otro de una manera irregular pero siempre manteniendo una característica repetitiva. En una secuencia típica, se podría reforzar la décima respuesta, después la centésima, después la quincuagésima, continuando con estos números de respuesta: 5, 30, 150, 15, 90 y 120.
Por otro lado, un programa de razón fija requiere consistentemente del mismo número de respuestas por cada reforzamiento. Los programas de razón fija se abrevian con las iniciales RF. Un programa de razón fija que establezca un total
de 50 respuestas por cada respuesta reforzada, se abreviará RF 50. De la misma manera, un programa de intervalo variable (IV) es aquel en el que varía la cantidad de tiempo que deberá pasar antes de que una respuesta sea
reforzada. Un programa de intervalo fijo (IF) es aquel que mantiene constante el
tiempo establecido para el reforzamiento
Según los experimentos realizados por Skinner, los programas de reforzamiento parcial, son bastante estables y mantienen la conducta por periodos más largos que los programas de reforzamiento continuo.
REFERENCIAS BIBLIOGRÁFICAS:
Casalta, H. y Becerra J.(1981) Modificaciòn de conducta: Tàcticas de observaciòn e intervenciòn.Caracas, Venezuela: EDiciones Facultad de Humanidades y Educaciòn UCV.
Reynolds, G.S. (1977). Compendio de Condicionamiento Operante.Mèxico: editorial Ciencias de la Conducta.
Worchel,S. y Shebilske,W. (2006). Psicologìa.Fundamentos y Aplicaciones. Madrid, España:Prentice Hall.
No hay comentarios:
Publicar un comentario