jueves, 4 de abril de 2013

La cajita que hace clic


Bien, empecemos por el principio: ¿qué es un clicker? Pues ni más ni menos que una cajita que hace clic cuando pulsas una chapita. Ahora mismo hay en el mercado otros mecanismos más sofisticados, pero básicamente es más un tema de diseño que de funcionamiento. ¿Qué no es un clicker? No es un método de adiestramiento, ni un cacharrito misterioso que enseña a los perros a sentarse, a quedarse quietos y a traer el periódico los domingos por la mañana,  no hace un sonido mágico ni tiene un funcionamiento misterioso sólo comprensible para los “iniciados”. Es una cajita que hace clic.


Bien, y entonces ¿a qué tanto misterio con eso? Misterio ninguno, en realidad su funcionamiento es más simple que el de un chupete, el problema viene cuando nos lo venden como método de adiestramiento o intentamos utilizarlo con nuestro perro sin comprenderlo bien.

La base de su funcionamiento es lo que se conoce como “condicionamiento operante”. Para comprenderlo mejor, vamos a dividirlo en dos partes: primero asociaremos el sonido del clicker a la aparición de una recompensa (que será comida en el 99% de los casos), es decir: clic-comida, clic-comida, clic-comida y así sucesivamente durante unas cuantas veces. Al principio al perro el clic no le dice nada, pero después de unas cuantas repeticiones acaba por entender que el sonido precede a la aparición de la comida. Es lo que en la jerga de los adiestradores se llama “cargar el clicker”. Una vez logrado esto, empieza la parte difícil. El condicionamiento operante consiste en un tipo de aprendizaje por consecuencias: si hago esto, ocurre tal cosa, si hago esto otro, ocurre una cosa distinta. La consecuencia puede ser positiva o negativa, y esto va a determinar la probabilidad de que se repita esta conducta en el futuro. En la vida diaria hay innumerables ejemplos de esto: si te saltas un stop te multan, si recoges tu habitación te puedes comer un helado de postre. Es evidente que la multa reducirá las probabilidades de que en el futuro te saltes un stop, y el helado hace más probable que recojas tu habitación.

Entonces, pensemos que queremos enseñar a nuestro perro a sentarse. Lo primero será conseguir que el perro se siente y cuando lo hayamos conseguido haremos clic (no al revés, por alguna razón mucha gente piensa que el clicker funciona como un mando a distancia y que al pulsarlo el perro hará cosas). Después del clic, le daremos el premio. ¿Cómo conseguimos que el perro se siente? Bueno, hay muchas maneras y no voy a entrar ahora en eso,  pero digamos que la forma más fácil es llevar un premio sobre la nariz del perro hacia atrás hasta que se siente. Al sentarse y oir el clic, automáticamente sabrá que después viene un premio y ahí la asociación que nos interesa: si me siento cuando me lo piden, obtengo un trozo de salchicha. Obviamente, si se sienta cuando no se lo pedimos, no recibirá nada.

La expectativa de recibir una recompensa aumentará las probabilidades de éxito en el aprendizaje, pero no siempre. Lo más importante al trabajar con clicker es utilizar una motivación adecuada y tener un buen timing. Llamamos timing a la capacidad de hacer clic en el justo momento que el perro hace el comportamiento. Un mal timing hace que el perro sea recompensado cada vez por algo distinto, no es lo mismo estar sentado que estar sentándose o sentado y ladrando o sentado y girando la cabeza. Esto dificulta el aprendizaje y frustra tanto al perro como al entrenador. El clicker es una poderosa herramienta de comunicación, pero mal utilizada crea mucho estrés en los perros, que reciben  informaciones contradictorias.

La segunda parte es elegir una recompensa adecuada. Si el premio por hacer tu cama es un helado de fresa y a ti te gusta de chocolate, igual no funciona como premio. De igual manera, una galletita puede no ser suficientemente apetitosa para enseñar nuevos trucos a tu perro.

¿Y por qué no usar la comida directamente como premio? Porque es una forma de premiar mucho menos precisa. Si en vez de querer que nuestro perro se siente pretendemos enseñarle comportamientos más elaborados, necesitamos marcarlos de manera precisa. Piensa en el clicker como en una cámara de fotos: el momento en el que pulsas el botón capta el comportamiento concreto que queremos (a esto se le llama “capturar” comportamientos), por ejemplo, que el perro gire la cabeza hacia la izquierda. Sería difícil premiar este comportamiento con comida, y además llevar comida en las manos hace que los perros estén demasiado pendientes de la misma y no se concentren en nada más.

¿Por qué clic y no otro sonido? En realidad el sonido es lo de menos. Se puede usar un clicker, un silbato, o cualquier otra cosa. De hecho, con delfines se usan los silbatos. La idea es asociar con el premio un sonido fácil de hacer, claro y que sea siempre igual.

¿Por qué digo que no es un método de adiestramiento? Porque el clicker es simplemente una herramienta, un capturador de comportamientos (aumenta la probabilidad de que se repitan en el futuro). La manera en la que consigamos que el perro haga esos comportamientos será el método de adiestramiento. En mi caso concreto, uso siempre técnicas libres de castigo, pero en el clicker es especialmente importante. El castigo, por definición, es algo que disminuye la probabilidad de que un comportamiento se repita (justo lo contrario que dar un premio, o en nuestro caso hacer clic que va asociado a dicho premio), así que si castigamos las conductas que no queremos (por ejemplo, el perro se tumba en vez de sentarse que es lo que buscamos), disminuimos la probabilidad de que el perro se tumbe pero también de que se siente o de que haga cualquier otra cosa. Ofrecer la conducta acertada (que aún no tiene claro cuál es) trae consigo una recompensa, pero hacer cualquier otra trae un castigo. Así que los perros, por si acaso, acaban no haciendo nada. Volvamos al ejemplo de las multas. Pongamos que estás aprendiendo a conducir, por lo que aún no tienes muy claras las normas. Cada vez que aciertes te dan 50 euros, pero cuando te equivoques, te multan con otros 50. Es mucho más probable que te equivoques varias veces antes de hacerlo bien una, por lo que en poco rato acumularás una buena deuda. Sin duda, tus ganas de aprender a conducir se verán seriamente disminuidas.

¿Y el clicker, se queda para siempre? No, el clicker es una herramienta y como tal se debe eliminar cuando haya dejado de ser útil. Ahí ya entra la habilidad y experiencia del entrenador de saber en qué momento el perro ha entendido el ejercicio y se puede dejar de usar el clicker. Ojo, dejar de usar el clicker no es sinónimo de dejar de premiar, eso es otro tema.

Entonces, si es tan sencillo, ¿cualquiera puede usar el clicker con su perro? En teoría sí, pero la práctica es algo más complicada. Aprender a usar el clicker y las recompensas de forma adecuada y con buen timing requiere cierta habilidad y sobre todo mucha práctica. Además, mientras aprendemos, es probable que nuestro perro pague nuestros errores, así que lo mejor es recurrir a algún profesional que nos guíe y nos enseñe a utilizarlo antes de volver loco a nuestro perro. Hay muchas publicaciones, tutoriales e incluso miles de vídeos en internet que enseñan a usarlo, pero recomiendo encarecidamente que sólo se recurra a ellos cuando ya hemos adquirido cierta práctica y un profesional bien formado nos ha enseñado de manera personal.

En nuestro blog iremos publicando información sobre cursos, libros, etc. relacionados con el clicker. Puedes suscribirte o revisarlo periódicamente para obtener más información.

pd: todo el rato hablo de perros, pero el clicker se puede usar con todo tipo de animales.



No hay comentarios:

Publicar un comentario