notas sobre racionalidad en Ostrom (muy largo)

Va un post muy largo en el que vuelco algún trabajo que estoy haciendo sobre un artículo de E. Ostrom sobre racionalidad y acción colectiva. Es lo primero que leo de Ostrom por lo que las críticas son completamente provisionales.

El artículo es este y está disponible on line en formato pdf.

Entre corchetes las notas; el resto en castellano el resumen por libre y en inglés las citas literales. lo estoy haciendo sin referir paginado...

5 razones para reformular la teoría de la elección racional:

1. cuando existe un dilema social el comportamiento se ve afectado por variables estructurales. [que habrá que estudiar para completar la teoría o reformularla]

2. hay que integrar los resultados de las ciencias sociales y biológicas en un marco teórico que se base en sus resultados. los andamiajes que suponen las instituciones de competencia actúan de tal forma que los individuos que no compiten quedan fuera de juego.

3. remite al trabajo de científicos cognitivos, teóricos evolucionistas y otros, que estudian cómo la reciprocidad y otras normas y reglas de conducta has sido iniciadas.

4. se ha asumido que las personas racionales no son capaces de resolver los dilemas sociales si no es mediante ayuda externa. Y son políticas que han fallado.

5. sobre la visión que la teoría de la racionalidad tenía de la política como partes parciales representantes de intereses no coincidentes con los de la gente.

[Ahora va a enlazar lo de los dilemas sociales con las formas distintas de racionalidad]. Los dilemas sociales se caracterizan por situaciones en las que los individuos toman decisiones individuales en situaciones de interdependencia. Los jugadores pueden contribuir o no a un beneficio que será conjunto. Tentación de no contribuir. La predicción [para la th ec. de racionalidad perfecta] es que nadie contribuye, situación que sería un equilibrio de Nash (dadas las acciones de los otros...). son dilemas porque existe al menos una situación que mejora la situación de todos. Conflicto entre racionalidad individual y de grupo.

Muchos modelos de dilemas sociales. En todos un cjto de individuos está involucrado en un juego que tiende hacia un Equilibrio de Nash, y cuando se da una sola iteración el juego produce un resultado menos que óptimo. El equilibrio es inferior en el sentido de pareto. Sólo si cooperan pueden alcanzar pareto.

Ademas casi todos los modelos que representan dilemas sociales cumplen que: (1) todos los participantes tienen un conocimiento común de la estructura fijada de forma exógena de la situación y de los pagos que reciben todos los individuos. (2) las decisiones sobre la estrategia se realiza de forma simultánea e independiente, (3) en un juego simétrico en donde todos poseen la misma variedad de elección de estrategias y en donde (4) no existe un árbitro externo que imponga acuerdos.

y se resuelve hacia atrás. Las distintas modalidades de th de acción racional difieren en lo referido a las funciones de pagos. [nash eq.=cero coop], el resultado eficiente será considerado como 100% coop.

Sin embargo en la vida real los agentes contribuyen al mantenimiento de bienes públicos. Los laboratorios confirmaron esto incluso para juegos de un solo movimiento.

después pasa a explicar la evolución de los modelos a partir de ese momento, que intentan dar respuesta a ese desafío teórico de distintas formas. Mediante formas de 'irracionalidad' por parte de algunos agentes (de conducta mimética: reciprocators) o que no se sepa cuando acaba el juego. en todo caso se ha de asumir incertidumbre sobre la duración o asumir que algunos jugadores son irracionales. pero resulta en explicaciones demasiado retorcidas.

pasa a defender la economía experimental y a relatar cuatro de sus principales resultados. Son resultados para: dilemas sociales, con racionalidad completa, info completa, una decisión con periodos finitos. Para retar las predicciones de no cooperación.

1. Altos niveles de cooperación inicial se encuentran en la mayoría de los tipos de dilemas sociales, pero esos niveles son inferiores al óptimo de forma consistente.

2. la conducta observada no es consistente con la inducción hacia atrás en dilemas sociales repetidos finitamente que aconseja la th.

3. las estrategias de equilibrio de nash no son buenos predictores al nivel individual.

4. las estrategias para los equilibrios de nash no son aprendidos en los juegos de dilemas sociales repetidos por los individuos.

apartado: high but suboptimal levels of initial cooperation. ahora habla de dilemas sociales de provisión de bienes públicos. pero si repites el juego el nivel de involucración de los jugadores puede variar mucho (descendiendo).

apartado: behavior in social dilemmas inconsistent with backward induction. no es la forma en que los agentes resuelven los problemas de interacción: rapoport 1997.

apartado: nash equilibrium strategies do not predict individual behavior in social dilemmas. en otro tipo de situaciones tanto a nivel individual como colectivo es un buen predictor, pero no en lo tocante a dilemas sociales. Si bien los resultados agregados en situaciones de dilemas sociales se aproximan a un eq de nash, la varianza es extrema. Es una estrategia que no se juega en esa clase de dilemas, nadie lo hace.

apartado: individuals do not learn nash equilibrium strategies in social dilemmas. sin comunicación los niveles de cooperación caen hasta el eq de nash. pero la gran varianza de conductas parece sugerir que los agentes aprenden otra cosa, no la estrategia de eq de nash. es como si aprendieran a cooperar de forma moderada. la cooperación sólo tiende a cero cuando el juego consta de muy pocos periodos.

apartado: two internal ways out of social dilemmas

'the combined effect of these four frequently replicated, general findings represents a strong rejection of the predictions deirved from a complete model of rationality.' Existen otros dos hallazgos que contradicen lo predicho por los modelos tradicionales que nos indican como es posble conseguir resultados 'mejores que los racionales' (cosmides and tooby 1994): hablar un poco da confianza y permite llegar compromisos. en segundo lugar la capacidad para resolver dilemas sociales de segundo orden que modifican la estructura de los de primer orden.

apartado: communication and collective action.

se espera, en th de los juegos nocooperativos, que hablar no sirva de nada salvo para que para unos jugadores intenten convencer a otros de que cooperen para ellos traicionar. pero los cara a cara son significativos en la modificación de los resultados obtenidos por la economía experimental. Y es así en todos los tipos de dilemas sociales estudiados. El cara a cara es la variable que más incrementa los niveles de cooperación. Por ejemplo, comunicación a través de pc no funciona tan bien como el cara a cara. Explicaciones que se han dado:

(1) existe una transferencia de información de aquellos que comprenden cual es la estrategia óptima a aquellos que no.

(2) lo que intercambia es el compromiso mutuo.

(3) se incrementa la confianza por lo que las expectativas se ven afectadas.

(4) se añaden valores a la estructura de pagos subjetiva.

(5) refuerzo de valores normativos previos.

(6) desarrollo de la identidad de grupo.

ciertos experimentos parecen indicar que el intercambio de info no es la causa, -->> (1) no es válida, -->> (2), (3), (6) parecen ser las que hacen que la comunicación sea efectiva. Son muchos los modos de comprometerse, juramentaciones, y una gran variedad de procesos de refuerzo que permite la comunicación. Parece que afecta a la confianza mutua; siendo elementos fundamentales los compromisos condicionales y la reputación para una teoría de segunda generación de conducta racional limitada y moral.

el incremento en el montante de las apuestas y la dificultad de vigilancia de la conducta hace menos eficaz la comunicación. Se alcanzan niveles cuasi-óptimos cuando los sujetos poseen relativamente poco y tienen oportunidades para verse. Cuando las dotaciones se elevan la comunicación cara a cara se vuelve crucial (para evitar la tentación). Pero la comunicación no es suficiente, dado que no siempre produce cooperación óptima.

apartado: innovation and collective action.

Reproduzco: 'chaning the rules of a game or using scare resources to punish those who do not cooperate or keep agreements are usually not considered viable options for participants in social dilemmas, since these actions create public goods. Participants face a second-order social dilemma (of equal or greater difficulty) in any effort to use costly sanctions or change the structure of a game (oliver 1980). the predicted outcome of any effort to solve a second-order dilemma is failure.

Pero eso es lo que hacen los sujetos de los experimentos: implementan gran variedad de reglas que modifican la estructura de los juegos dependiendo de los resultados que va arrojando el juego. Esos cambios dependen de las circunstancias locales del desarrollo del juego y de convenciones culturales de las que son partícipes los jugadores. Pero existen, dentro de esa gran variedad, unas pautas que caracterizan esos acuerdos. Los régimenes de gestión del procomún más robustos incorporan mecanismos de vigilancia del cumplimiento de las reglas y de garantías de sanción. Estas sanciones suelen ser modestas, indicando que la misma tiene más que ver con el hecho de declarar públicamente que el comportamiento inadecado ha sido detectado. Los reincidentes sí que se suelen enfrentar a severas penalizaciones, generalmente la expulsión del grupo. Este tipo de reglas generan un efecto confianza en los participantes sobre el cumplimiento general de los acuerdos.

las reglas apropiadas se establecen mediante un proceso de prueba y error dada la complejidad del mundo. En entornos altamente impredecibles suele llevar más tiempo dar con las reglas apropiadas. Aquellos individuos con altos niveles de confianza contribuyen en mayor medida a la formación del procomún mientras que aquellos con bajos niveles contribuyen en mayor medida al fondo de castigo y poseen también el mayor nivel de cooperación (aportaciones al fondo común). Cuando los acuerdos sobre sanciones son discutidos cara a cara y votados el sistema conduce a resultados cuasi óptimos. (85% de coop con cara a cara, 93% cara a cara + voto x mayoría)... y el nivel de oportunismo bajó hasta el 4%. los costes fueron mínimos.

También habla de un estudio sobre la voluntad de cambiar estruturas institucionales cuando afrontan dilemas de recursos comunes. Los resultados indican que los individuos pillados en situaciones en las que han de resolver los dilemas sociales son capaces de afrontarlos y que el modelo teórico sobre la conducta de los individuos no se ajusta a la realidad. pero resulta que la th de juegos cooperativos tampoco ofrece una explicación mejor. Ambas predicen resultados extremos que no acaban por dar, por lo que no son buenas explicaciones de los niveles de cooperación, al suponerlos fijos se obvia una cuestión fundamental.

'The really big puzzle in the social sciences is the development of a consistent theory to explain why cooperation levels vary so much and why cooperation levels vary so much and why specific configurations of situational conditions increase or decrease cooperation in first- or second-level dilemmas. (¿No pasa a veces que lo que resulta extraño son los niveles de cooperación pese a estar siendo tangado?) [...] We need a second-generation theory of boundedly rational, innovative, and normative behavior.

Al partir de los modelos tradicionales de teoría de la elección y teoría de juegos en los que el dilema del prisionero resulta un callejón sin salida, el problema de la cooperación en la gestión de procomún es visto desde el punto de vista de la confianza (aquello que creemos que los otros van a hacer: ¿pero puede no suceder que lo que tenga sea una falta de confianza y pese a todo continúe cooperando? Los políticos roban pero sigo votando, quizás por la desconfianza y el miedo al cambio) que es la que explica que la cooperación pase a ser la estrategia racional. Además el cara a cara y los mecanismos de castigos tb ayudan. Sin embargo: existe cooperación aun que no se dé cara a cara ni castigos. Incluso en las condieciones más adversas.

apartado: Toward second-generation models of rationality. [!!!!!]

la primera generación de modelos es buena cuando la competencia es alta y aquellos jugadores que no maximizan los valores externos son botados del mercado. "consistent with all models of rational choice is a general theory of human behavior that views all humans as complex, fallible learners who seek to do as well as they can given the constraints that they face and who are able to learn heuristics, norms, rules, and how craft rules to improve achieved outcomes.'

* learning Heuristics, Norms, and Rules.

habla de algo muy similar a lo que dice Gigerenzer. Rules of thumb. Procesos de aprendizaje de como adoptar y usar normas y procesos de decisión; este proceso de valoración interna se representa mediante la introducción de lo que el equipo de ostrom ha dado en llamar 'delta parameter', un parámetro que es sumado o sustraído del coste objetivo de una acción.

"In addition to learning instrumental heuristics, individuals also learn to adopt and use norms and rules. By norms I mean that the individual attaches an internal valuation --positive or negative-to taking paticualr types of action. Crawford and Ostrom refer to this internal valuation as a delta parameter that is added to or substracted from the objective cost of an action. Andreoni models individuals who gain a 'warm glow' when they contribute resources that help others more than they help themselves in the short term. Kanck refers to negative internal valuations as 'duty'. Many norms are larned from interactions with others in diverse communities about the behavior that is expected in particular types of situations (Coleman 1987). The change in preferences represents the internalization of particular moral lessons from life (or from the training provided by one's elders and peers). The strength of the commitment (Sen 1977) made by an individual to take particular types of future actions (telling the truth, keeping promises) is reflected in the size of the delta parameter.

[referido al cara a cara, las cuestiones de la impersonalidad del mercado tanto en situaciones de competencia como de baja competencia. la consideración en la cooperación social de la mano invisible, de la relación de todo con todo].

"The distinction between internalized but widely shared norms for what are appropriate actions in broad types of situations and rules that are self-consciously adopted for use in particular situations is at times difficult to draw when doing fieldwork."

apartado:: Reciprocity: An Especially Important Calss of Norms.

[...] Humans appear to have evolved specialized cognitive modules for divers tasks, including making sense out of what is seen (Marr 1982) inferring rules of grammar by being exposed to adult speakers of a particular language (Pinker 1994), and increasing their long-term returns from interactions in social dilemmas (Cosmides and Tooby 1992). Humans dealt with social dilemmas related to rearing and protecting offspring, acquaring food, and trusting one another to perform future promised action millenia before such oral commitments could be enforced by external authorities (de Waal 1996). Substantial evidence has been accumulated (and reviewed in Cosmides and Tooby 1992) that humans inherit a strong capacity to learn reciprocity norms and social rules that enhance the opportunities to gain benefits from coping with a multitude of social dilemmas.

Reciprocity refers to a family of strategies that can be used in social dilemmas involving (1) an effort to identify who else is involved, (2) an assessment of the likelihood that others are conditional cooperators, (3) a decision to cooperate initially with others if others are trusted t be conditional cooperators, (4) a refusal to cooperate with those who do not reciprocate, and (5) punishment of those who betray trust. [Señala biblio: Becker 1990, Blau 1964, Gouldner 1960, Homans 1961, Oakerson 1993, V. ostrom 1997, Thibaut and Kelley 1959).

[enfoque de la investigación hacia la interacción espontánea pero siempre se olvidan de las relaciones de dominio, la obediencia, la pasividad :: Tb cuestión de la plasticidad y los pocos estudios en los efectos del trabajo monótono sobre la misma :: cómo afectan los procesos generadores de impersonalidad (no sólo son situaciones de no cara a cara, sino que en cierto sentido son ciegas, no posees toda la info sobre lo que ha pasado ni sobre la optimalidad del resultado) en las decisiones que tomamos :: enfoque de las capacidades. La libertad queda condicionada... y sin embargo esta es una cuestión que parece estar separada de la temática de la creencia (?) que, dice hayek, impregna todas las ciencias sociales como problema fundamental].

[...] The size of the population in which interactions are ocurring may need to be relatively small for reciprocating stretategies to survive potential errors of players.

[se enfatiza mucho el conocimiento personal, el cara a cara hace mucho, pero también la norma implícita. Además utiliza la palabra 'expectations' de una forma muy distinta a como se hace habitualmente en economía:]

[...] Human beings do not inherit particular reciprocity norms via a biological process. The argument is more subtle. Individuals inherit an acute sensitivty for learning norms that increase their own long-term benefits when confrnting social dilemmas with others who have learned and value similar norms. The process of growing up in any culture provides thousands of incidents (learning trials) whereby parents, siblings, friends, and teahcers provide the specific content of the type of mutual expectations [!!!!] prevalent in that culture. As mueller (1986) points out, the first dilemmas that humans encounter are as children. Parents reward and punish them until cooperation is a learned response. In the contemporay setting, corporate managers strive for a trustworthy corporate managers strive for a trustworthy corporate reputation by continuously reiterating and rewarding the use of key principles or norms by corporate emplyees.

[y ahora entra con el tema de el aprendizaje, en el que es de notar las cursivas y el caso de los individuos sin escrúpulos: estrategias dañinas... pero si aquí lo importante es lo que esperamos que otros hagan... lo que creemos que se debe hacer respecto a ellos]

Since particular reciprocity norms are learned, not everyone learns to use the same norms in all situations. Some individuals learn norms of behavior that are not so 'since.' Clever and unscrupulus individuals may learn how to lure others into dilemma situations and then defect on them. It is possible to gain substantial resources by such means, but one has to hide intentions and actions, to keep moving [que filosofía de la sospecha!!! el otro malo oculta intenciones, no coopera -- y sobre la desigualdad derivada de la legalidad establecida nothing], or to again access to power over others. In any group composed only of individuals who follow reciprocity norms, skills in detecting and punishing cheaters could be lost. [vaya argumento!!! tienes una habilidad respecto de alguien (detectar al malo) porque si sólo cooperamos puede venir alguien de fuera y jodernos] If this happens, it will be subject to invasion and substantial initial losses by clever outsiders or local deviants who can take advantage of the situation. [No explica el fenómeno de la explotación] Being too trusting can be dangerous. The presence of some untrustworthy participants hones the skills of those who follow reciprocity norms.

[...] In any population of individuals, one is likely to find some who use one of three [hay que ser perra porque el discurso de la cooperación a quien favorece es a los que tienen el poder, lo de la reciprocidad es para ellos] reciprocity norms when they confont a repeated social dilemma.

1. Always cooperate first; stop cooperating if others do not reciprocate; punish noncooperators if feasible.

2. Cooperate immediately only if one judges (aquí entra la belief) others to be trustworthy; stop cooperating if others do not reciprocate; punish noncooperators if feasible.

3. Once cooperation is established by others, cooperate oneself; stop cooperating of others do not reciprocate; punish noncooperators if feasible.

In addition, one may find at least three other norms.

4. Never cooperate.

5. Mimic (1) or (2), but stop cooperating if one can successfully free ride on others.

6. Always cooperate (an extremely rare norm in all cultures)

[lo poco que significa esto para mucha gente en gran parte de los empleos que existen: y el proceso, al ser un proceso de ahorro de trabajo o bajada de w la dinámica tiende a ser de confrontación. el dilema del que tiene trabajo, le bajan el salario, pero no puede dejar el empleo porque no tiene otra alternativa, o el del que no tiene ningún intercambio que hacer porque está excluído del sistema, si estas cosas de la cooperación son tan importantes para el desarrollo de nuestra humanidad, tan arraigadas en nuestra evolución como especie, ¿por qué tantos se ven sometidos a una modalidad tan pobre de interacción y a otros se les niega?]

Buscar este blog

C0R1F30

notas sobre racionalidad en Ostrom (muy largo)

Comentarios

Publicar un comentario

Entradas populares de este blog

The Green Night: do verde e o vermello.

Juego de Focos (RAP GAME)

La Excepción de Abilio a la Ley de la Demanda