SECCIÓN DE ÜBRAS DE CIENCIA Y TECNOLOGÍA
EL ORDEN OCULTO
Comité de Selección Dr. Antonio Alonso Dr. Francisco Bolívar Zapata
Dr. Javier Bracho Dr. Juan Luis Cifuentes Dra. Rosalinda Contreras Dr. Jorge Flores Valdés Dr. Juan Ramón de la Fuente Dr. Leopoldo (~arcía-Colín Scherer Dr. Adolfo Guzmán Arenas Dr. Gonzalo Halffter Dr. Jaime Martuscelli Dra. Isaura Meza Dr. José I~uis Morán Dr. Héctor Nava Jaüncs Dr. Nianuel Peimbert Dr. Ruy Pérez Tamayo Dr. Julio Rubio Oca Dr. .José Sarukhán Dr. Guillermo Soberón Dr. Elías Trahulse
Coordinadora María del Carmen Farías R.
Traducción:
JOHN H. HOLLAND
ESTEBAN TORRES ALEXANDER
EL ORDEN OCULTO De cómo la adaptación crea la complejidad
FONDO DE CULTURA ECONÓI\HCA
MÉXICO
Primera edición en inglés, Primera edición en español,
1996 2004
Holland,John H. El orden oculto/ John 11. Ilolland. - México: FCE, 2004 197 p.; 23 x 16 cn1 - (Colee. Sección de Obra~ de Ciencia y Tecnología) Título original: Hidden Order-Hnw Adaptation Builds Con1plexity ISBN 968-16-6835-9 l. Sistemas co1nplejos adaptables-Modelos matemáticos 2. i\_daptación (biología) - MÜdclos matemáticos 3. Algoritmos genéticos J. Ser TI. l
LC 1J217.H64 1996
Dewey 511.8
Título original:
Hidden Order -Ilow Adaplalion Build~ Cornplex-ily publicado por Basic Books / Perseus Books Group © 1995 John H. Holland ISBN 0-201-40793-0 (empastado) 0-201-44230-2 (rústica)
Se prohíbe la reproducción total o parcial de esta obra -incluido el diseño tipográfico y de portada-, sea cual fuere el 1nedio, electrónico o 1necánico, sin el consentimiento por escrito del editor. Agradecen1os sus comentarios y sugerencias al correo electrónico
[email protected] Conozca nuestro catálogo en http: / /'i'"11N"W. fondodeculturaeconomica. com
D.R. ©, 2004, FOKDO DE CULTCRA ECONÓMICA Carretera Picacho-1\jusco 227, 14200 México, D.F.
CICLO DE CONFERENCIAS ULAM EL PRESENTE LIBRO es el primero de una serie basada en las conferencias dedicadas a la memoria de Stanislaw M. Ulam, un gran matemático de la ahora legendaria Escuela Polaca de Matemáticas. Impartidas en el Santa Fe Institute (Instituto Santa Fe) de Santa Fe, Nuevo México, estas conferencias anuales han sido dictadas por profesores invitados y patrocinadas conjuntamente por el instituto y la compañía editora Addison-Welsey. Ulam llegó a Estados Unidos contratado por el Institute for Advanced Study en 1935; posteriormente trabajó en las universidades de Harvard, Wisconsin y, tiempo después, eri la de Colorado. Pero lo más interesante es que fue precisamente en el año de su fupdación cuando se integró al equipo del National Laboratory de Los Angeles, donde se convirtió en una fuerza intelectual y en fuente de inspiración desde 1944 hasta su muerte, ocurrida en 1984. Durante su estancia en esa institución fomentó una intensa interacción entre las matemáticas y la ciencia. Como matemático, Stanislaw Ulam estuvo a la altura de personajes tales como Kuratowski, Mazur, Banach, Von Neumann y Erdos, y su trabajo tuvo gran repercusión en ese campo. Además fue un científico con una gran variedad de intereses, que trabajó con otros grandes hombres de ciencia de su tiempo. Entre los tópicos en los que él y sus colaboradores hicieron trabajos fundamentales están: el método Monte Cario, sistemas dinámicos no lineales de simulación por computadora, procesos termonucleares, propulsión espacial, métricas para secuencias biológicas, autómatas celulares y muchos más. La lista de sus amigos y colaboradores científicos incluye a muchos de los mejores cerebros del siglo xx. El interés de Ulam en la ciencia no conocía fronteras, y su enfoque hacia ella era verdaderamente interdisciplinario. Al respecto, su esposa, Francoise Ulam, decía: "Stan era una especie de hombre-orquesta en el Santa Fe Institute". A Ulam le hubiera encantado la atmósfera interactiva e interdisciplinaria del instituto, y hubiera contribuido mucho a incrementarla. Es una pena para nosotros que él muriera unos días antes de la fimdación oficial del Santa Fe Institute.
ISBN 968-16-6835-9 In1preso en México • Prinled in J\1exico
L. M. S!MMONS,JR. Vicepresidente de Asuntos Académicos Santa Fe Institute 7
PRESENTACIÓN Es UN GRAN HONOR estar aquí esta noche para celebrar con ustedes el décimo aniversario de la fundación del Santa Fe Institute. Quiero expresar mi agradecimiento y mi aprecio a su fundador, mi buen amigo George Cowan, a sus directores, Ed Knapp y Mike Simmons, y a todas las personas que participaron en la creación de esta nueva serie de conferencias del instituto en memoria de mi finado esposo. A aquellos que no conocieron a Stan Ulam, permítanme decirles sólo una o dos palabras sobre él. En cierto sentido, debido a la naturaleza interdisciplinaria de sus investigaciones, Stan fue una especie de hombre orquesta del instituto. Pero eso sucedió hace mucho tiempo, cuando esta expresión apenas se acababa de acuñar. Si Stan aún estuviera vivo seguramente le encantaría la estructura informal del instituto, porque él tenía en poco aprecio las trampas de la burocracia y de la autoridad. Se vanagloriaba diciendo que al único comité al que había pertenecido era el Comité de Catadores de Vino de los Junior Fellows de Harvard. En Los Álamos, él y Carson Mark, director de la División Teórica, en una oportunidad provocaron gran confusión en el laboratorio por haber escrito y hecho circular un memorándum en el que se enlistaban los números del uno al cien en orden alfabético, "para una rápida y fácil referencia". En otra ocasión, cuando fue promovido a jefe de grupo, estaba muy contento porque sólo era jefe de sí mismo, ya que al principio era el único miembro de su grupo. Como ven, Stan era un hombre muy bromista. Incluso nunca consideró que pensar era un trabajo, sino más bien un juego. Solía jugar con las ideas n1atemáticas e inventaba juegos tnatemáticos. También se deleitaba enormemente jugando con palabras. Seguramente el ingenioso título de la conferencia de esta noche, "La complejidad simplificada", le hubiera complacido mucho, porque encierra el tipo de paradojas que le gustaban. Después de esta breve semblanza cedo el lugar al siguiente orador, John Holland, quien nos explicará en términos sencillos todo acerca de los sistemas complejos. Palabras de Fran~oise Ulam durante la inauguración de las Conferencias Ulam 9
A veces pienso que una explicación más racional para todo Jo que me ha sucedido durante la vida es la de que aún tengo trece años de edad y estoy leyendo a Julio Veme o a H. G. Wells, y me he quedado dormido. STAN1SJ.A\V ULAM,
Aventuras de un matenzático, 1976.
El ho1nbre que tenía el récord más alto de agudeza mate1nática, el hombre que podía derrotar a los ingenieros en su propio juego, que podía evaluar personas y circunstancias en un instante, era miembro de una profesión totalmente extinta: la de los profetas. GIAN GARLO ROTA,
En memoria de Stanisla\v U1am
PREFACIO
EN OTOÑO DE 1993, Ed Knapp, presidente del Santa Fe Institute, y Jack Repcheck, entonces jefe de redacción de Helix Books de Addison-Welsey, se acercaron a mí con una propuesta: ¿Estaría dispuesto a inaugurar el Ciclo de Conferencias Ulam? El ciclo de conferencias se llevaría a cabo anualmente, en honor del renombrado matemático del siglo XX Stanislaw Ulam, y estarían dirigidas a un auditorio no especializado, pero interesado en temas científicos; posteriormente serían ampliadas e impresas en un libro, con el fin de dejar un registro perpetuo de ellas. Aun cuando participo activamente en muchas actividades del instituto, esta propuesta me tomó por sorpresa. Al principio sentí cierta aprensión, debido a que disponía de poco tiempo (las conferencias se impartirían durante el primer semestre de 1994; además, debería presentar un original para su publicación a fines del verano de ese mismo año). No obstante, había algunos incentivos. El incentivo de más peso era mi gran admiración por el trabajo y el talento de algunos científicos contemporáneos, particularmente de John von Neumann, Ronald Fisher y Robert Oppenheimer. Durante el seguimiento de las múltiples facetas del trabajo de Von Neumann, repetidas veces me crucé con el nombre de Stanislaw Ulam, en contextos muy cercanos a mis principales intereses. Fue así como empecé a interiorizarme en su trabajo, y también fue el principio de una creciente afinidad con el enfoque científico de Ulam, una afinidad que se amplió considerablemente cuando leí su libro, Aventuras de un matemático ( 1976). Incluso durante un tiempo estuve convencido de que Stanislaw Lem, escritor polaco de ciencia-ficción a la altura de H. G. Wells, era el seudónimo de Stan Ulam. Cuando me ofrecieron una beca de un año en el National Laboratory de Los Álamos, como asistente de Ulam, Ja oportunidad de conocer el lugar que había sido el escenario de muchos de los logros de su carrera constituyó uno de los principales motivos de mi aceptación. Fue la única ocasión en que lo traté. Más tarde, cuando Francoise Ulam donó la biblioteca privada de Stan al Santa Fe Institute, me sentí muy contento al enterarme de la cantidad de títulos que teníamos en común. Afa bibliotheque, e 'est moi. Estos mismos pensamientos influyeron poderosamente en mi decisión de aceptar este compromiso. Cuando empecé a pensar seriamente sobre lo que tenía encomendado, comencé a considerar estas confeII
12
EL ORDEN OGGLTO
PREFACIO
rencias como una oportunidad extraordinaria para hacer explícito el patrón que subyacía bajo las intuiciones e ideas que habían estado guiando rr1is investigaciones desde mis días de estudiante universitario. El hecho de que además tendría que escribir para un auditorio mayor me forzaría a luchar por ser más conciso y cohert;nte, lo c11al no siempre ocurre cuando se realiza un trabajo técnico. Ese era un reto difícil de ignorar. A lo anterior había que agregar que acababa de construir mi refugio en la costa norte del lago Michigan, lugar diseñado especialmente para hacerme más fácil esa clase de esfuerzo. ¡Qué gran ocasión para inaugurarlo! Pero también había otras razones, incluyendo un atractivo financiamiento; no obstante, estas razones no tuvieron tanto peso en mi decisión. Este libro se centra en un tema que ha atraído mucho la atención en los últimos tiempos: la complejidad. Stan Ulam hizo muchas observaciones acerca de la complejidad, utilizando la palabra repetida y cuidadosamente mucho tiempo antes de que el tema se popularizara o siquiera fuera mencionado. Muchos de los temas presentados aquí fueron prefigurados en los comentarios de Ulam. Al escribir este libro me he concentrado en ese aspecto de la complejidad que se centra en la adaptación, un área conocida actualmente como el estudio de los sisternas cornplfjos adaptables (SCA). Considero, como se comprobará al leer este libro, que la adaptación da lugar al surgimiento de una clase de complejidad que obstaculiza considerablemente nuestros intentos por resolver los más importantes problemas que actualmente enfrenta nuestro mundo. No he intentado realizar una revisión exhaustiva del trabajo valioso que se ha hecho sobre los SCA, ni he tratado de criticar otros enfoques al respecto; en vez de esto, he dedicado todos mis esfuerzos a producir un panorama coherente de una disciplina de reciente aparición. El producto final es ciertamente idiosincrásico, aun cuando pienso que muchos de mis colegas del Santa Fe Institute coincidirán con mis puntos de vista. Además de tratar de ofrecer un panorama global ordenado, también he tratado de comunicar qué sentimientos motivan a un científico cuando intenta desarrollar una nueva disciplina. "Hacer ciencia", particularmente hacer una síntesis de ideas dispares, no es un a"iunto tan arcar10 corno frecuentemente se hace creer al público. La disciplina y el olfato desempeñan un papel vital; sin embargo, esto es familiar para cualquiera que haya intentado ser creativo. Los puntos de vista presentados aquí han sido madurados a través de un intercambio continuo con dos grupos que han desempeñado un papel central en mi desarrollo científico. Mi más prolongada afilia-
ción ha sido con el grupo BACH, * de la Universidad de Michigan (los miembros actuales de este grupo son: Arthur Burks, Robert Axelrod, Michael Cohen,John Holland, Car] Simon y Rick Riolo). Los integrantes de esta sociedad nos hemos reunido regularmente durante más de dos décadas, y cuatro de los miembros actuales han sido activos participantes desde el principio. BAC!l es un grupo altamente interdisciplinario (representa a cinco departamentos) y totalmente informal, por Jo que no aparece en el organigrama de la universidad. Aunque no de manera sistemática, casi todas las ideas incluidas en este libro han sido discutidas previamente por el grupo BACH. El segundo grupo que ha desempeñado un papel central en la formación de mis conceptos es, por supuesto, el personal del Santa Fe Institute (sFI). Aun cuando mi asociación con el SF1 es más reciente que la del grupo RACH, no es menos importante. Este instituto alimenta una profunda interdependencia científica, más efectiva que cualquier otra organización que haya conocido. Cuando era estudiante universitario pensaba que el tipo de interacción que fomenta el instituto sería la "crema y nata" de la actividad científica; pero esto rara vez es cierto. En una universidad estándar la mayor parte del tiempo lo consumen las actividades de los comités consultivos o de administración y las negociaciones interdepartamentales, así como los programas de cooperación intercolegial para las actividades interdisciplinarias propuestas. A esto hay que agregar las actividades de enseñanza y preparación de publicaciones, y con esto ya podrá calcular el poco tiempo que resta para las exploraciones interdisciplinarias. En cambio, el SFI proporciona en forma consistente lo que es difícil de obtener en el ambiente de una universidad: la oportunidad para realizar investigación interdisciplinaria de manera sostenida. El instituto nació gracias al interés y al cuidadoso trabajo organizacional de George Cowan, quien poco tiempo después dispuso de la colaboración de un consejo consultivo de científicos dispuestos tanto a proponer como a escuchar. Esta misma historia ha sido contada también en el libro de Mich Waldrop, Cornplejidad, publicado en 1992, así que no la repetiré. Basta decir que el SF1 proporciona un ambiente científico que se acerca mucho al ideal al que yo aspiraba en mis tiempos de estudiante. El hecho que finalmente me convenció de asociarme con el SFT fue la invitación que me hizo Doyne Farmer para dar una charla en una de las conferencias anuales del Centro de Estudios No-lineales del National Laboratory de Los Álamos. Fue en esa conferencia donde conocí a Murray Gell-Man, un gran amigo y un crítico por excelencia, quien *Siglas de Burk, Axelrod, Cohcn y Holland. [N. del E.]
13
EL ORDEN OCULTO
PREFACIO
más tarde me invitó a unirme al consejo consultivo del SFI. Así, al tratar de enfrentar las normas de claridad de Murray en mis explicaciones, me he visto obligado repetidamente a afinar mis ideas sobre los SCA, intentando reforzar sus fundamentos y ampliando su aplicabilidad. Por supuesto, Murray no es la única persona del SFI que ha influido en mi trabajo -la lista es demasiado larga y ya fue incluida en el libro de Waldrop-, pero pienso que es justo decir que ninguna otra interacción de trabajo ha constituido un reto de tal magnitud. La MacArthur Science Foundation ha apoyado mi trab'!jo consistentemente durante varias décadas: primero, cuando formé parte del Logic of Computers Group de la Universidad de Michigan, con Arthur Burks como investigador principal. Años más tarde, cuando Burks y yo nos convertimos en coinvestigadores principales, me brindó nuevamente su apoyo. A propósito de Art Burks, recuerdo que cuando yo era un joven miembro del personal de la Universidad de Michigan, él utilizó su prestigio para encaminarme por los senderos que no formaban parte de las rutas tradicionales de la universidad. Ha sido para mí un amigo cercano y lln mentor durante casi cuarenta años. Recientemente me eligieron como miembro de la MacArthur Foundation, y fueron Murray Gell-Man y su esposa, Marcia, quienes me informaron que había recibido ese honor (y sí, fue un escándalo cuando me llamaron). Realmente no hay manera de describir el sentimiento de libertad y de júbilo que acompaña a tal premio. Para bien o para mal, la seguridad financiera que implica me ha estimulado para dar pasos cada vez más riesgosos en el área de la investigación. Las decisiones acerca de los proyectos a largo plazo cuyos beneficios son inciertos, tales como la decisión de escribir este libro, se hacen más fáciles. Sería imperdonable dejar de mencionar la presentación de Francoise Ulam para estas conferencias. Por supuesto que usted puede leer sus propias palabras al principio de este libro; sin embargo, las palabras escritas sobre un papel no pueden tener la gracia de su discurso oral. Conocí a Francoise en la reunión de recepción que precedió a las conferencias, cuando teníamos suficiente tiempo para una conversación prolongada. Su encanto e inteligencia crearon inmediatamente un ambiente de vivacidad y calor en un salón lleno de conversaciones. Es fácil ver el porqué de su influencia en todas las facetas de la vida personal y de investigador de Stan Ulam, un hecho que el propio Ulam repite continuamente en su autobiografia. He dejado a mi esposa, Maurita, para el final de este prefacio. Ella ha sido el prototipo del profano inteligente interesado en la ciencia. Me ha ayudado de muchas maneras, y no sólo proporcionándome apoyo y aliento. Por ejemplo, fue Maurita quien me sugirió el nombre
de "Echo" para los modelos de la SCA descritos en este libro. Tamhién leyó los capítulos de la obra muchas veces. Aunque probablemente está más dispuesta que el lector promedio a aceptar mis buenas intenciones, Maurita ha sido en todo lo demás una afectuosa e imparcial crítica. Si este libro muestra un poco de claridad y se salva de la verborrea, probablemente se deba a las sugerencias de ella.
14
15
jOHN HOLLAND
Fridhem Gulliver, Michigan Abril de 1995.
I. ELEMENTOS BÁSICOS
en Nueva York, Eleanor Petersson acude a su tienda favorita a comprar un tarro de arenques en salmuera. Ella está plenamente convencida de que los arenques estarán allí. En verdad, los neoyorquinos de todas clases consumen vastas cantidades de comida de todo tipo sin preocuparse de que alguna vez pudiera suspenderse el suministro. Y esto no sólo ocurre con los neoyorquinos: los habitantes de París, Delhi, Shangai y Tokio esperan lo mismo. Parece cosa de magia que en todas partes esto se dé por descontado. Sin embargo, estas ciudades no tienen comisiones de planeación central que se encarguen de resolver los problemas del suministro y distribución de alimentos. Tampoco mantienen grandes reservas de mercancías para mitigar las fluctuaciones. Sus reservas de alimentos durarían menos de una semana si fueran cortados repentinamente los suministros. ¿Cómo evitan estas ciudades la sobreoferta y la escasez año tras año y década tras década? El misterio se profundiza cuando observamos la caleidoscópica naturaleza de las grandes ciudades. Compradores, administradores, calles, puentes y edificios están en cambio continuo, así que la coherencia de la ciudad es algo impuesto de alguna manera sobre un flujo constante de personas y estructuras. Igual que Ja ola estacionaria que se forma frente a una roca colocada en medio de un torrente de rápido movimiento, la ciudad puede considerarse como un patrón estable en el tiempo. Ninguno de sus constituyentes permanece estático en su lugar; no obstante, la ciudad persiste. ¿Qué es lo que permite a las ciudades retener su coherencia a pesar de las continuas funciones y la falta de una admi11istración central? Hay algunas respuestas tipo para esta pregunta, pero realmente no resuelven el misterio. Se puede decir que es la "mano invisible" de Adam Smith, el comercio o las costumbres lo que mantiene la coherencia de la ciudad; sin embargo, todavía debemos preguntar: ¿Cómo? Otros patrones estables en el tiempo muestran enigmas similares. Por ejemplo, si nos trasladamos al nivel microscópico encontramos otra comunidad todavía más complicada que la de la ciudad de Nueva York: el sistema inmune humano, que es una comunidad constituida por un gran número de unidades altamente móviles, llamadas anticuerUN DÍA COMO CUALQUIER OTRO
17
EL C>RDEN OCUl:l'()
BÁSICOS
pos, los cuales repelen continuamente o destruyen oleadas de invasores siernpre cambia11tes, llan1ados ant(r;enos. Los ir1vasores -principalmente bioql1Ímicos, bacterias y vir11s- se presentan en infinitas variedades, tan diferentes entre sí como los copos de nieve. Debido a esta variedad, y a que siempre están aparecie11do nuevos ir1vasores, e1 sistema inmune no puede simplemente hacer una lista de los posibles invasores y prepararse para combatirlos; debe cambiar o adaptar (del latín adaptare) a sus anticuerpos para enfrentar a los nuevos invasores que vayan apareciendo y nunca establecer una configuración fija. A pesar de su naturaleza proteínica, el sistema inmune mantiene una impresionante cohere11cia. En verdad, nuestro sistema inmune es lo suficientemente cohere11te con10 para derr1ostrar i1uestra identidad de manera científica; es tan bueno para distinguirnos del resto del mundo, que rechazará la introducción de células provenientes de otro ser hun1ar10 a nuestro organismo. (~orno consec11er1cia, irrcluso el trasplante de piel proveniente de nn pariente requiere tomar medidas extraordirrarias. ¿Cómo desarrolla el sistema inmune su exquisito sentido de identidad y qué hace vulnerable esa inmunidad? ¿Cómo se las arregla una enfermedad como el sida para destruir esta identidad? Podemos decir que las identificaciones y las malas identificaciones son un producto de la adaptación, pero el "cómo" de este proceso de adaptación está muy lejos de ser obvio. Tratar de comprender la persistencia y operación de estas dos complejas comunidades es más que una cuestión académica. Problemas acuciantes, como la prevención de la decadencia de las ciudades y el control de enfermedades corno el sida poclríar1 resolverse si se' comprendiera rnejor este proceso. Además, l111a vez que miremos hacia esa dirección, veremos que existen otros sisten1as con1plcjos que ameritan preguntas similares, cuya respuesta también está relacionada con problemas de largo alcance. Consideremos el sistema nervioso central (SNC) de los mamíferos. Con10 el sistema ir1mune, el SNC está constit1iido por t1n gran núrhero de células, llamadas neuronas, que adquieren multitud de formas. Incluso un S:'>!C simple consta de miles de millones de neuronas, de centenares de tipos diferentes, y cada neurona está en contacto directo con otros cientos, e incluso con miles, de cél11las nerviosas, formando una red de trabajo compleja. Pulsos de energía recorren esta red produciendo el "telar encantado" de Sherrington (1951 ). Esta red es similar al sistema inmune, con un agregado de identidad emergente que aprende rápidamente y con gran facilidad. Aun cuando la actividad de una neurona individual puede ser compleja, está claro que el compor-
tamiento de la identidad agregada del SNC es mucho más compleja que la suma de estas actividades individuales. El comportamiento del sistema nervioso central depende de las interacciones mucho más que de las acciones. El 11úmero total de interacciones -centenares de millones de neuronas, cada una realizando n1iles de in.teracciones simultáneas en una milésima de segundo- nos lleva mucho más allá de nuestras experiencias con máquin_as. En comparación, la más sofisticada computadora parece apenas algo más que un ábaco automático. La miríada de interacciones, modificadas por los cambios aprendidos, produce la habilidad única de los cánidos, los felinos, Jos primates y otros mamíferos para anticiparse a las consecuencias de sus accior1es por medio de la modelación (la capacidad de hacer un modelo mental) de sus mundos. Después de más de un siglo de esfuerzos intensos, todavía no somos capaces de modelar muchas de las capacidades básicas de los SNC. No podemos modelar su capacidad para analizar escenas complejas poco familiares y convertirlas en elementos familiares, para no hablar de su capacidad para construir modelos internos basados en Ja experiencia. La relación entre los diversos SNC y los fenómenos que nosotros llamamos concie11cia es casi desconocida, es lin misterio que nos deja con pocos lineamientos para el tratamiento de las enfermedades mentales. I.,os ecosistemas comparten muchas de las características y enigmas que presenta el sistema i11munc. Los ecosistemas muestran la misrna sorprendente diversidad. Todavía tenemos que calcular de manera aproximada el número de organismos que se encuentran en un metro cúbico de suelo templado, para no bablar de la increíble cantidad de especies que existe en un bosque tropical. Los ecosistemas están fluyendo continuamente, y presentan una maravillosa panoplia de interacciones, con10 el mutualismo, el parasitismo, carreras armamentistas biológicas y mimetismo (de lo cual hablaremos más adelante). Materia, energía e información se mezclan en ciclos complejos. Y una vez más el todo es más que la suma de las partes. Aun cuando tenemos un catálogo de las actividades de la mayoría de las especies participantes, estamos lejos de comprender el efecto de los cambios en los ecosistemas. Por ejemplo, la estupenda riqueza del bosque tropical contrasta cou la pobreza de su suelo. Este bosque sólo puede mantener su diversidad por medio de un complejo conjunto de interacciones que reciclan una y otra vez los nutrientes esparcidos a través del sistema. Mientras no tengamos una comprensión clara de estas complicadas y cambiantes interacciones, n11estros intentos por equilibrar la extrae-
18
19
20
EL ORDEN OCULTO
BÁSICOS
ción de Jos recursos de los ecosistemas para que no se afecte la sustentabilidad de éstos serán, en el mejor de los casos, ingenuos y, en el peor, desastrosos. Por otra parte, nosotros los humanos so111os ya tan numerosos, que por fuerza modificamos extensamente las interacciones ecológicas, y lo más grave es que sólo poseemos ideas vagas de las consecuencias a largo plazo de estas accio11es. Sin embargo, nuestro bier1estar, e incluso nuestra supervivencia, dependen de que seamos capaces de utilizar estos ecosistemas sin destruirlos. Los intentos de convertir los bosques tropicales en tierras de labranza o de pescar en las plataformas continentales más "eficientemente" sólo son síntomas de problemas que año con año se vuelven más serios. Muchos otros sistemas complt:jos también mantienen su coherencia frente a los cambios, y ya podemos comenzar a extraer algunos de los denominadores comunes a todos ellos (más adelante examinaremos los sistemas adicionales bajo esta luz). Actualmente ya sabemos, por ejemplo, que Ja coherencia y persistencia de cada sistema dependen de una gran cantidad de interacciones, la agregación de diversos elementos y de la adaptación o el aprendizaje. También hemos observado que varios problemas complejos de la sociedad contemporánea -la decadencia de las ciudades, el sida, las enfermedades mentales y el deterioro ecológico- persistirán hasta que desarrollemos una mejor comprensión de la dinámica de estos sistemas. Veremos que la economía, el Internet y los embriones en desarrollo representan retos similares -balances comerciales, virus de computadora y defectos congénitos, por ejemplo-, y probablemente encontraremos otros. Aun si estos sistemas complejos difieren en detalles, la cuestión de la coherencia bajo acoso constituye el principal enigma de cada uno. Este factor común es tan importante que en el Santa Fe lnstitute clasificarnos todos estos sistemas bajo un encabezado común: sistemas complejos adaptables (scA). Esto es algo más que una nueva terminología; nos obliga a buscar los principios generales que rigen el comportamiento de los SCA, principios que indiquen las distintas maneras de resolver los problemas concomitantes. La cuestión es extraer dicl1os_ principios generales. Esta cuestión es nueva, por lo que el presente libro sólo puede empezar a bosquejar un mapa de este territorio. Gran parte del mapa consistirá en regiones de terra incognitia y abundará en letreros que dirán: "Aquí existen monstruos". No obstante, ya hemos ido suficientemente lejos para hacer algo más que comparaciones. En este primer capítulo podemos observar algunos de los accidentes geográficos más prominentes y estimar qué clase de aparato conceptual se necesitaría para ampliar nuestra comprensión de los sistemas complejos adaptables.
ÜBJETIVOS
21
El propósito de este libro es explorar las distintas maneras en las que nuestras intuiciones acerca de los SCA pueden ser transformadas en conocimientos más profundos. En este intento la teoría es crucial. La casualidad puede ocasionalmente revelar un secreto, pero es improbable que esto nos suceda con frecuencia. Sin una teoría, no realizaremos más que interminables inctlrsiones en territorios no cartografiados. En cambio, si contamos con una teoría, poderr1os separar las características fundamentales de las peculiaridades casuales. La teoría proporciona hitos y señalamientos y nos indica qué observar y dónde actuar. Una pieza específica de comprensión que la teoría podría proporcionar es un método bien sustentado para localizar los "puntos de apalancamiento" en los SCA. Muchos SCA tienen la propiedad de sufrir grandes cambios cuando se les introducen pequeñas perturbaciones (efecto amplificador). Un ejemplo conocido de esto son las vacunas. La introducción a nl1estro torrente sanguíneo de una pequeña cantidad de antígenos debilitados o incapacitados -virus del sarampión, por ejemplo- puede estimular al sistema inmune a producir suficientes anticuerpos para hacernos completamente inmunes a esa enfermedad. La vacuna "apalanca" al sistema inmune y lo obliga a aprender sobre la enfermedad que lo amenaza. También sabemos acerca de otros puntos de apalancamiento en otros ScA, pero hasta la fecha no tenemos un método general para investigarlos. La teoría es nuestra mejor esperanza para encontrar tal método. Formular una teoría para los SCA es más que difícil, debido a que el comportamiento de un SCA es más complejo que la suma simple de los comportamientos de sus partes. Además, hay abundancia de no-linealidades en los SCA (más adelante ampliaremos este concepto). La no linealidad significa que nuestras herramientas más útiles para generalizar las observaciones y convertirlas en una teoría -análisis de tendencias, determinación de equilibrios, medios de muestreo, etc.quedarán totalmente desafiladas. La mejor manera de compensar esta pérdida es haciendo comparaciones interdisciplinarias del SCA, con Ja esperanza de extraer características con1unes. Con paciencia y discernimiento podremos convertir esas características comunes en bloques de edificación para construir una teoría general. Las con1paraciones cruzadas proporcionan otra ventaja: las características que son sutiles y difíciles de extraer de un sistema, pueden ser conspicuas y fáciles de examinar en otro. Este capítulo trata acerca de siete características q11e
EL ORDEN OCLTLTO
sAsrcos
las comparaciones cruzadas interdisciplinarias sugieren que son fundamentales para ampliar nuestra comprensión de los scA. En los subsecuentes capítulos se tejerá11 clichas características para convertirlas en los elementos de una teoría.
agentes como determinado por un conjunto de reglas o normas. Las reglas del estímulo-respuesta son típicas y simples: si ocurre un estimulo s, ENTONCES dé una respuesta r; si cae el mercado, ENTONCES venda, etc. Para definir el conjunto de todas las posibles reglas de estímulo-respuesta para un agente dado, debemos describir los estímulos que ese agente puede recibir y las respuestas que puede dar (véase la figura I.2).
22
AGENTES, META-AGENTES Y ADAPTACIÓN Antes de comenzar con una descripción de las características mismas, quisiera decir algo más acerca del escenario general. Los SCA están constituidos, sin excepción, por gra11des números de elementos activos que, como lo hemos visto en los ejemplos anteriores, son diversos tanto en formas como en habilidades (véase la figura I.l). Pensemos en el gran conjunto de empresas de Nueva York o en los exquisitamente especializados anticl1erpos de un sistema inmune. Para referirme a los elementos activos sin invocar contextos específicos, he tomado prestado de las ciencias económicas el término "agente)). Este término tiene las ventajas de ser muy descriptivo y de evitar prejuicios.
23
§]estímulo~ respuesta
AGENTE AGREGADO '
La conducta depende de las interacciones de los agentes componentes en la red. Los agentes agregados pueden agregarse nuevamente para añadir nuevos niveles jerárquicos
' '. ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' '
Desempeño (una sucesión de acontecimientos E-Rl
AGENTE ADAPTABLE
FIGURA
FIGURA
1.1. Sisle'ma com,plejo adaptable.
Si queremos comprender las interacciones de grandes números de agentes, primero debemos ser capaces de describir las habilidades de los agentes individuales. Es útil considerar el comportamiento de los
1.2. Agerite basado en reglas.
Aun cuando las reglas estímulo-respuesta tienen un alcance limitado, hay maneras simples de expandir este alcance. De hecho, incluso con cambios menores, el alcance puede extenderse suficientemente para que multitud de reglas puedan generar cualquier comportamiento susceptible de ser descrito por computadora. En la definición de estas reglas, no es nuestra intención afirmar que podemos localizarlas explícitamente en los agentes reales. Las reglas son simplemente una manera conveniente de describir las estrategias de los agentes. En el si-
24
25
EL ORDEN OClJLTO
BÁSICOS
guiente capítulo me extenderé más sobre este enfoque basado en reglas para explicar el comportamiento los agentes. Por ahora nos cor1cretaremos a tratarlo como un artificio de descripción. La mayor parte del esfuerzo de modelación para cualquier SCA se centra en seleccionar y representar los estímulos y las respuestas, debido a que los comportamientos y las estrategias de los agentes componentes son determinados por dichos estímulos y respuestas. Para los agentes del SNC (las neuronas), los estímulos podrían ser los pulsos que llegan a la superficie de cada neurona, y las respuestas podrían ser los pulsos de salida. Para los agentes del sistema inmune (los anticuerpos), los estímulos podrían ser las configuraciones moleculares de las superficies de los antígenos invasores, y las respuestas podrán ser las adherencias que diferencian las superficies de dichos antígenos. Para los agentes de la economía (empresas), los estímulos podrían ser las materias primas y el dinero, y las respuestas serían las me_rcancías producidas. Podríamos hacer selecciones similares para todos los demás scA. En cada caso, la palabra "podríamos" es adecuada, debido a que son posibles otras selecciones, ya que diferentes selecciones ponen énfasis en diferentes aspectos de cada SCA, produciendo diferentes modelos. Esto no tiene riada que ver con lo correcto o lo incorrecto (aun cuando los modelos pueden ser concebidos deficientcmente), sino con los aspectos que están siendo investigados. Una vez que especifiquemos el rango de algunos de los posibles estímulos y el conjunto de respuestas permitidas para un agente dado, habremos detenninado las clases de~ reglas que pueden tener los agentes. Ento11ces, por medio de la observación de estas reglas actuando en secuencia, pod,remos describir los comportamientos que puede adoptar el agente. Este es el punto en el que entra a la escena el aprendizaje o la adaptación. En el establecimiento de una lista de conceptos básicos, podríamos pensar que es natural colocar a la "adaptación" al principio de la lista, debido a que la adaptación es una condición sine qua non. Sin embargo, el tema de la adaptación es tan amplio, que ocupará casi todo el resto de este libro. El presente capítulo se centra en las características más específicas de los SCA, por lo que aquí sólo agregaré unas pocas palabras sobre la adaptación y comentaré más ampliamente el tema en el próximo capítulo. En biología, la palabra "adaptación" se define como el proceso por medio del cual un organismo se amolda a su medio ambiente. En términos aproximados, la experiencia guía los cambios en la estructura del organismo de manera que, con el paso del tiempo, éste hace mejor uso del medio ambiente para alcanzar sus propios fines (véase la figura I.3). Aquí expandimos el rango del término "adaptación" para in-
cluir el aprendizaje y los procesos relacionados con éste. Con esta expansión de su significación, podemos decir que la adaptación se aplica a todos los agentes de los SCA, a pesar de las diferentes escalas de tiempo aplicables a cada uno de ellos. Como puede verse en la figura 1.3, las escalas de tiempo varían considerablemente. Los cambios de adaptación e11 las neuronas individuales del sistema nervioso tienen lugar en intervalos que fluctúan entre unos segundos y unas horas; los cambios en el sistema inmune requieren de unas horas a varios días; los cambios de adaptación de las empresas comerciales toman varios meses o algunos años; fi11almente, los cambios en los ecosistemas pueden durar desde algunos años hasta milenios. Pero aun así los mecanismos involucrados en todos estos casos tienen mucho en común, una vez que se descuenta el factor tiempo. Hay un marco de trabajo general que apoya este extenso uso del termino (véase Holland, 1992), pero por ahora no necesitamos ese nivel de detalle. Cada vez que sea necesario, a todo lo largo del libro se introducirán partes de este marco de trabajo. En conclusión, en términos generales consideramos a los SCA_ co1110 sistemas compuestos por agentes interactuantes descritos en términos de reglas. Estos agentes se adaptan cambiando sus reglas cuando acumulan experiencias. En los SCA la mayor parte del medio ambiente de cualquier agente adaptable está constituido por otros agentes adaptables, de manera que una porción de los esfuerzos de adaptación de cualquier agente es utilizada para adaptarse a otros agentes adaptables. Este rasgo constituye un fundamento importante de los patrones temporales complejos que generan los SCA. Para comprender los SCA debemos comprender estos patrones siempre cambiantes. El resto del libro está dedicado a desarrollar tal comprensión completando este somero bosquejo y agregando algunos detalles, contenidos y piezas relevantes de la teoría.
Los SIETE
BÁSICOS
Los siete conceptos básicos (que de aquí en adelante denominaremos simplemente "básicos") se refieren a cuatro propiedades y tres mecanismos que son comunes a todos los SCA. Estas propiedades y mecanismos no son los únicos básicos que se podrían seleccionar de una lista de características comunes, ya que el proceso mismo de selección es, hasta cierto punto, cuestión de gustos. No obstante, todos los demás candidatos pueden "derivarse" a partir de una combinación apropiada de Jos básicos aquí mencionados.
26
EL ORDEN ()CULTO
BÁSICOS
ADAPTACIÓN
cambios en la estructura (estrategia) basados en la experiencia del sistema
1
r~r3l r~r~'• ~-------/
'---
___ ,;
tiempo 1
\
________ /
,,___
__ /
2
100
SISTEMA
TIEMPO DE MODIFICACIÓN
sistema nervioso central
segundos a horas
sistema inmune
horas a días
negocios
meses a años
especies
días a siglos
ecosistemas
años a milenios FIGURA 1.3.
Adaptación y aprendizaje.
Agregación (propiedad)
La agregación entra en el estudio de los SCA en dos sentidos. El p1imero se refiere a una manera estándar de simplificar Jos sistemas complejos: agregarnos cosas similares en categorías -árboles, automóviles, bancos- y después los tratamos como equivalentes. Los seres humanos analizan las escenas familiares de esta manera sin mayor esfuerzo. Pero esto no es sorprendente, ya que las categorías que elegimos son reutilizables. Casi siempre podemos descomponer las nuevas escenas en categorías familiares. También podemos generar escenas que nunca hemos visto por medio de la recombinación de categorías familiares (muchos de los grifos, quimeras y arpías del bestiario medieval fueron formados por medio de la recombinación de partes de animales familiares a los hombres de esa época).
27
La agregación es, en este sentido, una de nuestras principales técnicas para construir modelos. Nosotros decidimos qué detalles son irrelevantes para las cuestiones que nos interesan y procedemos a ignorarlos. Esto tiene como efecto clasificar en l1na sola categoría cosas que difieren sólo en los detalles excluidos; la categoría se convierte en un bloque de construcción para la elaboración del modelo. Lamodelación, debe dejarse claro, es una forma de arte que depende de la experiencia y del gusto del modelador. En esto ocurre algo muy parecido a lo que sucede en el arte de la caricatura, especialmente de la caricatura política. El modelador (el caricaturista) debe decidir qué rasgos es conveniente exagerar y qué rasgos se deben pasar por alto para enfatizar la intención o el mens'!je político. El segundo sentido de la agregación está estrechamente relacionado con el primero, pero en este caso se enfatiza lo que hacen los SCA, más que la manera en que los modelamos. Concierne a Ja emergencia (aparición) de comportamientos complejos a partir de interacciones agregadas de agentes menos complejos. Un nido de hormigas puede servirnos como ejemplo. Cada hormiga tiene un comportamiento sumamente estereotipado, y casi siempre muere cuando las circunstancias 110 se adaptan al estereotipo. Por el contrario, el agregado de hormigas -el nido de hormigas- es un organismo sumamente adaptable, que puede sobrevivir durante largos periodos aun frente a una amplia gama de amenazas. Es como un organismo inteligente construido con partes poco inteligentes. El maravilloso capítulo "Ant fugue" del libro de Douglas Hofetadter (1979) aborda este punto mejor que cualquier otro que haya leído. El nido de hormigas proporciona una versión panorámica de los más espectaculares fenómenos emergentes, tales como la inteligencia producida por grandes cantidades de neuronas interconectadas, la identidad proporcionada por diversos conjuntos de anticuerpos, o la espectacular coordinación de u11 organismo constituido por miríadas de tipos diferentes de células, e incluso de la coherencia y permanencia de una gran ciudad. Los agregados así formados pueden a su vez actuar como agentes a un nivel superior (meta-agentes). Como puede verse en la figura 1.4, con frecuencia se puede describir mejor la interacción de estos metaagentes en términos de sus propiedades como agregados (primer sentido). Gracias a esto podemos hablar del producto interno bruto, de la identidad proporcionada por el sistema inmune o del comportamiento de un sistema nervioso. Los meta-agentes pueden, por supuesto, agregarse (segundo sentido) y, a su vez, producir meta-meta-agentes. Cuando este proceso se repite varias veces llegamos a la organización jerárquica típica de Jos SCA.
28
EL ORDEN OCULTO AGREGADO
füÍSICOS
PROPIEDAD DE AGREGADO EMERGENTE
·Compañía 1 ·Compañía 2
-::::=:::;~ Producto interno bruto
·Compañía 3
Sistema inmune
·Anticuerpo 1 ---~--~--·Anticuerpo 2
Identidad individual
·Anticuerpo 3
!Si~tema nervioso ·Neurona 1 ·Neurona 2 ·Neurona 3
Comportamiento
FrGURA 1.4. Agregación y propiedades del agregado.
La agregación en el segundo sentido es, de hecho, la característica básica de todos los SCA, y los fenómenos emergentes que resultan de ello constituyen el aspecto más enigmático de los SCA. El estudio de los SCA incrementa nuestra habilidad para discernir el mecanismo que permite a los agentes simples formar agregados altamente adaptables. ¿Qué clase de "fronteras" delimitan a estos agregados adaptables? ¿Cómo son dirigidas y coordinadas las interacciones del agente dentro de estas fronteras? ¿Cómo generan estas interacciones comportamientos que trascienden los comportamientos de los agentes componentes? Debemos estar en condiciones de responder tales preguntas si queremos resolver los misterios, y las dificultades, que rodean a los SCA. lviarbeteado o etiquetado (mecanismo)
Hay un mecanismo que facilita consistentemente la formación de agregados, al cual denominamos marbeteado ("identificación por marbetes", "asignació11 de marbetes", "simbolización" por marbetes, etc.). El ejemplo más común de esto es la bandera que se utiliza para motivar o convocar a los miembros de un ejército o a personas q11e comparten la misma ideología política. Una versión más operacional de un marbeteado en estos días de Internet es el logo que encabeza un mensaje en el que se convoca a 11na reunión a miembros dispersos de
29
una asociación. Pero todavía n1ás operacionales son los "sitios activos" que permiten que los anticuerpos se adhieran a los antígenos. La sofisticación de esta particular versión del marbeteado fue muy bien descrita por Edelman en 1988, durante una discusión sobre las moléculas de adhesión de las células. Podemos incluir también los patrones visuales y las feromonas que facilitan el apareamiento selectivo en los animales, así como los logos de las marcas comerciales y los iconos que facilitan la interacción comercial (véase la figura I.5). De pronto parece evidente que el marbeteado constituye un mecanismo de supervivencia para la agregación y la formación de fronteras en los SCA. Cuando examinamos de cerca los diferentes ejemplos del marbeteado, vemos que tienen lina característica en co1nún: s11 uso por parte de los SCA para manipular simetrías. Debido a que las simctrias son comunes, con frecuencia las utilizamos para percibir o modelar nuestro mundo cotidiano, a veces de manera totalmente inconsciente. I.,as simetrías nos permiten ignorar ciertos detalles, para poder dirigir nuestra atención a otros. Weyl ( 1952) escribió una rica exposición sobre este punto. El clásico ejemplo de una simetría es una esfera perfecta, digamos una bola blanca de billar. Una bola de billar exhibe una simetría rotacional completa, así que si se la coloca en cualquier posición no se produce ningún cambio observable a simple vista. Si pintamos una franja alrededor del "ecuador" de la bola de billar, con esta acción rompemos su simetría rotacional, y a partir de ese momento podremos distinguir lo que previamente era indistinguible a simple vista. Por ejemplo, si hacemos girar esta bola de billar pintada con una franja, podemos fácilmente observar si el eje de rotación es perpendicular o no al "ecuador" que forma la franja. En general, los marbetes i1os permiten observar y actuar sobre las propiedades que previamente estaban ocultas por la simetría. Llevemos las comparaciones u11 poco más l~jos: consideremos un conjunto de bolas blancas de billar en rápido movimiento sobre una mesa de billar (después de un fuerte golpe del taco sobre una bola que a la vez golpea a otras). En ese momento no podremos distinguir la individualidad de cada una de las bolas (todas son blancas), a menos que llevemos un registro preciso de sus trayectorias. Sin embargo, podemos romper la simetría por medio de etiquetas o marbetes: si ponemos un marbete sobre una de las bolas podremos rastrear su posición a pesar de Sll movimiento. Los marbetes son rasgos importantes de los SCA que facilitan la interacción selectiva y permiten a los agentes seleccionar a otros agentes u objetos, que de otra manera serían indistinguibles. Las interacciones bien establecidas basadas en marbetes proporcionan una base firme
EL ORDEN OCULTO
sAsrcos
para la discriminació11, la especialización y la cooperacióri. Esto, a su vez, conduce a la emergencia (aparición) de meta-agentes y de organizaciones q11e persisten incluso si sus componentes están carnl)iando contin11ame11te. En_ síntesis, los marbetes son los rr1ecanismos que se encuentran detrás de la organizaciónjerárguica (el agente, el metaagente, el meta-meta-agente ... ), orgauización muy común en los SCA. Más adelante veremos muchos ejemplos del origen de los marbetes y de la manera en que funcionan.
No-linealidad (propiedad)
30
Marbete o etiqueta
APAREAM!E~ITO SELECTIVO
Condición -(requisito del marbete}
los marbetes o etiquetas proporcionan a los agregados coordinación y selectividad
31
Fuera del ámbito de las matemáticas, pocos saben que la mayoría de las herramientas de esta ciencia -desde las que se utilizan en la aritmética simple hasta las que se requieren en el cálculo diferencial y en la topología algebraica- se basan en el principio de la linealidad. A grandes rasgos, linealidad significa que podemos obtener un valor para el todo sumando los valores de sus partes. Más específicamente, una función es lineal si su valor, para c11alquier conjunte) de valores asignados a sus elementos, es simplemente una suma ponderada de esos valores. Por ejemplo, la función 3x + 5y + z es lineal. Decimos gue alguna propiedad numérica de un sistema es lineal (relativa a los valores numéricos asignados a sus partes), si la propiedad es una función lineal de esos valores. Consideremos, por ejemplo, el consumo de combustible e de un aeroplano como una función de su velocidad v y de su altitud x. Dadas las unidades adecuadas para el consumo de combustible, altura y velocidad, podríamos establecer gue:
e= (0.5)v+ (-0.l)v
(OALICIÓN POLÍTICA
MENSAJES Y ENCABEZADOS
(ATALIZADORES Y SUBSTRATOS
catalizador
substrato FIGCRA I.5.
!viarbetes;: agregados.
El consumo de combustible, er1tor1ces, sería lineal en térn1inos de velocidad y altitud. Las encuestas, las tendencias proyectadas y las estadísticas industlialcs que emplean sumatorias, sólo son útiles si desc1iben las propiedades lineales de los sistemas subyacentes. Es tan fácil utilizar las matemáticas cuando los sistemas tienen propiedades lineales, que frecuentemente realizamos un esfuerzo considerable para justificar un supuesto de linealidad. Todas las ramas de las matemáticas buscan encontrar funciones lineales que sean aproximaciones razonables cuando la linealidad no puede ser establecida de manera directa. Desafortunadamente, nada de esto funciona en el caso de los SCA; intentar estudiarlos con estas técnicas es algo así como tratar de jugar ajedrez compilando estadísticas sobre la manera en q11e se mueven las piezas en el tablero. Permítanme ilustrar esta dificultad comenzando con la más simple de las interacciones no-lineales: la gue ocurre entre una población de depredadores y sus presas. Este modelo, que a pesar de su supuesta simplicidad realiza satisfactoriamente el trabajo de describir datos reales, está basado en los registros gue durante siglos ha llevado la Hudson Bay Company sobre las interacciones entre linces y liebres, basados en los informes de las adquisiciones anuales de pieles. Al armar este modelo, bosquejamos un procedimiento típico para la construcción de los modelos matemáticos. Cuando hayamos terminado, ten-
32
EL ORDEN OClJLTC)
BÁSICl)S
dremos un claro ejemplo de las complicaciones causadas por la no-linealidad. Empecemos con una observación de sentido con1ún: ql1e los incrementos en la población de los depredadores o en la población de las presas aumentan la posibilidad de un mayor número de encuentros entre ellos. Simbólicamente, una U representa el número de depredadores en un área dada -digamos, una milla cuadrada-y V representa el número de presas en la misma área; ento11ces el número de interacciones por unidad de tiempo -digamos, un día- es dado por la fórmula cUV, donde e es una constante que refleja Ja eficiencia del depredador (por ejemplo, el ritmo promedio al que inspecciona Sll territorio). Si e= 0.5, U= 2 y V= 10, entonces habrá:
U(t + 21) = U(t)-du(t) + bU(t).
cUV = 0.5(2) (10) = 10 encuentros por día y por milla cuadrada.
Si el número de depredadores se duplica -de manera que U= 4--y el número de presas se incrementa 10 veces-de manera que V= 20-, entor1ces el número de encuentros se cuadruplicará: cUV= O..'i( 4) (20)
=
40 encuentros por día y por milla cuadrada.
Esta expresión involucra una no-linealidad, una de las más simples, debido a que vincula el producto y no la suma de dos variables distintas; es decir, la interacción total depredador-presa no puede ser obtenida por la simple suma de las actividades de los depredadores y de las actividades de las presas. Nuestro siguiente paso es tomar en cuenta explícitamente el hecho de que las poblaciones cambian con el paso del tiempo. Para propósitos de notación, establezcamos que U(t) representa la población de depredadores en el tiempo t y que V( t) representa la población de presas en el tiempo t. Aumentemos las interacciones depredadores-presas eliminando las muertes motivadas por otras causas que no sean la depredación. Utilizando el enfoque más simple, establezcamos una tasa de natalidad b para todos los depredadores, de manera que los nacimientos de éstos en el tiempo t sean bU(t). Las muertes pueden manejarse de manera similar, utilizando una tasa de mortalidad d, de modo que el número de muertes de depredadores en el tiempo t sea dU (t). Si ignoramos las interacciones depredador-presa por un momento, obtenemos el modelo simple de la manera en la que la población de depredadores cambia a través del tiempo. El tamaño de la población, después de que ha transcurrido una unidad de tiempo, es la población en el tiempo t menos las muertes, más los nacimientos, o sea:
La ecuación, la cual no torna en cuenta el envejecimiento, se utiliza para realizar proyecciones de población y para el cálculo de cosas tan terrenales como las primas para los seguros de vida. Utilizamos exactamente el mismo argumento para obtener una ecuación similar para las presas: V(t + 1) = V(t) - d'V(t) + b't),
donde b'y d'son las respectivas tasas de mortalidad y natalidad para las presas (en este caso, también sin interacciones). Para reintroducir el efecto de las interacciones depredadores-presas, incorporaremos la idea intuitiva de que el depredador aumenta su bienestar cada vez que captura una presa. A fin de cuentas, este proceso (la captura de presas) ejerce un efecto positivo sobre la producción de descendencia por parte del depredador. Para captar matemáticamente esta idea, introduzcamos otra constante (la constante r) para representar la eficiencia en la transformación de presas capturadas (alimento) en descendencia. Má.o.; interacciones significan más nacimientos; así que, utilizando la tasa de interacción cU(t)V(t), obtenemos r[cU(t) V(t)} corno el incremento en los nacimientos que provoca la interacción depredadores-presas. Los cambios de población para los depredadores se convierten entonces en: U(t + 1)
=
U(t)-dU(l) + bU(t) + r[cU(t) V(t)}.
Para la presa, la captura por el depredador incrementa el número de muertes. Utilizando r'para indicar Ja vulnerabilidad frente a la captura y la muerte durante las interacciones, obtenemos la siguiente ecuación de población para las presas: V(t + 1) = V(t)- d'V(t)- r'[cU(t) V(t)] + b'V(t).
Este par de ecuaciones para U(t + 1) y V(t + 1) es una versión del famoso modelo Lotka-Volterra (véase Lotka, 1956). Los métodos estándar para simplificar y resolver las ecuaciones Lotka-Voltcrra muestran que, bajo Ja mayoría de las condiciones, la población de depredadores pasará por una serie de altibajos, que irán de festines a hambnmas, y lo
35
EL ORDEN OCULTO
BÁSICOS
mismo ocurrirá con la población de presas. Esta predicción está basada en los registros de la Hudson Bay Company. A largo plazo, extensiones de tales modelos podrían ayudamos a comprender por qué las in teracciones depredadores-presas muestran tan notables oscilaciones, mientras que las interacciones dentro de los componentes de una ciudad son relativamente estables. Por ahora sólo estamos interesados en el efecto de la no-linealidad en muchos de los esfuerzos de modelación. Regresemos a la parte interactiva del modelo. La fórmula cU(t)V(t) es realmente el punto de partida para muchos modelos, incluyendo las interacciones entre átomos o moléculas e incluso entre bolas de billar. Para el estudio del efecto de las interacciones no-lineales en el escenario más simple posible, regresemos al ejemplo de las bolas de billar (véase la figura 1.6). Restrinjamos el modelo para que incluya únicamente tres "especies" de bolas de billar: bolas blancas con una franja roja, bolas blancas con una franja naranja y bolas totalmente azules (bolas de azul sólido). Supongamos que hay varias bolas de la misma especie sobre la mesa y que están moviéndose de manera aleatoria -una especie de "big bang" o, mejor, de "big break"-. Supongamos también, de manera fantasiosa, que las franjas de las bolas blancas en ocasiones pueden "adherirse" a las bolas azules durante las colisiones, como si éstas tuvieran gotas de pegamento sobre sus superficies. Podemos tomar la primera fórmula, cUV, y utilizarla ahora para modelar la tasa a la que se forman híbridos: bolas de color sólido/bolas con franjas. Para obtener la respuesta, comencemos con la combinación franja roja/azul sólido. En este caso, U representa la proporción de bolas con franja roja sobre la mesa, V representa la proporción de bolas azul sólido, y la constante e indica la velocidad de reacción, que depende de la "adherencia" de la combinación franjas rojas/ azul sólido. Utilizando Z(t) para representar proporción de "adherencias" (tasa de adherencia) entre franjas rojas y el azul sólido en el tiempo t, utilizamos la versión más simple de la ecuación Lotka-Volterra:
tomando en consideración el hecho de que la adherencia de las franjas naranja pueda ser diferente a la de las franjas rojas (véase la figura I. 7). En este caso, W(t) será la proporción de franjas naranja en el tiempo t, Y(t) será la proporción del compuesto franja naranja/azul sólido en el tiempo t y e' será la velocidad de reacción, determinada por la adherencia de las franjas naranja. Por lo tanto, para las franjas rojas, la fórmula
34
Los modelos más sencillos de interacción utilizan las colisiones aleatorias (por ejemplo, los modelos atómico, químico y depredador-presa)
Número total de bolas: 1O
Proporción de ~: 4/10 = 0.4
Proporción de
•=
5/10 = 0.5
Algunas colisiones producen un compuesto (un producto). La proporción de colisiones que dan por resultado un compuesto se obtiene por la tasa reacción, utilizando la ecuación (no lineal):
[proporción~] x [proporción.] x tasa= [0.4]
X
[0.5]
X 0.5
[proporción~·]
=
[0.1]
Tasa de reacción (adherencia)
Z(t + 1) = Z(t) + cU(t) - V(t).
Por ejemplo, si Z(t) = O, U(t) = 0.4, entonces V(t) = 0.5, y e= O. 5. Por lo tanto, después de una unidad de tiempo la proporción del compnesto franja rc~a/azul sólido es: Z(t+ 1) =O+ 0.5(0.4) (0.5) = 0.1 FIGURA I.6. Un modelo de interacción de bolas de billa1:
Podemos proceder de manera similar con las bolas de franjas naranja,
36
EL ORDEN OCULTO
Distintos tipos de bolas pueden tener distintas tasas de reacción:
X(t+l)~Y(t+ 7)+Z(t+ l) ~ Y(t) + Z(t) + cU(t)V(t)
TASAS DE REACCIÓN
37
BASICOS
banda clara
banda oscura
0.5
0.1
+ c'W(t)v(t)
Utilizando los valores numéricos dados anteriormente, obtenemos: color sólido
•
X(t + 1) Supongamos que deseamos saber cuál es la proporción de colisiones que resultan de un compuesto banda-color sólido{~ y
tSDJ
¿Podemos construir un modelo sencillo asignando una tasa de reacción (promedio) de agregado al proceso en conjunto?
proporción
?
~
Esta reacción agrega (conjunta) las bandas, de modo que utiliza sólo la propor+ propordón de ~}
ción total de bandas {proporción de~
Para que el modelo funcione, dos combinaciones de bandas con el mismo total deben producir el mis-
mo resultado FlGURA
I.7. Reacciones del agregado.
Y(t + l) ~ Y(t) + c'W(t)V(t)
nos da el resultado de la interacción de las franjas naral)ja con los azules sólidos. Si Y(t) ~O, W(t) ~ 0.1 y c, = 0.1, entonces: Y(t+l)
~0+0.1(0.l)
(0.5)
~0.005.
Podemos obtener el compuesto del total de franjas y azules sólidos (franjas rojas/azules sólidos más franjas naranjas/azules sólidos), X(t), sumando los resultados de las reacciones separadas, de la siguiente manera:
=
0.105
Esta parte del modelo es, de hecho, lineal: ¡el todo es igual a la suma de las partes! Ahora, supongamos que queremos simplificar el modelo agregando las franjas en una sola categoría. La idea es calcular el compuesto del total de franjas/ colores sólidos usando sólo la proporción de bolas con fral)ja sobre la mesa. Incluso cuando hay sólo dos especies de franjas, como en el presente caso, esta agregación disminuye la complejidad de los cálculos (el número de ecuaciones) a la mitad. Cuando hay grandes números de especies (como las que existen en los ecosistemas o en las ciudades), las agregaciones marcan la diferencia entre la factibilidad y la no-factibilidad del análisis. La simplificación ocurre debido a que la ecuación del agregado utiliza una sola variable, S(t), para la población total de franjas, así como un solo coeficiente de reacción, e", quedando de la siguiente manera: X(t + 1)
proporción [0.5]
0.1+0.005
~
X(t) +e" S (t) V(t).
Sin embargo, existe un problema respecto a la validez de esta ecuación. Para que sea útil, debemos encontrar un coeficiente e" que funcione con todas las mezclas de franjas. Bajo un enfoque lineal estándar, obtendríamos e" promediando los coeficientes de las interacciones individuales franjas/azul sólido. No obstante, éste es el punto en el que interfieren las no-linealidades. Tomemos dos diferentes mezclas de franjas. En la mezcla 1 la proporción de franjas rojas es U= 0.4, mientras que la proporción de franjas naranja es W = 0.1; en la mezcla 2 la proporción se invierte, así que U~ 0.1yw~0.4. En ambos casos el número total de franjas es S~ U+ W= 0.5. Por lo tanto, en ambos casos las ecuaciones para X deben dar las mismas respuestas para la proporción de franjas/azules sólidos en el compuesto, ya que todos los números del lado derecho son los mismos. Pero, ¿qué es lo que ocurre en la realidad? ¿Las interacciones de dos diferentes mezclas realmente producen la misma proporción total de franjas/ azules sólidos en el compuesto? Para verificar esto, desarrollemos una computación detallada para las dos mezclas. Para la mezcla 1 ya hemos calculado el resultado cuan-
38
do X(x)
~O:
X(t + l)
~
Y(t + l) + Z(t+ 1)
~
0.105.
Para la mezcla 2, tenemos: X(t + 1)
39
BÁSICOS
EL ORDEN OCL'LTO
~ Y(t + l) ~ 7, (t + 1) = Y(t) + Z(t) + cU(t)V(t) + c'W(t)V(t) =0+0+0.5(0.1) (0.5) +0.1(0.4) (0.5 = 0.025 + 0.020 ~ 0.045.
Aquí es donde está la incongruencia, ya que las dos mezclas producen diferentes totales de compuestos -0.105 y 0.045-, aun si el número total de franjas es el mismo. En este caso no funciona ninguna suma o promediación de los coeficientes de reacción de las partes del agregado, y no funciona debido a que no existe un coeficiente que sirva para ambas mezclas. Las interacciones no-lineales nos impiden asignar una tasa de reacción para el agregado. Por todo lo que hemos visto, podemos asegurar que, incluso en las situaciones más simples, la no-linealidad puede interferir con el enfoque lineal de los agregados. De esto podemos extraer un enunciado general: las interacciones no-lineales casi siempre provocan que el comportamiento de un agregado. sea más complicado de lo que habíamos previsto por medio de sumatorias o promediaciones.
los nodos y los conectores pueden aparecer y desaparecer, dependiendo de si los agentes tienen éxito o no en sus esfuerzos por adaptarse. Por tanto, ni los flujos ni las redes permanecen inmutables a través del tiempo: son patrones que reflejan los cambios provocados por el proceso de adaptación a medida que pasa el tiempo y se acumulan experiencias. Los marbetes casi siempre definen a las redes delimitando las interaccio11es críticas, es decir, las conexione_s principales. Los marbetes adquieren este papel debido a que el proceso de adaptación que modifica a los SCA selecciona marbetes que favorecen interacciones útiles y rechazan marbetes que provocan perturbaciones en el sistema. Esto significa que los agentes con marbetes útiles se propagan, mientras que los agentes con marbetes anómalos dejan de existir. Más adelante observaremos este proceso en detalle. CLAVE
------------------~
procesador .-----+
flujo de recursos
[-.~J;~;-~~;~~-~J
'-~-~-~-··~-)
4
5 6
No linealidad
nariz
Marbetes
o etiquetas ¡"~
-~ Modefos internos
2
Un rostro puede ser definido mediante la concatenación de números asignados a sus componentes Flujos
FIGURA l.15. Bloques de construcción jJara rostros.
procesador
p
~'- ,!/" Sería un error confinar nuestra atención a los bloques de construcción de la física, ya que estos bloques sirven para imponer regularidad a un mundo complejo. Basta con mirar el reducido número de notas musicales que existen y la infinita variedad de música que se puede escribir con ellas, o el uso de un limitado rango de morfologías que se requiere para describir la enorme cantidad de estructuras animales que existe. Y esto se aplica casi con la misma contundencia a casi todo lo que encontramos en la vida diaria. Por ejemplo, si se le pincha un neumático a mi automóvil Saab rojo mientras viajo por una autopista, inmediatame11te imagino lina se1ie de acciones posibles para remediar el problema, aunque nunca me haya encontrado en esta situación en alguna ocasión anterior. No puedo tener preparada una lista de solu-
consumidores
..-. ...·-~·
abastecedores..
([Y;;/
-~
""o
Bfoques de construcción
Diversidad
F!GCRA_ I.
16. Los siete básicos para los sistenias coniplejos adaptables.
54
EL ORDEN OCULTO
BÁSICOS
Este uso de los bloques de construcción para generar modelos internos es una característica bien establecida en los sistemas complejos adaptables. Cuando el modelo es tácito, el proceso de descubrimiento y combinación de los bloques de construcción generalmente está sujeto a una escala de tiempo determinada por la evolución; cuando el modelo es manifiesto, la escala de tiempo puede ser de una magnitud menor. Para finalizar, quiero insistir en lo que afirmé cuando abordé el tema de los modelos internos y durante la discusión inicial sobre la adaptación: que el proceso de adaptación subyacente permanece sin cambios a través de toda la gama de SCA.
¿ADÓNDE DIRIGIRNOS DESPUÉS?
innovación multifuncionalidad morfogénesis
y:¡:Lción J
enfermedades autoinmunes
INDIVIDUAL
I~
m1met1smo
biodiversidad especialización
FlGURA l. 17. .l!,'l papel de los siete básicos en el estudio de los sistemas co1npüjos adaptables ..
55
Los siguientes tres capítulos combinan de diferentes maneras los siete básicos que acabamos de analizar (véase la figura I.16), buscando de esta manera alcanzar dos metas. La primera, objetivo del siguiente capítulo, es proporcionar una definición de "agente adaptable" que funcione con las diferentes clases de agentes que se encuentran en los SCA. La segunda, tema de los capítulos III y IV, es proporcionar un modelo de computadora que sea lo suficientemente general para permitirnos llevar a cabo expe1imentos relevantes para todos los SCA. En los capítulos subsiguientes aparecerán una y otra vez estos siete conceptos, sugiriéndonos mecanismos y proporcionándonos directrices (véase la figura 1.1 7). Más allá de estas dos metas hay un objetivo mayor: descubrir los principios generales que nos permitirán sintetizar los comportamientos complejos de los SCA a partir de leyes simples. Los sistemas complejos adaptables son muy diferentes de la mayoría de los sistemas que se han estudiado científicamente, ya que los primeros exhiben coherencia incluso si están sometidos a cambios continuos, y esto lo logran por medio de las acciones condicionales y la adaptación; además, no requieren de ningún mecanismo central de dirección. Al mismo tiempo, parece que todos los SCA tienen puntos de apalancamiento, en donde pequeñas adiciones producen grandes cambios dirigidos. Resultará más fácil descubrir estos puntos de apalancamiento si podemos descubrir los principios generales que gobiernan la dinámica de Jos scA. El conocimiento de más hechos respecto a los puntos de apalancamiento nos proporciona, a su vez, lineamientos para aplicar enfoques más efectivos para resolver problemas relacionados con los SCA, tales como las enfermedades inmunes, Ja decadencia de Jos grandes centros urbanos, Ja innovación industrial, etc. Por tratarse de problemas tan complejos, es improbable que hagamos progresos sustanciales si no contamos con lineamientos teóricos. Estamos apenas en el principio de una búsqueda de principios generales, pero tenemos algunos indicios de lo que podrían ser estos principios.
II. AGENTES ADAPTABLES REGRESEMOS A LA CIUDAD DE NUEVA YORK para una breve ilustración del aspecto que proporcionan los siete básicos expuestos en el capítulo anterior. Los agentes formados por agregación constituyen un rasgo central, tipificado por las empresas que van desde el Citibank y la Bolsa de Valores hasta la tienda de la esquina y el taxi de propiedad individual. Estos agentes determinan virtualmente todas las transacciones fiscales, así que, a nivel de abstracción, el sistema complejo adaptable que es la ciudad de Nueva York puede ser descrito adecuadamente por las interacciones evolutivas de dichos agentes. Basta con mirar los logos de publicidad y de identificación industrial y comercial para ver de qué manera los marbetes facilitan y dirigen estas transacciones. La diversidad de estos marbetes subraya la variedad de empresas y actividades de la ciudad, así como el complejo flujo de mercancías que entran, salen y circulan dentro de la ciudad como resultado de esto. El hecho de que la ciudad de Nueva York retenga su coherencia tanto en el corto como en el largo plazos a pesar de la diversidad, el cambio y la falta de una dirección centralizada es un enigma típico de los scA. En este ejemplo la no-linealidad se encuentra cerca del centro del enigma. Las no-linealidades de Nueva York se manifiestan de manera más evidente en los modelos internos -modelos internos de las empresas- que realizan las transacciones. Estos modelos pueden ser desde modestos planes de venta diarios hasta sofisticados proyectos corporativos. Existen también constantes innovaciones, tales como el flujo continuo de r1uevos instrumentos financieros en Wall Street (los nuevos instrumentos de inversión, Jos derivatives, han absorbido todavía más dinero que sus predecesores, los bonos junk). La proyección de tendencias y otros análisis lineales no son instrumentos adecuados para estudiar estas propiedades. Sospecho que surgirían nuevos tipos de percepción de la problemática urbana si pudiéramos descubrir los bloques de construcción que se combinan y se recombinan para determinar la apariencia exterior de la ciudad. Los bloques de construcción para una ciudad son más difíciles de descub1ir que los de otros SCA, aun cuando los contratos, los organigramas, los permisos, las piezas de la infraestructura urbana y los impuestos son los más obvios candidatos. Esta visión de N neva York no es más rebuscada que otras maneras de describir este conglomerado urbano, pero sugiere que la ciudad no es 57
58
EL ORDEN OCLTLTO
diferente a c11alquier otro SCA. Ya hemos visto estas mismas características básicas en otros SCA, pues constituyen rasgos distintivos de todos ellos. Incluso podría decirse que no existe sistema compl".jo adaptable ei1 el que no estén presentes estas siete características básicas. Esto nos sugiere que debemos tratar a todos los SCA dentro de un marco de trabajo común que explote estos básicos. No obstante, hay una característica de los SCA que nos impide aplicar con todo rigor dicho marco de trabajo: los agentes de los diferentes sistemas, que aun dentro de un mismo sistema exhiben diferencias reales. Por ejemplo, las empresas de una ciudad no parecen tener mucho en comlin con los anticuerpos del sistema inmune, y los organismos vivos de lln ecosistema no separecen en absoluto a las neuronas del sistema nervioso. En vista de esto, ¿realmente es posible encontrar una representación común para tan diferentes agentes? De ser posible, sería factible aplicar un enfoque común a todos los SCA; en caso contrario, habría que abandonar el intento. Por lo tanto, nuestro próximo objetivo es la búsqueda de una representación común para los agentes. Exploraremos las posibilidades en tres etapas. Primero buscaremos una manera uniforme de representar las habilidades de las diferentes clases de agentes, sin tomar en cuenta los cambios que pudieran ser producidos por la adaptación. Llamaremos al resultado de esto sistema de desempeño. La siguiente etapa es para utilizar el éxito (o el fracaso) de los agentes para asignar créditos (premios) o penalizaciones a partes del sistema de desempeño. Llamaremos a este proceso asignación de crédito, tal como se acostumbra en otros estudios de aprendizaje y adaptación. La última etapa está relacionada con la realización de cambios en las habilidades del agente para remplazar con nuevas opciones las partes a las que se asignaron bajos créditos. Por razones, que se volverán evidentes más adelante, denominaré a este procedimiento descubrimiento de las reglas.
SISTEMA DE DESEMPEÑO
El primer paso para arribar a una descripción común de los agentes consiste en regresar a la descripción de los agentes adaptables que presentamos al comienzo del capítulo anterior, en donde utilizamos reglas corno instrumentos de definición. Ahora daremos un uso más amplio a las reglas y las consideraremos como medios formales para definir a los agentes. Para que las reglas resulten instrumentos exitosos de unificación, aplicables a cualquier forma exterior de los agentes, deben satisfacer los siguientes tres criterios:
59
AC;ENTES ADAJ'TABLES
l. Las reglas deben utilizar una sola sintaxis para describir a todos los agentes de los SCA. . .. 2. La sintaxis de la regla debe servir para todas las mteracc10nes en-
.
.
~~~=· 3. Debe haber un procedimiento aceptable para modificar adaptatJ.vamente las reglas.
En el capítulo anterior consideramos primero las reglas d~ la clase más simple: SI (alguna condición es cierta) ENTONCES (re_ahce ~1erta acción). Las reglas SI/ENTONCES se utilizan en una :impha variedad de campos: en psicología se llaman las reglas del estimulo-respuesta (véase la figura II.l); en inteligencia artificial son ilamadas reglas ,de condición-acción; en lógica son llamadas reglas de la producoon. Nuestro objetivo inmediato es encontrar una sintaxis simple _para las reglas SI/ENTONCES, una sintaxis que funooneyara _c,ualqmer clase de agentes. Más adelante agregaremos una rr;od1ficac10n simple que proporcione a las reglas SI/ENTONCES sufioente poder para modelar cualquier agente que pueda ser modelado en una computadora.
Entrada/salida (lnput/output)
La sintaxis que utilizamos para las reglas SI/ENTONCES depende críticamente de la manera como interacciona el agente con su medio ambiente. Empecemos con el lado de la entrada (input). En términ?s ordinarios, un agente percibe su medio ambiente_,.ª través de un~ serie de estímulos. Si el agente es un anticuerpo, el estmmlo lo conslituyen las configuraciones moleculares -marbetes- d; las superfioes de los antígenos. Si el agente es un ser humano, los est1mulos los re~1be a través de sus cinco sentidos. Si el agente es una empresa comeroal, los estímulos son los pedidos, el flujo de efectivo, las mercancías recibidas, etc. En términos generales, los agentes están siend;i bombarde_ados por tal cantidad de estímulos, que reciben mucho mas mformac10n de la que pueden utilizar. . La primera labor del agente, entonces, es filtrar el t;irrente de mf~r mación que produce su medio ambiente. Para describir esta operaoon de filtración adoptaré el punto de vista común, de acuerdo con el cual el agente recibe información de su medio ambiente a través de un conjunto de detectores. La clase más simple de _detect~res es la _d~ los que perciben una propiedad particular del med10 ambiente aclivandose cuan: do esta propiedad está presente, y desactivándose cuando no lo esta (véase la figura II.2). Esto significa que el detector es un artific10 bmano
60
EL ORDEN OCULTO
1\GENTES ADAPTABLES
que transporta un bit de información acerca del medio ambiente. Tales detectores podrían parecer muy limitados en su capacidad para percibir (sentir) el medio ambiente; no obstante, un número suficientemente gr~nde de detectores puede transportar una gran cantidad de informac'.on. De hecho, la c_antidad de información trasmitida se eleva exponencialmente con el numero de detectores. Por ejemplo, un grupo de tres detectores binarios puede codificar 2 X 2 x 2 = 8 colores; un conjunto de 20 detectores, utilizando una variante del juego de "las veinte preguntas", puede producir 22° (más de un millón) de distintas categorías.
cada uno de los cuales tiene un efecto elemental sobre el medio ambiente cuando es activado por un mensaje apropiado (figura II.2). En un momento dado, la respuesta total de un agente es generada por grupos de efectores que se activan en ese instante; esto es, ls efectores decodifican los mensajes estandarizados para provocar acc10nes en el medio ambiente. Al hacer esto, los efectores "invierten" el procedimiento que utilizan los detectores para codificar la actividad del medio ambiente y convertirla en mensajes estandarizados. Como en el caso de los detectores, utilizamos los efectores como meca11ismos descriptivos para modelar la salida adaptativa del agente adaptable.
61
ESTÍMULO-RESPUESTA
Detectores se mueve
Efectores
,_
'
rayado largo
==>
mensaje
cercano
..
=
vuelve la cabeza
mensaje
Sistema de desempeño
huye persigue
F==
extiende la lengua
' §J un objeto pequeño vuela a la izquierda l3liMJlI9ij vuelve la cabeza T5º a la izquierda FIGURá..
lI.l. Una regla del estímulo-respuesta.
Vale la pena subrayar, en lo referente a los detectores, la misma advertencia que hicimos para las reglas. Esta discusión sobre los detectores no parte del supuesto de que todos los agentes de un SCA utilizan detectores binarios. Lo que pretendemos demostrar es que podemos ullhzar grupos de detectores binarios para describir la manera en la que los agentes filtran la información proveniente del medio ambiente. Podemos, incluso, traducir otros medios de detección a este formato binario. El valor de los detectores binarios en esta discusión radica en sn utilidad en la modelación de los agentes adaptables arbitrarios. P?r medio de los detectores binarios podemos utilizar mensajes estandanzados -expedientes binarios- para representar la información seleccionada por un agente. ¿Podemos extender esta estandarización basta el lado de la salida (output) del agente? Las acciones de los agentes de los SCA son, después de todo, tan diversas como sus maneras de extraer información de su medio ambiente. Podemos ganar un poco de terreno en la estandarización de la salida "invirtiendo" la función desempeñada por los detectores. Para tratar de lograr es,to, descnbamos las acciones del agente en términos de un conjunto de efectores,
Medio ambiente FlGGRA
II.2. Detectores y efectores para un sistema de desempeño.
J>rocesamiento y sintaxis Con esta descripción de la entrada (input) y la salida (output) de los agentes en términos de mensajes, consideramos ventajoso manejar las interacciones de las reglas de los agentes de la misma manera. La capacidad para ser el sostén de la interacción es lo que da a las reglas simples SI/ENTONCES el pleno poder de un lengu'\je de programación. Para que una regla SI/ENTONCES interaccione con otra se requiere que la parte SI de una de las reglas sea sensible a las acciones especificadas por la parte ENTONCES de la otra regla. Si consideramos a cada regla como un especie de microagente, podemos extender el papel de entrada/salida de los mensajes para que sean el soporte de las interacciones. Consideremos a cada regla como poseedora de sus propios detectores y efectores o, más específicamente, consideremos a cada regla como un mecanismo de procesamiento. La regla, entonces, tendrá la siguiente forma:
62
EL ORDEN
ocur:ro
63
AGENTES ADAP1ABLES
SI (hay un mensaje de la clase correcta) ENTONCES envíe un mensaje específico).
100010111.. .1,
l~Ll-~átiCO~ neumático
aceite bajo
# #
condición : seflal en el : camino del auto
tipo de camino
camino camino camino
acción
propiedades
'
i luz de alerta i
#
pinchazo
#
presi_ón de i aire pinchazo : presión baja::
# #
# #
•
# #
prepárate para detenerte orlllate al acotamiento
saca--~~umático de reF>_~est_?
11
=:JI
utiliza bomba de aire
.. FIGURA..
II.6. Un ejemplo de paralelis1no de regla.
A modo de ejemplo, imagínese que se encuentra en la situación que habíamos descrito con anterioridad (se pinchó un neumático cuando manejaba un Saab rojo por la autopista). La mayoría de nosotros nunca
68
EL ORDEN OCULTO
AGENTES ADAPTABLES
hemos manejado un Saab -rojo o de cualquier color-; no obstante, aun así estarían1os en cor1diciones de actuar apropiadamente, gracias a que podemos descomponer esta situación en varias partes, con cada una de la~ cuales sí estamos medianamente familiarizados. Por ejemplo, la mayona de nosotros ha tenido alguna experiencia con neumáticos pmchados; la mayoría de nosotros ha manejado por una autopista, etc. Esto puede describirse dentro de las reglas para manejar todos o casi todos los componentes de esta situación. En términos de nuestra sintaxis para los agentes basados en reglas, esto significa reglas en Ja forma de SI (se pincha un neumático mientras manejamos) ENTONCES (disminuir la velocidad), SI (se pincha un neumático en la autopista) ENTONCES (orillarse hacia el acotamiento), etc., codificadas en la sintaxis C/M (véase la figura U.6). Estas reglas, invocadas simultáneame.nte por los me11;sajes originados por el detector y por otras reglas, activan las secuencias apropiadas del efector. Por supuesto, en una situación real habría muchos medios tonos que no se podrían captar con un ejemplo tan simple como éste. Habría mensajes y reglas activas correspondientes a la memoria de corto plazo (relacionados con los sucesos recientemente ocurridos en la autopista), a los objetivos del viaje, etc. Cientos de reglas podrían estar activas, pero el principio de la descomposición de la situación en bloques de construcción familiares sería el mismo.
lelas. Si una hipótesis falla, hay otras reglas en competencia que están a la espera de ser probadas. Por supuesto, yo estoy a favor de este último punto de vista. La asignación de crédito es una tarea fácil cuando el medio ambiente produce una remuneración (recompensa, premio) por una acción. Si damos vuelta a la llave de ignición del motor y el auto arranca, esta acción rápidamente se convierte en parte de nuestro repertorio. La asignación de crédito se hace mucho más difícil cuando un conjunto de acciones "antiguas" hace posible un resultado reciente. El problema se puede exponer claramente si examinamos un juego de damas chinas. Dar un triple salto en este juego, cuando es posible, siempre contribuye a ganarlo y, como en el caso de la llave de ignición del motor, es fácil acreditar una regla que sugiere esa acción. Sin embargo, ¿cómo acreditaría esta regla un jugador neófito si su acción sólo produjera efectos después de cuatro jugadas? ¿Cómo sabrá el neófito que fue precisamente esa regla, y no otra, la que produjo el resultado en las etapas subsecuentes? ¿Cómo sabrá que este resultado no fue simplemente la consecuencia de un error cometido por su oponente? Sin embargo, un buen jugador de damas, así como las acciones complejas de un SCA, dependen de la habilidad para acreditar con anticipación y de establecer una adecuada secuencia de etapas. El problema de la asignación de crédito se hace todavía más complicado cuando consideramos un sistema de desempeño con muchas reglas activas simultáneamente. A medida que el sistema continúa adaptándose, algunas reglas se hacen más útiles y otras no; algunas descomponen el medio ambiente de tal manera que pueda ofrecer guías útiles para la acción, y otras no. Además, pueden pasar largos periodos antes de que las consecuencias de una acción actual sean evidentes. Algunas acciones pueden ser dañinas a corto plazo, pero útiles a largo plazo, como ocurre durante un juego de ajedrez. Con todos estos impedimentos, ¿cómo determina un agente qué reglas son útiles y cuáles son perjudiciales? Aquí podemos utilizar otra útil metáfora: el eslabón estándar entre la competencia y el capitalismo. Cada regla puede ser tratada como un productor (factor, hombre promedio) que compra y vende mensajes. Los "proveedores" de una regla son aquellos que envían mensajes que satisfacen sus condiciones; los "consumidores" de una regla son aquellos que actúan sobre sus mensajes. La fuerza de una regla es tratada como el efectivo en mano. Cuando una regla "compra" un mens'!je, debe pagar por él con el efectivo que tiene a la mano, con lo que se reduce su fuerza. Cuando una regla "vende" un mensaje, su fuerza se incrementa con la cantidad que le paga el comprador (véase la figura II. 7).
ADAPTACIÓN POR ASIGNACIÓN DE CRÉDfIO
Hasta ahora no hemos dicho nada acerca de la capacidad del agente para adaptarse. Hemos descrito el sistema de desempeño del agente, sus habilidades en un particular punto del tiempo. Ahora tenemos que analizar de qué manera. cambia el desempeño del sistema a medida que gana exper1enc1a.
El primer paso consiste en examinar con atención la función de las reglas en el sistema de desempeño. De acuerdo con el punto de vista usual, las reglas representan un conjunto de hechos acerca del medio ambiente; por tal motivo, todas las reglas deben mantener cierta consistcn~ia con las demás. Si se ir1troduce un carnbio o una nueva regla, debe venficarse que esto no provoque inconsistencias entre las reglas. Pero hay otra manera de considerar las reglas. Deben ser vistas com.o hipótesis que están bajo prueba y confirmación. Bajo este punto de. vista, el obJetNo es proporcionar contradicciones, más que tratar de evitarlas; es decir, las reglas vienen siendo opciones, hipótesis para-
69
70
EL ORDEN OCULTO proveedor
'"
regla R mensaje
AGENTES ADAPTABLES consumidor
mensaje
pago [6]
R después de la transacción: ~-@)NTóNéesA.{~~
aR
pago [8]
=
60 - 6 + 8
Reglas que determinan el escenario y que motivan que la recompensa sea fuerte FIGURA
IL 7. Asignación de crédito. Ca1nbiando la fuerza de la re[:;la.
La competencia es introducida a través de un proceso de subasta (véase la figura II.8). Sólo las reglas cuyas condiciones están satisfechas son elegibles para competir, y sólo los ganadores obtienen el derecho de enviar ("vender") sus m~nsajes. El monto de la oferta de una regla está determinada por su tuerza. Las reglas más fuertes hacen ofertas más altas. Después los ganadores pagan a sus proveedores, y los perdedores no pagan nada.
?
SI el objeto está a la izquierda ENTONCES gira la cabeza 15º a la izquierda SI el objeto está a la izquierda ENTONCES gira la cabeza 15º a la derecha
~
G
Las reglas actúan como hipótesis en competencia; cuanto más fuerte sea la regla, más posibilidades tiene de prevalecer en la competencia Sólo las reglas que ganan la competencia transmiten sus mensajes FIGURA
II.8. Competencia de las reglas en un sistema paralelo basado en reglas.
Después de competir, los ganadores tienen menos fuerza y sus proveedores más. Los ganadores, sin embargo, han obtenido el derecho de enviar sus mensajes, y con esto la posibilidad de tener consumidores que se los compren y les paguen por ellos. En este escenario, una regla ganadora prosperará -se hará más fuerte- sólo si sus consumidores le pagan una cantidad mayor de la que ésta pagó cuando ganó la subasta. (El viejo adagio del capitalismo dice: "Compra barato y vende caro".)
71
¿De qué manera exactamente este proceso de compra y venta ayuda al agente a resolver su problema de asignación de crédito? Para hacer la conexión, debemos determinar q11iénes son los consu111idores ("compradores") finales. Son las reglas que están activas cuando el agente recibe una recompensa abierta del medio ambiente. El agente sabe que estas acciones son deseables -como en el caso del salto tnple-, por lo que las reglas directamente responsables son auto!Iláticamente reforzadas. Debemos recordar que la recompensa explicita se reparte entre las reglas que están activas en el momento en que se otorga. Este proceso es muy parecido al del condicionamiento pavloviano, que consiste en el reforzamiento inmediato de las acciones deseables. Ahora consideremos cualquier regla que sea un proveedor mmediato de otra regla considerada como un consumidor final reforzado. Supongamoscque este proveedor ayuda a establecer el escenmio que hace posible que esta regla produzca una recompensa del med10 ambiente. Corno las recompensas hacen más fuerte al co11surnidor final, incrementan el monto de las propuestas, debido a que éstas son proporcionales a su fuerza. El proveedor, a su vez, se vuelve más fuerte debido a que recibe un pago mayor. Después de un tiempo, los proveedores de los proveedores también se beneficiarán de este incremento de fucrza,si continúan proveyendo de una plataforma (escenano) para que actue el proveedor anterior. Podemos repetir este proceso a través de toda la cadena de proveedores que proporcionan la plataforma para la recom. pensa explícita de la acción del último consumidor. Todas las reglas de la cadena finalmente serán reforzadas debido al progresivo refuerzo de sus consumidores. Pero todavía queda una duda: ¿Qué ocurriría si la regla-proveedor envía un mensaje que activa a la regla-último consumidor, pero "hace trampa" al no establecer un escenario apropiado para la acción de este consumidor? La regla-consumidor, entonces, no será recompensada, aun cuando haya pagado a su proveedor. Habrá pagado sin ser recompensada, con la consiguiente disminución de su fuerza_. Como consec11encia de esto, d11rante el siguiente ciclo de transacciones el proveedor que hizo trampa recibirá una paga menor por parte del consumidor. Debido a que el proveedor se encuentra en una etapa anterior a la del consumidor final en el proceso de construcción de fuerza, pronto llegará a un lugar situado por debajo del de sus competidores. Esto ocurrirá con toda seguridad si hay otras reglas que sí cumplen con establecer una plataforma para el consumidor final. Como puede verse, los tramposos no prosperan bajo este régimen. Se puede repetir este argumento a lo largo de cualquier cadena de proveedores.
EL ORDEN OCULTO
AGENTES ADAPTABLES
Este procedimiento de asignación de crédito, al cual llamaré el algoritmo de la brigada de la cubeta, refuerza las reglas que pertenecen a cadenas de acción que terminan en recompensas. El proceso constit11ye una confirmación de la hipótesis sobre el establecimiento de plataformas y metas. Los teoremas de las matemáticas aplicadas a la economía pueden ayudar _cuand'.' los apliquemos a ambientes estadísticamente regulares, y las simulaciones por computadora muestran que funcionan en una gran variedad de ambientes, particularmente cuando se combinan con la regla del proceso de descubrimiento.
un objeto pequeño moviéndose cerca, rl y r2 deben estar en competencia directa. Si r 1 y r2 tienen una fuerza más o menos igual, r2 tendrá la ventaja, debido a su mayor especificidad. Por lo tanto, r2 hace una oferta mayor debido a que utiliza más información acerca de la situación. Ahora por primera vez estamos en posición de discutir la formación de los modelos internos. En efecto, las dos reglas rl y r2 forman un modelo simple del medio ambiente. Pero es un modelo evidentemente no resuelto, debido a que rl y r2 entran en contradicción cuando son activados simultáneamente. No obstante, una inspección más de cerca de esta contradicción revela una especie de simbiosis entre estas dos reglas. Supongamos que este agente -una rana-vive en un medio ambiente en donde la mayoría de los objetos en movimiento -cigüeñas y mapaches- son peligrosos, pero los objetos en movimiento cercanos y pequeños, las "moscas'', son alimento. La regla más general, la rl, constituye una regla genérica para ser utilizada cuando no existe información detallada, la cual ordena: "Si se está moviendo, es peligroso". Pero si esta regla fuera aplicada siempre, la rana perecería de hambre debido a que huiría de todo objeto en movimiento, incluidas las moscas que constituyen su alimento. Por el contrario, la regla más específica, la t2, produce una acción correcta cuando las moscas están cerca, constituyendo una excepción para la regla genérica. Y, como es más específica, compite ventajosamente con la otra debido a que contiene la restricción "pequeño y cercano". El siguiente argumento revela la simbiosis. Cada vez que la regla genérica r1 comete un error, pierde fuerza. Cuando la regla r2 gana, previniendo el error, evita también el error de la rl. Así, la presencia de la r2, aun cuando contradice a la rl, en realidad la beneficia. Las dos reglas, juntas, proporcionan a la rana modelo una interacción mucho mejor con el medio ambiente que la que le proporcionaría una sola. Al formar modelos internos con la presente sintaxis, encontraremos que es más fácil descubrir y probar una regla general que una específica. Para comprobar esto, consideremos a un agente que tiene L ~ 100 detectores. La condición más simple que utiliza cualquier información es la que depende de un solo detector, teniendo el símbolo # para todos los demás detectores. Un caso típico sería la regla genérica para nuestra rana, la cual utiliza sólo la propiedad: "moviéndose". ¿Cuántas condiciones distintas hay exactamente que dependan de sólo uno de los 100 detectores? Podemos contarlas de la siguiente manera: seleccionemos cualquiera de los 100 detectores (posiciones) como la propiedad en la que estamos interesados. Después decidamos si la condición es requerir que la propiedad esté presente (1) o ausente (O); es
Modelos internos Existe una modificación para el proceso de subasta que lleva más adelante ~la cons_trucción de modelos internos, que está basada en la percepc10n mtultlva de_que, en igualdad de circunstancias, un agente prefiere reglas que utthcen más información acerca de una determinada situación. En nuestra sintaxis, la cantidad de información utilizada por una regla depende del número de símbolos # en las condiciones de la regla. Una regla es más específica si tiene menor cantidad de símbolos# en sus condiciones (véase la figura II.5). Por ejemplo, la condición## ... # acepta cualquier mensaje, por lo que no proporciona información alguna cuando es satisfecha. En el otro extremo, la condición 11. .. 1 es s~tisfecha por 11n mensaj'." específico -una cadena de unos-, proporc10nando el maximo posible de información. Para instrumentar la preferencia debemos modificar el proceso de subasta, y la manera más simple de lograrlo es haciendo a la oferta proporcional al producto de la fuerza y la especificidad. De este modo, si la fuerza o la especificidad están cerca de cero, la oferta también estará cerca de cero. Sólo si ambas -la fuerza y la especificidad- son grandes, la oferta será grande. Veamos una nueva c~mpetencia entre una regla más específica, rl, y una regla menos especifica, r2. Para que este ejemplo sea más concreto (figura II.9), hagamos que rl sea la regla del estímulo respuesta: SI (hay_ un ohjeto moviéndose en el medio ambiente) ENTONCES (huye), y permite que r2 sea la regla del estím11lo-respuesta. SI (hay un objeto pequeño moviéndose cerca en el medio ambiente) ENTONCES (aproxímate). Cualquier mensaje concerniente a un objeto que se mueve satisfará rl, pero sólo un subconjunto de estos mensajes satisfará r2; es decir, aquellos mensajes que informan sobre las propiedades adicionales del objeto: que éste es pequeño y que está cerca. Sin embargo, cuando hay
73
74
EL ORDEN OCULTO
AGENTES J\DAPTABLES
decir, podemos seleccionar cualquiera de las 100 posiciones, y hay dos posibilidades para cada posición. Por lo tanto, hay justo 200 diferentes posibles condiciones que utilizan un solo detector. La totalidad de estas 200 condiciones podría ser probada en un tiempo breve, para conocer su utilidad.
El número de condiciones generales no es menor, aunque éstas son probadas más frecuentemente por los agentes en los ambientes típicos. A modo de prueba, supongamos que todos los mensajes de los detectores son igualmente probables. En tal caso, un detector estará activado (1) con la misma frecuencia en que esté desactivado (O), lo cual equivale a decir que aproximadamente la mitad de todos los mensajes tendrán un valor de 1 para un detector dado. Consideremos ahora la condición general 1### ... #, la cual será satisfecha en aproximadamente la mitad del tiempo. Esta condición estará siendo probada con mucha frecuencia. Por lo tanto, la asignación de crédito rápidamente designará una fuerza apropiada a una regla que esté utilizando esta condición. Ahora contrastemos la ligeramente más específica condición 10### ... #. La mitad de los mensajes contendrá un 1 en la primera posición, pero sólo la mitad de éstos también tendrá un O en la segunda posición; es decir, sólo 1/2 x 1/2 ~ 1/ 4 de los mensajes satisfarán 10### ... #, parlo que la condición sólo será probada con la mitad de la frecuencia que 1### ... #.Puede verse fácilmente que la tasa de prueba cae a la mitad por cada valor de detector adicional utilizado por la condición.
\ se mueve, azul, pequeño, cercano, . .. ;
1
Mensaje de los detectores 1
''·...,,-''
.·
,.~
Regla
G)
01
Regla
0
01 (se mueve)(#) (pequeño) (cercano) ™ ™ acércate
(se mueve) (#) ... (#)
™™huye
75
Jerarquías genéricas o por omisión (default) conjunto de objetos
pequeños y cercanos que se mueven
FIGURA. II.9. Una jerarquía por omisión (default hierarchy) basada en reglas.
En el otro extremo está una condición que utiliza la totalidad de los detectores. En este caso tenemos que seleccionar una de las dos posibilidades - presente (1) y ausente (O)- para cada una de las 100 posiciones. Así tendremos:
2 X 2 X 2 ... X 2 ~ 2100 1
,___
100
-7
=1()30
1
distintas condiciones de esta clase. Este número enorn1e es mucho mayor que la edad que se le calcula al universo, medida en segundos. Claramente se ve que no es factible que haya algún agente que pruebe todas estas condicio11es.
Obviamente, las condiciones generales útiles -genéricas o por omisión- son más o menos fáciles de encontrar y establecer. Las reglas de excepción más específicas requieren progresivamente (a medida que se hacen más específicas) de más tiempo para ser descubiertas y establecidas, lo cual sugiere que, bajo el esquema de asignación de crédito, al principio, los agentes dependerán de reglas genéricas, mismas que son más útiles que las acciones aleatorias. A medida que la experiencia se acumula, estos modelos internos son modificados por la agregación de reglas de excepción, las cuales interactuarán simbióticamente con las reglas genéricas. El modelo resultante es llamado una jerarquía por omisión (default hierarchy) (véase la figura II.9). Por supuesto, la evolución puede haber "interiorizado" algunas reglas específicas (reflejos, por ejemplo), producidas por generaciones de selección genética. También puede suceder que, en respuesta a un prominente detector-mensaje, se desarrollen condiciones altamente específicas. Pero ninguno de estos casos contradice el principio de que la jerarquía por omisión se expande a través del tiempo desde lo genérico hacia excepciones específicas. Ahora necesitamos analizar los mecanismos que puede utilizar un agente para generar candidatos para la jerarquía por omisión.
i,
76
EL ORDE:N OCCLTO
ADAPTACIÓN POR EL DESCURRIM!ENTO DE LA REGLA
El primer proceso que se me ocurre para la generación de reglas es realizar una especie de tanteo aleatorio, haciendo cambios aleatorios limitados por las reglas que ya están establecidas. Este procedimiento p.uede funcionar en ocasiones, pero no hace mucho uso de la expenencra del sistema. Los verdaderos cambios aleatorios son como el lanzamiento de una moneda al aire: lo que ocurre después no depende de lo que ha ocurrido antes. Hacer cambios aleatorios en un modelo interno complicado -como en una jerarquía por omisión- con la esperanza de mejorarlo equivale a hacer cambios aleatorios en una fórmula complicada: la mayor parte de ellos no provocarán ninguna mejora. ¿Qué otras opciones existen? Nos irá mejor si podemos asegurar alguna clase de verosimilitud para las reglas recién generadas; es decir, que no sean evidentemente equívocas cuando se contemplen a la luz de la experiencia. En la mayoría de los casos la verosimilitud proviene del uso de bloques de construcción ya probados. Si regresamos al ejemplo del "neumático pinchado mientras manejábamos un Saab rojo en ]a autopista", veremos que la verosimilitud provino del uso de bien conocidos bloques de construcción para describir la nueva situación. Si seguimos esta línea de pensamiento, el siguiente paso sería encontrar componentes -bloques de construcción- para las reglas individuales. En tal caso, un componente que aparezca consistentemente en reglas "fuertes" sería un posible candidato para ser utilizado en las nuevas reglas. Con el uso de suficientes reglas "fuertes" y métodos útiles para localizar los componentes en ellas podremos generar un vasto número de nuevas reglas sin apartarnos en ningún momento de los componentes ya probados. Estas nuevas reglas serán sólo posibles candidatos -podrían resultar no idóneas-, pero el proceso debe ser considerablemente más eficiente que el del tanteo aleatorio. Y, por supuesto, puede haber otros métodos para descubrir los componentes de una nueva regla, con lo que se abrirán nuevos campos para pruebas. Un breve vistazo al papel de los bloques de construcción ya probados en la innovación técnica nos ayudará a comprender la función de dichos bloques en el caso específico de la innovación de una regla. Un repaso de la historia nos mostrará que las innovaciones técnicas casi siempre surgen como una combinación particular de bloques de construcción bien conocidos. Tomemos dos innovaciones tecnológicas que han revolucionado la sociedad del siglo xx: el motor de combustión interna y la computadora digital. El motor de combustión interna combina el artificio productor de chispas eléctricas de Volta, el atomi-
AGENTES ADAPTABI fü
77
zador de Venturi, una bomba de agua, pistones, juegos de engranes, etc. Las primeras computadoras digitales combinaban un conta.dor de partículas Geiger, un tubo de rayos catódicos de imag'.'n persistente (de desvanecimiento lento), cables para conduor corrientes, etc. En ambos casos la mayoría de los bloques de construcción ya estaba en uso, en diferentes contextos, desde el siglo XIX. Fue una combinación específica, entre un gran número de combinaciones posibles, la_ que permitió la innovación. Cuando un nuevo bloque de construccion es descubierto, el resultado es, generalmente, una sene de mnovaoones. El transistor revolucionó un gran número de aparatos, desde computadoras hasta radios portátiles. Incluso se pueden obtener nuevos bloques de construcción, o parte de ellos, por medio de la con_ibinación de bloques de construcción más elementales. La construccwn de los transistores se basó en el conocimiento de los rectificadores de selenio y de los semiconductores en general. Esquemas
¿Cómo podemos abordar el tema de los bloques de cm1strucció.n para reglas? El enfoque más directo, desde el punto de vista de la smtax1s de las reglas utilizadas en este libro, consiste en expl~tar los valores en posiciones seleccionadas en la secuencia o cadena bmana de la regla como bloques de construcción potenciales. Por ejemplo, podemos preguntar si es o no útil, en promedio, iniciar u11a c.ondición :~1: un 1 en la primera posición. En el caso de la rana, la pnmera posJC10n corresponde al detector de movimiento. Para !_a r~na, la pregunta acerca de la utilización de un 1 en la primera posJCion como un bloque de construcción con1ún para nuevas reglas conduce a otra pregunta acerca de la importancia del movimiento en el medio ai:ibiente . . . Este enfoque, que trata los valores de las pos1.c10nes mdividuales como bloques de construcción, tiene muchas similitudes con.~] enfoque clásico para la evaluación de los efectos de los genes md1viduales sobre un cromosoma. Cada gen tiene vanas formas alternativas, llamadas alelos. Los diferentes alelos del gen humano para el color de los ojos, por ejemplo, produce ojos azules, cafés, verdes; etc. También podemos echar un vistazo a los experimentos con ch1charos realizados por Mcndel en el siglo XIX (muy bien descritos por Ore!, 1984), que constituyen el fundamento de la genética moderna. Entre los genes i~ vestigados por Mendel estaba uno que controlaba la textura superficial de Jos chícharos. Un alelo producía un chícharo de superfioe tersa, mientras que otro generaba una superficie rugosa. Por lo general, los
EL ORDEN ocrn:ro
1\GENTES ADAPTABLES
genes tienen formas alternativas, y estas diferentes formas com(1nmen-
para designar tal bloque de construcción. El hecho de que queramos destacar algunas posiciones específicas e ignorar otras sugiere que hagamos un nuevo uso del símbolo "no importa" que utilizamos en la sintaxis para las condiciones de las reglas. Así pues, utilicemos el nuevo símbolo "*" para no confundir los dos usos. Si estamos interesados en un bloque de construcción que coloque un 1 en la primera posición de una condición, lo escribimos de la sigui en te manera:
78
te tienen distintos efectos observables en el organismo. El objetivo de la genética, en lo relativo a las reglas, es determinar los efectos que tienen las diferentes opciones en diferentes posiciones. En la genética matemática existe un enfoque clásico para determinar estos efectos, y consiste en asumir que cada alelo contribuye con algo, positivo o negativo, al proceso general de adaptación del organismo. Estas contribuciones son evaluadas observando la capacidad de adaptación promedio de los individuos que son portadores de este alelo. Por ejemplo, los chícharos de superficie tersa podrían tender a germinar más frecuentemente y, en tal caso, al alelo para la superficie tersa se le podría asignar una contribución positiva para el proceso de adaptación. Al menos en principio, podríamos proseguir de esta manera a través de cada uno de los genes y los alelos. El total de aptitudes (valor, fuerza) de cualquier cromosoma es la suma de las contribuciones de sus bloques de construcción constituyentes: los alelos. Existen dos importantes dificultades en relación con el enfoque posición-por-posición. En primer lugar, un alelo dado puede tener diferentes efectos en diferentes ambientes. Los ojos azules pueden ser valiosos en las latitudes nórdicas, pero constituir un rasgo negativo en las regiones ecuatoriales. Más importante es el hecho de que los alelos interactúan entre sí. Es raro que los efectos de cualquier gen puedan ser aislados, como en los casos especiales del color de los ojos o de la superficie de un chícharo. Ciertos genes particulares afectan muchas características, y los efectos de los diferentes genes se traslapan. En síntesis, la capacidad para la adaptación a un medio ambiente dado es una función no lineal de los alelos. Cuando pasamos del tema de la genética al de las reglas SI/ENTONCES, la primera de estas dificultades desaparece automáticamente. La parte condicional de la regla (SI) selecciona automáticamente el medio ambiente en el que ésta actuará. Así que la evaluación de las partes de la regla procede únicamente en ambientes para los que está diseñada. La segunda dificultad -la no-linealidad- no es fácil de resolver, ya sea en genética o en el manejo de las reglas. A continuación propongo un enfoque que funciona en ambos casos. Para empezar, debemos tomar en consideración los bloques de construcción que utilizan más de una posición en la cadena binaria; esto es, deben1os tomar en consideración los bloques de construcción que abarquen las primeras tres posiciones, o un bloque de construcción que abarque las posiciones 1, 3 y 7. En el caso del ejemplo de la rana podría ser un bloque de construcción que amalgame "movimiento" "peqlreño" y "cercano". También necesitamos ur1 método simple
79
l****··· *
l;,-L--71 Si estamos interesados en un bloque de construcción que coloque un 1 en la primera posición, un símbolo # en la tercera posición y un O en la séptima posición, lo diseñamos de la sigui en te manera: !*#*º**···*
l;,-L--71 Un bloque de construcción definido de esta manera recibe el nombre de esquema; las posiciones en la cadena binaria que contienen símbolos que no sean "*" reciben el nombre de posiciones de definición del esquema. Tomemos nota de que el símbolo# desempeña un papel diferente al del símbolo*· Recuerde además que el conjunto de todas las condiciones posibles para las reglas se especific'a formalmente como {l,0,#]L; o sea, el conjunto de todas las cadenas binarias de longitud L que utilizan el alfabeto {1,0,#}. Cada condición especifica el conjunto de mensajes que puede aceptar. Podemos interpretar un esquema de manera similar. Al definir el esquema, restringimos algunas de las posiciones en la condición -las posiciones de definición- para obtener uno de los valores de {l,0,#), y no hacemos ningún requerimiento a las condiciones restantes, indicando esto por medio de una*· Formalmente, entonces, el conjunto de un esquema para las condiciones es el conjunto de todas las secuencias binarias de la forma {l ,0,#*Jl'. Un esquema individual de {1,0,#*}L especifica el conjunto de todas las condiciones que utilizan ese bloque de construcción, de la misma manera en que una condición individual {1,0,#)L especifica el conjunto de mensajes que puede aceptar. Este convencionalismo matemático -que la condición sea identificada con el conjunto de mensajes que puede aceptar, mientras que el
80
AGENTES ADAPTABLES
EL ORDEN OCULTO
esquema sea identificado con el conjunto de condiciones que contiene como bloque de construcción- ayuda a distinguir al símbolo# del símbolo*· La condición 1#111...l acepta únicamente dos mensajes (10111.. .l y 1111...1). Por el contrario, el esquema 1*111. .. 1 aparece en tres distintas condiciones (1#111...1, 10111...1y11111 ... 1). La primera de estas condiciones acepta dos mensajes 10111 ... 1y11111. .. 1), mientras que la segunda condición acepta sólo un mensaje (10111.. .l); la tercera condición también acepta un solo mensaje ( 11111. .. 1). El símbolo * nos ayuda a definir los diferentes conjuntos de condiciones, mientras que el símbolo # nos ayuda a definir los diferentes conjuntos de mensajes.
81
minan las acciones del agente, así que constituyen el núcleo del modelo interno del agente. • Los descendientes no son idénticos a sus padres, lo cual constituye un genuino descubrimiento. Los descendientes, tanto en genética como en los sistemas basados en reglas, constituyen las nuevas hipótesis que van a ser probadas en el medio ambiente. En genética, una interacción llamada entrecruzamiento provoca que las características de los padres aparezcan en una nueva combinación en los descendientes. Es esta recombinación de conjuntos de alelos lo que resulta más interesante desde el punto de vista del descubrimiento de las reglas, así que lo discutiremos ampliamente.
El cruzamiento y la aptitud de los esquemas Operador de cruzamiento
Con esta noción de los bloques de construcción ya podemos discutir la generación de nuevas reglas verosímiles de man_era cuidadosa. Y en este caso resulta que la metáfora de la genética puede ser ampliada para que nos guíe hacia un procedimiento factible. Como se recordará, las posiciones de los genes en los cromosomas corresponden a las posiciones en la cadena binaria que definen a la regla: los diferentes alelos corresponden a los diferentes valores {l,0,#} que pueden ser colocados en cada posición de la cadena binaria de la regla. Y todavía podemos ir más lejos. La genética matemática generalmente asigna un valor numérico, llamado aptitud, a cada cromosoma. Este valor numérico indica la capacidad del organismo correspondiente para producir descendencia con capacidad de supervivencia, como en el caso de los guisantes de Mendel. De manera similar, la fuerza asignada a una regla bajo la asignación de crédito mide la utilidad de la regla. Si se sustituye la palabra "sobrevivencia" por la palabra "utilidad", entonces la palabra "aptitud" puede ser sustituida por la palabra "utilidad". Para extender todavía más la metáfora, consideremos a la fuerza como la contraparte de la aptitud. La extensión de la metáfora nos sugiere un procedimiento. Los organismos aptos son padres exitosos que producen descendencia que a su vez se convertirá en padres. Esta analogía nos sugiere que tratemos a las reglas fuertes como si fueran padres. De esta correspondencia surgen las siguientes ideas útiles:
5 punto de cruce
l111o#l#1j
1110###
I'º''º o 11u11 # # 1 Algoritmos genéticos
Fortaleza Progenitores
[aptitud]
@110###
(i) # # o 1 1 1 ----{()] o~O~#
1
010##10------->-[QJ
#~of&L~# # 0#01##1 # # # 1
Fortaleza promedio de todos los individuos = 1
• Los descendientes normalmente coexisten con sus padres, remplazando a los contendientes más débiles del medio ambiente. En un sistema basado en reglas, este arreglo es importante debido a que las reglas fuertes representan el conocimiento ganado. En un régimen de competencia, las reglas fuertes generalmente son las que deter-
Fortalezapromediodeloscasosde
G)******
=
Fortalezapromediodeloscasosde
*~*[~~**
= (2+2+ 1)/3 = 5/3
FIGURA
(1+O+1)/3 = 2/3
TI. 1O. Cruzamiento y algoritmos genéticos.
82
EL ORDEN
ocut:ro
El cruzamiento es el mecanismo que los cria-
FTG-l:RA 111.2. {}n agente en el JVlodeloEcho.
~----
f;fffh¡'l b
b e
o..
a a
a b
b 111111111111~-
C} b
Interacción del agente
FIGL'RA
~Sitio
a
,,,-,,~.
·--·~ a a
Flujo de recursos
{a,b,c} son recursos
O
e
Agentes
~
IIl.1. Vüta panorámica del Modelo Echo.
En este primer modelo sencillo, cada agente tiene un solo cromosoma, que no hace otra cosa más que especificar dos marbetes: un marbete de ataque* y un marbete de defensa. Todas las interacciones en el modelo están mediadas por estos marbetes. Cuando se encuentran dos agentes en un sitio, el marbete de ataque del agente se confronta** con el marbete de defensa del otro agente, y viceversa. El objetivo de esto es utilizar la cercanía de los rivales para determinar cómo son intercambiados los recursos entre estos agentes (figura III.3). Por ejemplo, si el marbete de ataque de un agente está bien ensamblado con el marbete de defensa del otro, obtendrá la mayoría de los recursos del agente rival, incluso los recursos contenidos en su cromosoma, provocándole la "muerte''. Por otro lado, si el marbete de ataque está mal ensamblado con el marbete de defensa del otro, el agente "atacante" sólo recibirá una pequeña fracción de los recursos del otro, e incluso puede no recibir nada. Para determinar qué tan bien se ensambla (concuerda) la cadena binaria de ataque de un agente con la cadena de otro, las cadenas del marbete del primero se alinean de tal manera que sus extremos izquierdos sean coincidentes. Por lo tanto, la puntuación del encuentro es determinada recorriendo las cadenas posición por posición. En cada posición se asigna un valor, tomado de un cuadro, para dar un valor determinado a cada posible par de letras (véase la "Puntuación del si* Como se podrá ver tnás adelante, la expresión "de ataque" en algunas ocasiones significa "de enganche" o "de confrontación"; sin ernbargo, decidimos dt:jarla tal cual para que el lector no piense que se trata de otro 1narbete. [N. del T.] ** ... is match.ed againsl ... La palabrd match a veces designa confrontación o encuentro (deportivo, por jemplo) y a veces concordancia, confluencia. Procuramos reservar los términos "aparcar" y "apareantiento" para traducir mate y nwting. [N. del -r l
118
~:L
EL ORDEN OCULTO
tio" de la figura 111.3). Por ejemplo. una b confrontada con una b podría agregar 2 puntos, mientras que una b confrontada con una d podría restar 2 puntos. Si un marbete es más largo que otro, entonces cada posición sin un par de letras equivale a un número fijo de puntos (positivos o negativos). El puntaje total del encuentro es simplemente la suma obtenida por la adición de estos puntos. Agente CD
SURGWIENT() DEL MODELO ECIIO
119
para confrontarse con marbetes de defensa de otros agentes o sitios. Esto evita pérdidas de recursos dependiendo de la habilidad de su marbete de defensa para evitar confrontaciones con marbetes de ataque de otros agentes.
Agente@
falU
~
"Hormiga"
• ~---~-----~~--~concordancia Ataque: G) e e e a Defensa: f) e e e b a b
fJ
CD
Puntuación 2+2+2-1 = ~
2-1
del encuentro:
=
ITJ
RESULTADO: TRANSACCIÓN DESIGUAL
e
transfiere la mayor parte del contenido de su reserva a
G)
G)
transfiere parte de sus excedentes
,9
--------------------------------------------------------------------------------
discordancia
TI
1
f
e e e e e b
¡-extra 'f'
[letra(s)
extra en la secuencia
C
de
defensa]
concordancia discordancia extra Puntuación del sitio
-1
o
"Oruga"
Cantidad transferida
-'""""l;;· 100% de reserva -- ---------- ------------
100% de excedente -- ------ ---------------· Puntuación
2
4
6
8
del encuentro
!ji FIGURA
! :
III.3. Intercambio de recursos. FIGUR.A
En este modelo las posibilidades de un agente determinado dependen enteramente del par de marbetes que lleva. Podemos incluso extender esta estructura a las interacciones con el propio sitio en donde se encuentra, asignando marbetes de defensa a este sitio. El agente adquiere recursos de acuerdo con la capacidad de su marbete de ataque
III.4. ,':ú,mulación Echo del triángulo oruga-hormiga-mosca.
A primera vista, parece que esta versión podría simplificarse todavía máB si se permitiera sólo un marbete por agente. Sin embargo, un análisis más cuidadoso revela que así perderíamos una propiedad vital
:.i
121
EL ORDEN OCULTO
EL SURGIMIENTO DEL MODELO ECHO
de las interacciones de un SCA. Un solo marbete para cada agente forzaría la transitividad de las interacciones: si el agente A puede "comerse" al agente By el agente B puede "comerse" al agente C; entonces, con un solo marbete y en condiciones de transitividad, el agente A puede "comerse" al agente C. Sin embargo, generalmente las interacciones en los SCA no satisfacen esta propiedad. En los ecosistemas reales los halcones se comen a los conejos y los conejos comen hierba, pero nunca se da el caso de que un halcón se coma directamente la hierba. El uso de dos marbetes nos permite evitar esta restricción (véase la figura III.3). Incluso esta versión simple del Modelo Echo ofrece interesantes interrelaciones entre los agentes, una vez que es desechado el problema de la transitividad. Por ejemplo, existe una interesante relación triangular, descrita por Holldobler y Wilson en su monumental obra The Ants (1990), que puede ser imitada por el Modelo Echo (véase la figura III.4). Una esquina de este triángulo de interacción está ocupada por una oruga que exuda una especie de néctar por la piel. Otra esquina está ocupada por una mosca que pone sus huevos sobre la oruga, convirtiéndose en depredadora de ésta a través de sus larvas. La tercera esquina está ocupada por una especie de hormiga que es una feroz depredadora de la mosca. La hormiga también se alimenta del néctar de la oruga, pero no de la oruga misma. Por supuesto que cuando la oruga está rodeada de hormigas sufre menos depredación que si estuviera rodeada de moscas. f>or lo tanto, la oruga negocia parte de sus recursos con las hormigas a cambio de que la protejan de las moscas. Este triángulo constituye una relación estable, pero cambia drásticamente si uno de los elementos es removido. Este triángulo constituye, de varias maneras, tina interesar1te pr11eba del Modelo Echo. En primer lugar está la cuestión de la "existencia": ¿Podemos diseñar marbetes para tres diferentes clases de agentes que permitan la negociación entre dos de ellos, conservando al mismo tiempo las relaciones de depredación entre los tres? La respuesta es sí (véase la figura III.4). En segundo lugar, ¿podemos ajustar el Modelo Echo para que funcione con poblaciones de estos agentes y mantenga una persistente relación triangular? Nuevamente la respuesta es sí, aun cuando ocurren sorprendentes desarrollos durante el transcurso de largos periodos. Incluso es posible que el depredador del final de la cadena alimenticia, la hormiga, muera por cualquier causa, provocando una relación oscilatoria depredador-presa entre la mosca y la oruga -una relación de la clase descrita por las ecuaciones Lotka-Volterra (Lotka, 1956)-. Finalmente, ¿podemos observar la evolución de tal triángulo desde un punto de arranqne más simple?
Hasta ahora no lo sabemos, debido a que todavía no se ha hecho ese experimento.
120
EXTENSIÓN DEL MODELO BÁSICO
Aun cuando podemos aprender más del modelo básico, éste es sólo un paso hacia la modelación de las complejidades de un scA completamente desarrollado. En particular, el modelo básico no proporciona suficientes herramientas para un amplio estudio del modo en que emergen las estructuras jerárquicas complejas. Sin embargo, dichas estructuras constituyen una parte importante de todos los SCA. Esta sección describe extensiones que amplían el Modelo Echo hasta el punto en que tales fenómenos pueden ser examinados. Al tratar de modelar fenómenos como las "estructuras jerárquicas complejas" necesitamos tener en mente uno o más ejemplos que estén correctamente descritos. El ejemplo que ha guiado gran parte de mi propio trabajo en esta área es la embriogénesis de los metazoarios -el proceso mediante el cual un huevo fertilizado progresivamente se divide hasta que produce un organismo multicelular maduro que a su vez se reproduce por medio de la producción de otro huevo fertilizado-. La estructura de un metazoario maduro, como un mamífero, es increíblemente compleja, ya que contiene complejos subproductos jerárquicos, como redes nerviosas, sistemas inmunes, sistema visual, etc. Un anatomista diría que tales estructuras sólo pueden ser totalmente comprendidas en términos de su origen y desarrollo en el metazoario en proceso de maduración. Y así ocurre con otros scA. Sólo podemos comprender estos "patrones en el tiempo", como la ciudad de Nueva York o un bosque tropical, si podemos comprender su origen y la manera en la que se han desarrollado. ¿Qué ocurre exactamente cuando un huevo fertilizado se desarrolla hasta convertirse en un compJicado metazoario, como un tigre, por ejemplo? Un tigre tiene cientos de miles de millones de células, organizadas de tal manera que hace que nuestras más complicadas computadoras parezcan mecanismos muy simples. Gran parte del proceso de desarrollo todavía no ha sido comprendida; no obstante, en la actualidad ya tenemos un esbozo de los principales hechos que ocurren durante dicho proceso. El proceso se inicia cuando el huevo comienza a dividirse en dos células. Después ocurren más divisiones, que a la vez producen más duplicaciones. Estas duplicaciones provocan un rápido incremento en el número de células (30 duplicaciones son suficientes para producir mil millones de células). Las células "hijas"' no se mueven de un lugar a otro como entidades libres, sino que permanecen
122
EL ORDEN OCULTO
adheridas tanto a las células progenitoras como a otras células de su "generación". Pronto, el nú1nero de cél11Jas se incrementa lo suficiente corno para formar una bola hueca, en la que se forma una parte interior y otra exterior. La concentración de varios metabolitos -sustancias bioquímicas producidas por las reacciones de las células- comienza a variar de célula a célula. Algunos metabolitos se diluyen cuando están afuera de las células, pero permanecen altamente concentrados en el interior de ellas, etcétera. Se sabe con certeza que los cambios en las concentraciones de metabolitos pueden provocar que los diferentes genes de los cromosomas de las células sean activados y desactivados; es decir, las células pueden responder a ciertos metabolitos iniciando nuevas actividades e interrumpiendo otras. Por lo tanto, células con los mismos cromosomas pueden tener muy diferentes actividades y formas. En un metazoario como un tigre, este factor, más ql1e cualquier otro, es el responsable de las inmensas diferencias que existen entre las células que lo conforman. En un tigre, las células del sistema nervioso son muy diferentes de las células de la piel, aun cuando ambas llevan los mismos cromosomas. Cuando las células del embrión en desarrollo incrementan su número, diferentes genes se activan y se desactivan, provocando una variación todavía mayor en las concentraciones de metabolitos de las diferentes células. Este cambio, a su vez, altera la manera en la que las células se adhieren entre sí, dando lugar al surgimiento de cambios en la forma de los agregados celulares. La bola inicial de células pasa por un proceso cada vez más complejo de transformaciones, que finalmente conduce a la formación de estructuras locales que se convierten en órganos, redes nerviosas, etcétera. Mi objetivo, entonces, es extender el Modelo Echo, de manera que pueda mimetizar el proceso produciendo un agregado complejo bien organizado a partir de una sola "semilla". Aun cuando el resumen que acabamos de presentar no hace justicia a las sutilezas del proceso de la ernbriogénesis, sugiere algunos mecanismos que el Modelo Echo debe incl11ir: l. Necesitamos agregar algunos medios a través de los cuales los agentes puedan adherirse unos a otros. Se debe incluir una disposición para la formación de fronteras que permita a los agregados resultantes formar partes funcionalmente diferenciadas. 2. Necesitamos hacer que los agentes sean capaces de transformar los recursos, mimetizando con esto la capacidad de una célula para transformar, a determinado costo, recursos comunes y abundantes en recursos indispensables pero escasos.
EL SURGIMIENTO DEL MODELO ECHO
123
3. Necesitamos extender la definición de la secuencia o cadena cromosómica de manera que partes de ella pueden ser activadas y desactivadas, para que afecten las interacciones de los agentes participantes. Además, el proceso de activar y de desactivar estas partes debe hacerse sensible a las actividades de los agentes, mimetizando con ello el efecto de los metabolitos en las células biológicas. Querernos mantener el formato simple de los agentes del modelo básico cuando agreguemos habilidades a Echo. En particular, querernos mantener los siguientes tres rasgos: 1) la estructura simple especificada en la cadena, 2) la reproducción limitada por la adquisición de recursos, y 3) la interacción mediada por marbetes. La única manera en la que podemos proveer a un cromosoma de genes "desactivables", manteniendo al mismo tiempo este formato, es tratando a los agentes corno organelos o componentes de una entidad "celular" más compleja; es decir, los agentes y su estructura fija serían agregados, convirtiéndose en una estructura compleja variable, a la cual llamaremos multiagente. Si procedemos con cuidado, podemos proveer al rnultiagente de un cromosoma que pueda ser "heredado" a sus descendientes, permitiendo al mismo tiempo al conjunto de agentes primarios (organelos) variar cuando pasen del "padre" a los descendientes; es decir, que el cromosoma del rnultiagcnte describa la gama de agentes (organelos) que puede contener, pero que los descendientes de dicho multiagente contengan sólo algunos de estos agentes. Si hacemos que los agentes contenidos en la descendencia sean dependientes de las actividades que ocurran dentro del multiagente padre, obtenernos el efecto de activar y desactivar los genes. Por lo tanto, estos multiagentes "celulares" podrán reproducirse y agregarse para convertirse en abigarradas estructtlras jerárquicas que mimetizarán a los metazoarios. Esta es, en síntesis, la línea que seguiremos. La instrumentación más simple que hemos podido concebir dentro de estas restricciones requiere que los agentes primarios sean dotados de otros cinco mecanismos, adicionales a los mecanismos de interacción mediada por marbetes y a la reproducción ya previstos en el modelo básico: 1. Un mecanismo que permita la interacción selectiva. U na condición de interacción que inspecciona a otros agentes para determinar si tiene lugar o no una interacción (de una manera muy similar a cómo la condición de una regla revisa un mensaje). 2. Un mecanismo que permita la transformación de los recursos. Con este mecanismo el agente recibe la capacidad para transformar un re-
124
EL ORDEN OCULTO
curso en otro, al costo de reunir los recursos necesarios para definir un segmento de tran:-.formación en la cadena cromosómica. Por ejemplo, con un apropiado segmento de transformación, un age_nte puede transformar un recurso abundante en otro que necesite para su reproducción. Este proceso abre muchas posibilidades para la especialización de los agentes de un multiagente. 3. Un mecanismo que determine la adhesión entre los ar;entes. (Este mecanismo es instrumentado en términos de un ma;bete de adhesión. La "cantidad" de adhesión entre dos agentes se determina por el grado de concordancia entre sus marbetes de adhesión. 4. Un mecanismo que permita el apareamiento selectivo. Su instrumentación es por medio de una condición de apareamiento que inspecciona el marbete de interacción de una potencial pareja. Un par de agentes que tengan suficientes recursos para reproducirse produci~án descendencia por cruzamiento si sus condiciones de apareamiento son mutuarr1ente satisfechas. 5. Un mecanismo para la replicación condicional. Una condición de replicación que inspecciona la actividad de otros agentes que pertenecen al mismo agregado multiagente. Aun después de que un agente ha reunido suficientes recursos para hacer una copia de su cadena cromosómica, únicamente se reproduce si su condición de replicación es satisfecha por la actividad de algún otro agente en el agregado. Este mecanismo es el que permite la activación y desactivación de los genes. En la siguiente sección veremos que la adición de estos mecanismos produce una secuencia de versiones más elaboradas del Modelo Echo. A medida que agreguemos cada mecanismo, utilizaremos la sintaxis proporcionada por Echo para volver a describir las capacidades adicionales. Si mis conjeturas son correctas, el modelo final de la secuencia permitirá mimetizar la embriogénesis de los organismos multicelulares o los orígenes de las organizaciones de multiagentes, como la fábrica de alhleres de Adam Smith. Cada uno de estos mecanismos se puede instrumentar de manera sorprendentemente fácil en una computadora, aun cuando las descripcion_es verbales que siguen a veces son complicadas. En la siguiente secc10n aparecen los detalles técnicos que demuestran que estos mecamsmos realmente se adecuan al marco de trabajo del Modelo Echo. No obstante, si el lector está dispuesto a confiar en mi afirmación de que efectivamente son compatibles los mecanismos agregados y el Modelo Echo, puede saltarse esta sección, sin que esto afecte en absoluto Sll comprensió11 de las secciones subsiguientes.
EL SURGIMIENTO DEL MODELO ECHO
125
LAS EXTENSlONES
Como lo anticipé, cada modelo de esta secuencia extiende (amplía) al modelo previo agregando un mecanismo adicional. Finalmente, el último modelo de la secuencia incorpora los cinco mecanismos detallados anteriormente. Modelo 2: Intercambio condicional
Ahora el objetivo es dar a cada agente la posibilidad de rechazar intercambios con otros agentes. Para lograr esto, conservamos un solo cromosoma para el agente, pero dicho cromosoma ahora está dividido en dos partes: un segmento de control y un segmento de marbetes (veáse la figura III.5). El segmento de control proporciona una condición de intercambio que inspecciona el marbete de ofensa en el otro cromosoma interactuante; la condición de intercambio trata a este marbete casi de la misma manera como una regla trata a los mensajes de un agente basado en reglas. Debido a que los marbetes son definidos a través del alfabeto de recursos, la condición de intercambio responde a las cadenas del alfabeto de recursos, más que a las cadenas binarias utilizadas para los mensajes del sistema basado en reglas. Para definir la condición de intercambio utilizamos un símbolo de "no importa", como en el capítulo Il. Podemos evitar agregar un nuevo símbolo al alfabeto de recursos simplemente designando como símbolo de "no importa" a uno de los símbolos que ya se encuentre en el alfabeto. Así, en nuestro ejemplo anterior, en el que utilizamos el alfabeto {a,b,c,d}, restringiríamos la definición de los marbetes para el subalfabeto {a, b, e} construyendo cadenas o secuencias a través del alfabeto completo {a,b,c,#(=d)} para definir las condiciones. A diferencia de las longitudes estandarizadas de los mensajes, los marbetes pueden ser de diferentes longitudes, y de acuerdo con esto podemos redefinir una condición. Para manipular longitudes arbitrarias tratamos a la última letra especificada en la cadena de la condición como si estuviera acompañada por un número indefinido de símbolos de "no importa". Así, la condición b#b ( =bdb) es tratada como si fuera la condición b#b#### ... He aquí un par de ejemplos: La condición a acepta, para el intercambio de recursos, a cualquier agente que tenga un marbete de ataque que comience con una a; esto es, acepta a cualquier marbete de ataque del conjunto {a, aa, ab, ac, aaa, aab, aac, aba, abb, ... }. Por su parte, la condición bcb acepta cualquier marbete de ataque que comience con bcb. La condición b#b es un poco más com-
126
EL ORDEN OCULTO
EL SL'RGIMIENTO DEL MODEL() EClIO
plicada, ya que acepta cualquier marbete de ataque que tenga una ben la primera y tercera posiciones, esto es, el conjunto {bab, bbb, bcb, baba,
en el Modelo Echo. Como veremos más adelante, esta opción puede ser crítica para ciertos agentes si ur1 recurso en especial es escaso. En particular, cuando llegamos a los multiagentes estructurados en capas, la transformación del recurso ofrece interesantes oportunidades para la especialización. Y aquí nuevamente aplicaremos el enfoque más simple posible, dejando las elaboraciones para futuros modelos. Pensemos en los recursos "renovables" que apuntalan las estructuras del agente en el Modelo Echo. Consideremos cada uno de estos recursos como una molécula que tiene una estructura interior. Utilizando la biología molecular como guía, podemos pensar en trasformar un recurso en otro reacomodando su estructura "molecular". En una célula biológica, tales transformaciones son controladas por las enzimas (los potentes catalizadores biológicos que pueden acelerar la velocidad de una reacción hasta 10 000 veces o más). Nuestro objetivo es dotar a los agentes con un equivalente de las enzimas. Debido a que estoy tratando de evitar cuestiones concernientes al metabolismo del ensamble, prefiero no comentar los detalles de la estructura de los recursos. Mi objetivo es, más bien, proporcionar a los agentes un método directo para transformar las letras-recursos, {a,b,c,d,}, de nuestro actual ejemplo en otras letras-recursos. La manera más simple de hacer esto es agregando un segmento al cromosoma por cada transformación deseada. Es importante que haya un "costo" para esta operación, ya que de otro modo los recursos serían libremente intercambiables, por lo que no tendríamos manera de estudiar los efectos de la escasez de estos recursos. El costo, como e11 los modelos anteriores, lo constituirá el requerimiento de que los agentes usen letras-recursos para construir la especificación del s11bseg111ento enzimático. Por cada transformación debe haber un subsegmento enzimático del segmento de control, y el costo será el esfuerzo requerido para obtener las letras adicionales necesarias para especificar estos segmentos de transformación. El subsegmento de transformación debe, por lo menos, especificar la letra que va a ser transformada y la letra que resultará de la transformación (figura III.6). El diseño más simple utilizaría sólo dos letras. Si la letra a va a ser transformada en b, entonces el subsegmento de transformación sería la subcadena ab. Si el segmento de transformación va a ser más costoso, entonces se requieren letras adicionales. Por ejemplo, el segmento de transformación de a a b sería la subcadena abccc. Podemos considerar que la a y la b de esta cadena especifican los sitios activos de Ja enzima, y que las ccc especifican la parte estructural de esta misma enzima, es decir, el segmento que aporta los sitios activos en una apropiada configuración tridimensional.
babb, babc, babaa, ... } .
La condición es utilizada de la siguiente manera: cuando dos agentes se encuentran, la condición de intercambio de cada agente es analizada primero en relación con el marbete de ataque del otro agente. Si las condiciones de ambos agentes son satisfechas, entonces tiene lugar el intercambio. Si ninguna condición es satisfecha, entonces la interacción es rechazada. Si la condición de un agente es satisfecha pero no la del otro, entonces el agente con la condición insatisfecha tiene la oportunidad de "huir" de la interacción. En el caso más simple, esto se hace rechazando la interacción con alguna probabilidad fija.
_,/
Cromosoma del agente ................. : 1
fí11111111111111111 '
marbete
marbete
:
de ataque
de defensa
!
L_ reglón de '
condición
~ región
marbetes
'
:
de intercambio :
_J
de control
Si la condición de intercambio de! agente CD concuerda con el marbete de ataque del agente 8 ~y viceversa-, entonces se sigue el cálculo de la puntuación del encuentro ataque/defensa: marbete de ataque
Agente(})
Agente@
r=
concordancia
~
1
concordancia - - ~-~-~
1;¡¡¡¡;¡;¡;;¡;¡¡;11 marbete de ataque
FIGl:RA
condición de inten;ambio
llllllllll!lll!llli
condición de intercambio
III.5. Cromosonia del agente con una condición de interca1nbio agregada.
Modelo 3: Transformación de los recursos
La capacidad de las células o de las fábricas para transformar recursos en nuevas forrr1as es una valiosa propiedad que vale la pena consenrar
127
128
EL ORDEN OCCLTO
EL SURGIMIENTO DEL MODELO ECHO
Todavía queda pendiente lo relacionado con la "tasa" de transformación presente en un subsegmento de transformación. ¿Qué tanta a será transformada en b si está presente el subsegmento ah? Parece razonable limitar la transformación a los recursos que el agente ha guardado en su reserva; es decir, la transformación sólo puede tener lugar si hay copias de la letra a en la reserva del agente. Una transformación únicamente redituará si: 1) la definición del cromosoma del agente requiere varias copias de la letra-objetivo que está escasa, 2) la tasa de transformación es suficientemente rápida como para que varias copias de la letra del recurso puedan ser trasformadas durante el lapso de vida del agente. De otra manera la inversión de recursos para definir al subsegmento de transformación nunca "redituará". Por ejemplo, se requiere un ejemplar de la letra b tan sólo para definir al segmento de transformación ab, por lo que la inversión de ninguna manera puede redituar, a no ser que puedan obtenerse cuando menos dos copias de la letra b por la transformación de a en b durante el lapso de vida del agente. Debido a que el lapso de vida más corto es un periodo-paso, establezcamos la tasa a razón de dos letras por periodo-paso. Entonces, incluso los agentes de vida más corta podrán beneficiarse de un subsegmento de transformación.
Por supuesto que somos libres de elegir diferentes tasas de transformación en diferentes modelos; incluso podemos elegir diferentes tasas para diferentes letras en el mismo modelo. La relación entre estas tasas de transformación y las tasas de entrada (input) de los sitios para los recursos básicos ciertamente afectará la evolución del modelo. La evolución, al obrar sobre las transformaciones, debe atenuar las diferencias causadas por las diferentes tasas de entrada de los sitios.
reserva
cromosoma marbete de ataque
marbete : condición de de defensa : intercambio
transforma" ' ción
!