Con base en este resumen, Robin formuló una serie de hipótesis sobre los mecanismos de la enfermedad de degeneración macular y utilizó estas herramientas para proporcionar una descripción detallada de la evidencia de cada mecanismo. Luego, un juez de LLM hace comparaciones por pares entre las hipótesis, lo que produce clasificaciones relativas, similar al sistema de torneos de Google.
De manera similar, el sistema se utilizó para sugerir líneas celulares y condiciones de cultivo que podrían proporcionar modelos de degeneración macular, y preparó informes sobre 30 fármacos candidatos. “Estos informes contienen una justificación de por qué cada fármaco es adecuado para mitigar los mecanismos de la enfermedad representados en el modelo in vitro y las posibles limitaciones que el fármaco puede plantear”, según el equipo de FutureHouse. Nuevamente, estos informes son evaluados por expertos para determinar qué pruebas se deben realizar.
Robin también sugiere realizar pruebas de medicamentos evaluados por humanos (en muchos casos, parece que están usando variantes de los medicamentos recomendados).
La principal diferencia con Robin es que incluye una herramienta, Finch, que puede automatizar la evaluación de datos de varios ensayos de detección biológica estándar, como citometría de flujo Y secuencia de ARN. Entonces, siempre que su prueba involucre una de las pruebas que Finch puede manejar, entonces hay pasos adicionales que el sistema puede tomar.
Como se indicó anteriormente, Robin propuso una nueva hipótesis: aumentar la capacidad de las células de la retina para absorber desechos fuera de las células podría brindar protección contra las enfermedades. E identificaron un fármaco que parecía proporcionar tal impulso en el ensayo propuesto.
Como descubrió Google, es importante tener herramientas diseñadas específicamente para interactuar con la literatura científica. Reemplazar a Crow con o4-mini de OpenAI elevó la tasa de referencia de alucinaciones del cero por ciento al 45 por ciento. FutureHouse también analizó el rendimiento de las herramientas centradas en la investigación de OpenAI y descubrió que, en todos los casos que sugerían medicamentos no descubiertos por Robin, los medicamentos no lograron tener ningún efecto sobre estas células.



