Resultados

Inference-Time Toxicity Mitigation in Protein Language Models via Logit-Diff Amplification
Manuel Fernández Burda, Santiago Aranguri, Ivan Arcuschin, Enzo Ferrante. Generative and Experimental Perspectives for Biomolecular Design Workshop at ICLR 2026.
Benchmarking AI Control Protocols for Safety in Medical Question-Answering Tasks
Guido Freire, Agustín Martínez-Suñé, Viviana Cotik. Principled Design for Trustworthy AI Workshop at ICLR 2026.
White-Box Monitoring for Personality Mirroring in Conversational AI
Eitan Sprejer, Agustin E. Martinez-Sune, Bruno Bianchi. Catch, Adapt, and Operate: Monitoring ML Models Under Drift Workshop at ICLR 2026.
What Large Language Models Know About Plant Molecular Biology
Manuel Fernández Burda et al. LatinX in AI (LXAI) Research Workshop at NeurIPS 2025. Reconoce el apoyo de AISAR; también enviado a Nature Plants.
Is Gemini 3 Scheming in the Wild?
Alejandro Wainstock, Agustín Martínez-Suñé, Ivan Arcuschin, Victor Braberman. LessWrong.

Dos becarios fueron admitidos en MARS (Cambridge).
Un becario fue admitido en LASR Labs.
Un becario fue admitido en ARENA.
Becarios participaron en ML4Good Brasil, uno como participante y otro como facilitador.
Becarios participaron en el curso de AI Strategy de BlueDot, uno como participante y otro como facilitador.
Un becario dio una charla en un grupo de lectura de MILA (Quebec).
Un becario recibió una beca de transición de carrera de Coefficient Giving.
Manuel Fernández Burda, uno de nuestros becarios, compartió la primera autoría de Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation (ICLR 2026), de forma independiente a su proyecto en AISAR.
El proyecto de AISAR de un becario se convirtió en su tesis de grado.

Cuatro de los seis mentores no habrían trabajado en AI Safety en 2025 sin AISAR, y los seis planean continuar.
Se obtuvieron dos becas doctorales de CONICET para estudiantes externos en temas de AI Safety: una sobre cuantificación de confianza para modelos de IA más seguros, y otra sobre fundamentos formales para software confiable basado en LLMs.