Publications

Li, J.*, Barry, C.A.*, Randev, R., Chen, J., Jorgensen, E., & Bent, B. (under review). When Helpfulness Becomes Sycophancy: Sycophancy is a Boundary Failure Between Social Alignment and Epistemic Integrity in Large Language Models. Preprint, arXiv https://arxiv.org/abs/2605.05403.
Li, J., Groos, H., & Bent, B. (under review). Aligned Machine. Manuscript under review.
Li, J., Groos, H., & Bent, B. (2025). Aligned Machine. Women in Machine Learning (WiML) Workshop at NeurIPS 2025. Abstract accepted for in-person poster (non-archival).

* indicates equal contribution