news 2026/6/9 22:44:41

上海人工智能实验室安全团队实习生/全职招聘

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
上海人工智能实验室安全团队实习生/全职招聘

大家好,我是刘东瑞(https://shenqildr.github.io/),目前在上海人工智能实验室担任青年科学家,去年从上海交通大学博士毕业。非常感谢求学与科研道路上给予我指导与陪伴的师长和同伴,让我能坚持在自己热爱的AI安全可信方向上前行。

过去一年多的时间里,在团队的支持下我有幸与许多优秀的学生和同事一起,在AI安全可信领域做了一些探索。我主要关注内生安全技术路线,尝试通过理解与调整大模型的内部机理,提升其性能与安全性。我曾参与支持SafeWork-R1和SafeWork-F1等项目,并在相关方向上发表过一些论文,包括:

  • CVPR 2024 Best Paper Award Candidate(Top 0.2%)

  • ACL 2025 Outstanding Paper Award(Top 0.3%)

  • ICLR 2025 Oral(Top 1.8%)

  • AAAI 2026 Oral(Top 4%)

  • 以及多篇ACL 2025 Oral(Top 2%)等

我们目前正在寻找对大模型与智能体安全可信方向感兴趣的同学加入,招聘类型包括:

  • 实习生(潜在联培学生)

  • 全职算法工程师/研究员

  • 联培博士生(与上海交大、复旦、浙大等高校合作)

为什么考虑加入我们?

我们理解,一段科研经历不仅关乎眼前的学习,也可能对你未来的发展产生影响。因此,我们希望为每一位加入的同学提供一段有方向、有支持、有成长的科研体验:

1. 清晰的成长路径

  • 团队的联培博士生主要从长期实习、表现良好的同学中选拔。

  • 过往实习生中,多人后续在字节、腾讯、上海AI Lab等机构工作,或前往北大、新加坡、加拿大、美国等地深造,发展路径较为明确。

2. 持续的科研产出

  • 过去一年,组内长期实习的同学大多以第一作者或共同一作身份发表或投稿了顶会论文,其中不少同学在此完成了首篇顶会论文首篇Oral

  • 团队在AAAI、ICLR、NeurIPS、ACL、EMNLP等会议上持续有论文发表,其中包括ACL 2025杰出论文多篇Oral

  • 无论你是否有论文经验,都欢迎在这里起步或深入,积累扎实的科研经历。

3. 深入的指导与支持

  • 从研究想法的讨论、实验设计,到论文撰写与投稿,我会全程参与并提供支持。

  • 团队中高年级同学也会提供帮助,协助你快速融入。

  • 已有经验的同学可以牵头独立课题;刚开始科研的同学也可以从参与现有项目入手,逐步成长。

我研究的关注点

我最初的研究标签是”AI的可解释性”,但随着探索的深入,逐渐扩展到安全评测、攻防、对齐、可解释性、AI极端风险等多个与安全可信相关的方向。

我每天会花不少时间阅读论文,也因此常常产生新的想法。团队在上述多个方向上都取得了一些进展(如Oral报告和奖项),但我时常反问自己:这些工作究竟解决了什么问题?

遗憾的是,我尚未做出能”解决”某个领域问题的代表作。博士期间,我一作论文共被拒二十多次,付出最多心血的论文”Trap of Feature Diversity in the Learning of MLPs”依然没有找到归宿。但这些经历让我学会更淡然地看待外界的评价,也更坚定地去探索那些”真问题”。

我希望能做解决安全问题的研究,保持好奇心、不断学习,也期待与更多优秀的伙伴一起,在未来做出有真正影响力的工作。

近期部分研究成果

Jailbreak(越狱攻击)

  1. LLMs know their vulnerabilities: Uncover Safety Gaps through Natural Distribution Shifts ACL 2025 Outstanding Paper Award

  2. The Devil Behind Mask: An Emergent Safety Vulnerability of Diffusion LLMs

Useful XAI & Alignment(可解释性与对齐)

  1. REEF: Representation Encoding Fingerprints for Large Language Models ICLR 2025 Oral

  2. The Tug of War Within: Mitigating the Fairness-Privacy Conflicts in Large Language Models ACL 2025 Oral

  3. Cooperative or Competitive? Understanding the Interaction between Attention Heads From A Game Theory Perspective ACL 2025 Oral

  4. X-Boundary: Establishing Exact Safety Boundary to Shield LLMs from Multi-Turn Jailbreaks without Compromising Usability EMNLP 2025 Finding

  5. Beyond External Monitors: Enhancing Transparency of Large Language Models for Easier Monitoring

  6. Demystifying Reasoning Dynamics with Mutual Information: Thinking Tokens are Information Peaks in LLM Reasoning NeurIPs 2025

Agent Safety(智能体安全)

  1. RiOSWorld: Benchmarking the Risk of Multimodal Computer-Use Agents NeurIPS 2025

  2. Your Agent May Misevolve: Emergent Risks in Self-Evolving LLM Agents

  3. Are Your Agents Upward Deceivers?

我们对你的期待

  1. 能保证连续实习6个月以上,对科研有真实的热情;

  2. 具备基础的AI知识和编程能力(如了解Transformer、CNN、优化算法等);

  3. 欢迎硕士、博士同学申请,请务必事先征得本校导师的同意

申请方式

如有意向,请发送邮件至:drliu96@sjtu.edu.cn

  • 邮件主题:实习生/全职-姓名

  • 附件请包括:个人简历、成绩单、以及一段简单的自我介绍

我会认真阅读每一封邮件,并尽快回复。期待与你一起,探索AI安全背后的真问题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 15:30:22

Wan2.2-T2V-A14B在AI音乐MV自动生成中的协同创作模式

Wan2.2-T2V-A14B在AI音乐MV自动生成中的协同创作模式 你有没有想过,一首歌的MV可以完全由AI生成?不是简单的画面拼接,而是真正理解歌词意境、节奏起伏和情感张力,自动构建出具有电影质感的动态影像——从樱花飘落的慢镜头到赛博都…

作者头像 李华
网站建设 2026/6/5 5:14:11

Wan2.2-T2V-A14B模型更新日志解读:v2.2版本带来了什么?

Wan2.2-T2V-A14B模型更新日志解读:v2.2版本带来了什么?在短视频、广告创意和影视预演需求爆炸式增长的今天,内容创作的速度与质量正面临前所未有的挑战。传统视频制作依赖专业团队、高昂成本和漫长周期,而AI生成技术的崛起正在悄然…

作者头像 李华
网站建设 2026/6/6 23:47:19

Wan2.2-T2V-A14B如何实现多角色协同行为的合理编排

Wan2.2-T2V-A14B如何实现多角色协同行为的合理编排 在影视预演、高端广告和数字人协作系统中,一个长期困扰AI生成技术的核心难题是:如何让多个虚拟角色像真实世界一样自然互动?不是简单地把几个人物拼在同一画面里,而是让他们“有…

作者头像 李华
网站建设 2026/6/4 20:07:12

解决C++ Builder中的资源标识符问题

在使用C++ Builder 11.2进行开发时,常常会遇到一些资源文件(.rc文件)中定义的标识符在C++源代码中无法识别的现象。本文将结合实例详细讲解如何解决这一问题,确保你在开发过程中能够顺利使用资源文件中的标识符。 问题描述 假设你有一个名为strings.rc的资源文件,其中包…

作者头像 李华
网站建设 2026/6/9 10:17:02

9 个专科生课堂汇报工具推荐,AI 写作降重神器

9 个专科生课堂汇报工具推荐,AI 写作降重神器 当论文遇上时间,你是否也在挣扎? 对于专科生来说,课堂汇报、论文写作、文献综述这些任务早已成为学习生活中的“常态”。但面对这些任务时,很多人却常常感到力不从心。尤其…

作者头像 李华
网站建设 2026/6/5 10:47:45

高分辨率视频生成难题破解:Wan2.2-T2V-A14B实测报告

高分辨率视频生成难题破解:Wan2.2-T2V-A14B实测报告 在短视频日均播放量突破百亿次的今天,内容生产的速度与质量正面临前所未有的挑战。传统影视制作流程动辄数周、成本高昂,而市场对“即想即得”的创意表达需求却愈发迫切。正是在这种背景下…

作者头像 李华