机器之心报道
编辑:杜伟
就在刚刚,斯坦福大学经典 CV 课程 ——《CS231n:深度学习与计算机视觉》(2025 春季)正式上线了!

课程网站:https://cs231n.stanford.edu/
该系列课程深入探讨了深度学习架构的细节,并重点关注围绕图像分类、定位和检测等视觉识别任务的端到端模型学习,尤其是图像分类领域。
在为期 10 周的学习中,学生将学习如何自己实现和训练神经网络,并深入理解计算机视觉领域的前沿研究。
课程结业时,学生还有机会在自己选择的真实世界视觉问题上训练并应用数百万参数的神经网络。
最终,通过多次实践作业和课程项目,学生将掌握搭建深度学习任务所需的工具集,以及在训练和微调深度神经网络过程中常用的工程技巧。
课程共有四位主讲人,分别如下:
李飞飞:全球知名学者,斯坦福教授、World Labs CEO。她领导创建了 ImageNet 项目,这个前所未有的大规模视觉数据库直接催生了深度学习在计算机视觉领域的革命性突破,被视为现代 AI 浪潮的关键引爆点。近期,她致力于空间智能与世界模型的研究。
Ehsan Adeli:斯坦福大学精神病学与行为科学系助理教授,并兼任计算机科学系助理教授,以及斯坦福转化人工智能实验室(STAI Lab)主任。他的研究兴趣包括计算机视觉、计算神经科学、精准医疗、环境智能、医学影像分析。
Justin Johnson:密歇根大学助理教授,同时也是 FAIR 研究科学家。他的研究兴趣广泛,主要集中在计算机视觉和机器学习领域。研究内容包括视觉推理、视觉与语言、图像生成以及利用深度神经网络进行 3D 推理。此前,他在斯坦福大学获得博士学位,导师为李飞飞。
Zane Durante:目前是斯坦福大学三年级博士生,其导师为李飞飞和 Ehsan Adeli。他的研究兴趣包括多模态视觉理解以及将人工智能用于改进医疗健康。他也广泛关注如何构建能够理解多种输入模态的人工智能系统,并探索人工智能在社会公益中的应用。

目前,这门课程的全部 18 个视频已经可以在 Youtube 上免费观看,其中第一和最后一堂课由李飞飞讲授。

Youtube 视频地址:https://www.youtube.com/playlist?list=PLoROMvodv4rOmsNzYBMe0gJY2XS8AQg16
课程内容具体如下:
- 深度学习与计算机视觉简介
- 使用线性分类器进行图像分类
- 正则化和优化
- 神经网络和反向传播
- 利用卷积神经网络(CNN)进行图像分类
- 卷积神经网络(训练与架构)
- 循环神经网络(RNN)
- 注意力机制和 Transformers
- 目标识别、图像分割和可视化
- 视频理解
- 大规模分布式训练
- 自监督学习
- 生成式模型
- 3D 视觉
- 视觉和语言
- 机器人学习
- 以人为中心的人工智能
想学习的小伙伴,赶紧学起来吧。
