Skip to content
Merged
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
20 changes: 18 additions & 2 deletions 100407_计算机视觉/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -27,15 +27,31 @@
* 基于 Google Teachable Machine 实现一个计算机视觉应用创意并展示。

Teachable Machine 是一个能够轻松构建简单深度学习模型的平台,导出自己的模型后可以在 [ml5.js](https://learn.ml5js.org/#/) 网站中快速创建一个深度学习的应用。
* 使用 Python 实现 K-Means 和 HAC 聚类算法,并将力量这应用在图像分割任务上。
* 使用 Python 实现 K-NN 和 SVM 分类器,并将两者应用在图像分类任务上(鸢尾花、Cifar10 或 MNIST 数据集)
* 使用 Python 实现图像分割算法(25 Spring 起,第 2 个小作业改为图像分割实现)。
* 使用 Python 实现图像分割算法(25 Spring 起,第 3 个小作业改为图像分割实现)。

注:2022 春季学期的第 2、3 个小作业分别为:使用 Python 实现 K-Means 和 HAC 聚类算法并应用在图像分割任务上;使用 Python 实现 K-NN 和 SVM 分类器并应用在图像分类任务上(鸢尾花、Cifar10 或 MNIST 数据集)。

注:小作业优秀的同学会在课上展示自己的作业。

* 大作业

**注意:25 Spring 起,CV 课程已改为个人完成大作业,要求较高,建议学有余力的同学选修。**

大作业要求为:

报告分为以下三个部分:

(一)选择一个计算机视觉相关的主题(包括但不限于行人再识别、场景文字检测、图像识别、行人搜索以及人脸识别),并在该主题中选择一个有明确评价指标和公开数据集的任务(如文本图像多模态行人再识别)。通过查阅相关文献,从近两年发表的文章文献中选择两个影响力比较高的算法进行代码复现,详细分析算法的特点、优势与不足。

(二)针对第一部分中选择的主题与任务,尝试从模型结构、损失函数的设计、数据预处理等角度,以提升性能(降低模型复杂度或提升精度均可)为目的,改变经典算法的结构。也可以提出新的模型,并且在数据集上进行模型效果的验证。

(三)谈谈你对本课程学习过程中的心得体会与建议,可以根据本学期目前所学内容,从每一章中选择自己感兴趣的某个知识点进行探讨和分析。

---

**以下为 2022 春季学期的大作业要求,仅供参考:**

* 选择一个方向,要求阅读至少两篇相关论文(从推荐文章中选择,也可以自己找),复现代码与文章中的实验,并针对目标问题思考改进方案。
* 复现的代码(可以是开源代码),要求尽量写清注释,方便阅读。
* PPT:对报告内容进行汇报。
Expand Down