当前位置:网站首页>斯坦福CV课程学习笔记(一)
斯坦福CV课程学习笔记(一)
2022-07-21 10:49:00 【dantamiao】
视频源自
作为一个设计学出身企图踏足人工智能领域的小白,听说这门课很OK于是来听课了。希望给非科班出身的同学们一些帮助。
版权声明:本文中所有出现的图片均为视频截图,课件内容版权所有人应为斯坦福学校或课程授课人。本博客中的图片应仅用于学习,请勿用于商业用途,请勿侵犯创作者知识产权。
以下是Lecture2 image classification的笔记
Nearest neighbor classifier
在本次课程中将会使用python3和numpy, 课程附上了简单的入门教学,地址如下:
http://cs231n.github.io/python-numpy-tutorial/
曼哈顿距离-Manhuttan distance L1
(30条消息) 机器学习中的数学——距离定义(二):曼哈顿距离(Manhattan Distance)_von Neumann的博客-CSDN博客_机器学习曼哈顿距离
https://blog.csdn.net/hy592070616/article/details/121569933?spm=1001.2014.3001.5501这篇文章介绍的非常详细,除了曼哈顿距离还有常用的欧几里得和余弦距离。
总体来说就是两个图像每个块的值相减,再加在一起,456就是两个图像的差了。
nearest neighbor clssifier的问题就在于,测试所用计算时间太长。而卷积神经网络训练时间长,但是测试非常快。
K-Nearest neighbors
K越大边界越平滑,大部分情况我们使用大于1的K值。白色区域中没有预测值。
欧几里得距离-Euclidean distance L2
图片相似性计算中用欧几里得的也比较多。那如何选择不同的方法?
视频原话:
If your input features, if the individual entries in your vector have some important meaning for you ask, then maybe somehow L1 might be a more natural fit. But if it's just a generic vector in some space and you don't know which of the different elements, you don't know what they actually mean, then maybe L2 is slightly more natural.
如果您的输入特征,如果您的向量中的各个条目对您有重要意义,那么也许 L1 可能更自然。 但是如果它只是某个空间中的一个通用向量并且你不知道哪些不同的元素,你不知道它们的实际含义,那么 L2 可能会稍微自然一些。
由于L1更加受到坐标的影响,所以能看到左边的图更多的横平竖直,右侧的则不在乎这一点。(个人理解如有错误请指正。)
老师做了一个测试demo可以用来玩: http://vision.stanford.edu/teaching/cs231n-demos/knn/
L1一定比L2好么?
老师举了一个例子:
老师认为,这常常取决于你的数据本身和你要分析的内容。如果你要对员工进行分类,不同的向量有不同的含义,他们被用薪水,能力等不同类的内容进行打分。由于向量方向是有意义的,在此类情况中L1可能更有意义。最好的解决方案就是,都试,看哪个好。
Hyperparameters
就是我们设定好的value,距离,K值。这不是从数据里学到的,是我们认为设定的内容。
未完待续。
边栏推荐
- 第98篇 Truffle
- Unity surface shader foundation memo
- Specific use examples of dotweenpath
- 卷积神经网络-CNN
- Implementing DDD based on ABP -- domain service, application service and dto practice
- 迅为龙芯开发板流程运行busybox,buildroot,loognix,QT5.12系统
- Information entropy_ Joint entropy_ Conditional entropy_ information gain
- Stream stream filters the list set for duplicate fields
- JDBC 02: connect to MySQL and realize deletion and update
- 【 JS Reverse 100 examples】 Reverse Analysis of Announcement URL Parameters in a Public Resource Trading Network
猜你喜欢
Series operation of deque container (detailed explanation)
Dynamically generate excel forms in word documents (explanation of Fund announcement Series)
训练精度媲美 AlphaFold2、速度翻倍,飞桨螺旋桨HelixFold训练和推理代码全面开源...
Multimodal model clip4clip takes you to realize mutual search between text and video
[JS reverse hundred examples] a public resource trading network, reverse analysis of announcement URL parameters
隐马尔科夫模型 HMM
likeshop单商户SAAS商城系统无限多开
Instrumentation, three-phase ammeter LCD segment code LCD low-power anti-interference drive ic-vk2c23a/b (dic/cob can be output)
ASP.NET GridView动态显示隐藏列,并保存客户的配置(用户控件Cookie版)
迅为龙芯开发板流程运行busybox,buildroot,loognix,QT5.12系统
随机推荐
CLion配置WSL工具链
卷积神经网络-CNN
List is divided into several sub list sets
第94篇 合约间调用(三)
Baidu map, Gaode map, Tencent map Trinity map positioning development
决策树_ID3_C4.5_CART
The whole process of installing mysql5.7 in centos7 and the answers to various questions
Learning foundation - word memory
Vscode practical annotation regular substitution
怎样才能让需求无法如期顺利上线(一)整体策略
数据库索引:索引并不是万能药
(板子)试除法求约数
第109篇 Compound 中的 Liquidate
How to make the demand unable to go online smoothly as scheduled (V) business acceptance stage
The list set is de duplicated according to the object attributes
Master the pose of hook in typescript in 3 minutes
游戏代码规范实例之单例
Resttemplate returns character garbled
简易shader实践记录4-流光效果
Threadpooltaskexecutor uses