VUE学习笔记:简单了解与使用
初步了解VUE框架,简单地尝试使用
jQuery学习记录
粗略地了解了一下jQuery,做个记录
遥感图像树木检测综述
遥感图像树木检测内容的一些整理,包括遥感图像,目标检测,树木检测的一些传统方法和近期文章
YOLT:遥感图像多尺度检测
本文是对YOLT算法论文的总结和解读,论文主要是根据遥感卫星图的特点对YOLOv2的算法进行了改进,针对遥感卫星图目标检测的几个难点提出了解决方案
Canvas实现简单刮刮乐效果
利用canvas实现刮刮乐的效果
Canvas视频播放器
利用canvas实现一个视频播放器,并实现视频移动水印功能和弹幕功能
JS小玩具:派大星轮播图
实现轮播图功能,并将其封装为插件,实现:1. 每张图对应底下的小圆点,点击小圆点会高亮并跳转到对应图片;2. 左右两侧的按钮可以返回上一张图片或者进入下一张图片; 3. 当鼠标离开轮播图区域时,进入自动轮播模式
JS小玩具:海绵宝宝放大镜
实现淘宝商品鼠标拖动框局部放大效果
CSS布局方式
记录CSS布局方式,随缘更新
并查集
并查集概念当我们在做题的时候,会有一些关于集合的操作,比如将两个集合合并,查询一个元素是否属于某个集合,判断两个元素是否属于同个集合等,并查集就是一种用于处理这些情况的数据结构,并 指集合合并, 查 指元素查询
既然有集合和元素关系判定的需求,那么首先我们得标识集合,比如说碗属于餐具,那么这里餐具就是这个集合的标识(名字),在并查集中,集合有多种标识方法,最常见的一种是将代表元素作为集合表示,比如一个集合中包含了碗和盘子,那么我们可以随便选择一个,比如说碗,来标识集合
在具体实现中,并查集通过树形结构来实现,用根元素来标识集合,每个元素连向父节点,用于标识集合的根元素则连向自己
那么查找的时候只要沿着链寻找到根元素即可确定集合,查找的逻辑非常简单,沿着链往上查找,直到找到一个父节点连接指向自己的元素,,我们用c++简单地实现一下这个过程,这里用f数组表示父节点连接
12345// 查找 searchfatherint sf(int x){ if (f[x] == x) return x; // 如果找到根元素则直接返回答案 return sf(f[x]); // ...
BFC详解
BFC的概念,特性,触发机制和作用
将iconfont引入自己的页面
记录如何在自己页面中引入iconfont,像文字一样使用小图标,用font属性来控制大小和颜色,以及如何在value值中使用iconfont
HTML快捷键
HTML的一些快捷键记录 (Emmet)
Faster R-CNN填坑记录
从零开始的Faster R-CNN环境配置到使用记录
CSS选择器
记录各种CSS选择器 (基础选择器,复合选择器)
YOLOv2:全面升级的YOLO
YOLOv2多方面地对YOLO进行了优化,将算法的速度和精度都提高到了一个新的高度
YOLOv2沿用了YOLO的结构,并做了大量的优化
YOLO回顾
更精准 [Better]YOLO相比于Fast R-CNN来说存在大量的定位误差,且召回率较低,因此优化主要是为了解决这两个问题
批标准化YOLOv2用BN层代替了dropout,置于每个卷积层之后,有助于解决bp中梯度弥散和梯度爆炸的情况,mAP提升2%以上
高分辨率分类器先在ImageNet上以$448\times 448$分辨率进行10个epoch的微调,然后根据检测结果对网络微调,这本质上是一种迁移学习,这种方法提升了将近4%的mAP
带锚框的卷积YOLOv2移除了YOLO中的FC层,采用锚框来预测bbox,同时,将网络的输入从$448\times 448$缩小到416,这样特征图有奇数个位置,只有一个中心单元 (因为大型物体往往在图像中心),32倍下采样之后得到$13 \times 13$的特征图
同时,解耦类的预测和空间位置,区别于YOLO中为每个格子预测类别,YOLOv2为每个锚框预测类和对象
引入锚框后mAP从69 ...
CSS标签页实现
前些天跟同学一起糊实验室的项目,要做个实验平台,想实现一个点击实验步骤然后块的内容就会变成对应步骤的功能,当时糊了一个页内链接,贼丑,然后同学用js控制了内容的显隐实现了这个功能,今天看到arxiv上有类似的块,查了点资料,学习一下实现方法
总的来说是要实现这样一个东西
点击上面的lable然后就可以切换下面的内容框内的文字
单选按钮radio首先需要用到的是input标签中的单选按钮radio
下面给出一个示例
12345<div class="tab"> <input type="radio" name="tab-group-1">选项一 <input type="radio" name="tab-group-1">选项二 <input type="radio" name="tab-group-1">选项三</div>
效果如下
选项一
选 ...
YOLO:实时目标检测
基本YOLO模型能够以每秒45帧实时处理图像,较小版本fastyolo每秒处理155帧,同时仍能达到其它实时探测器2倍的mAP
YOLO的意思就是You only look at once,从名字上听起来就非常快,在RCNN系列的网络中采用的是two-stage方法,即先生成候选框,然后对候选框进行分类,而以YOLO为代表的one-stage方法则是直接回归到类别概率和物体坐标
Yolo核心思想Yolo的思想非常简单,就是将输入的图像划分成$S\times S$的格子,如果检测物体的中心在某个格子内,那个这个格子就负责检测这个物体
每个格子会预测B个bbox以及其对应的置信度(confidence scores),置信度表示bbox包含一个物体的确定程度和bbox的准确度,所以其计算公式为
$Pr(Obj) \cdot IoU(pred,GT)$
公式的含义是,若格子中有物体,则置信度为$IoU(pred,GT)$,否则为0
每个bbox由5个预测组成:x、y、w、h和置信度。(x,y) 坐标表示长方体相对于网格单元边界的中心。w和h对图像的宽度和高度进行了预测。置信度预测表示 ...
Cascade R-CNN:级联RCNN以提升检测质量
Cascade RCNN 采用级联的方式,几乎对任意的RCNN都起到提升2到4点AP的作用
Faster R-CNN系列改进回顾
R-CNN回顾
Fast R-CNN回顾
Faster R-CNN回顾
RCNN系列存在的问题在RCNN系列中IoU的阈值决定了一个RoI属于正样本或是负样本,如果我们抬高阈值,则得到的RoI肯定是更接近真实物体,那么训练得到的检测器肯定会更为准确 (更好的proposal得到更好的bbox)
但同时会导致两个问题:
过拟合,更高的IoU阈值会导致选出更少的正样本 (如下图所示),正负样本的严重不均衡导致训练过拟合
严重的mismatch问题
Mismatch问题
训练阶段bbox回归学习的正样本是和GT的IoU大于阈值的Proposals,而测试阶段由于没有GT,用于bbox回归坐标的正样本是所有的Proposals,可能存在IoU小于阈值的,会导致性能下降,随着IoU阈值的提高,问题会变得更加严重
实验与发现
作者对不同的IoU阈值设置做了三组实验,c图展示了proposals的分布,横纵轴为经过bbox回归前后的候选框IoU分布, ...
Mask R-CNN:引入Mask分支以实现实例分割
Mask RCNN 是基于Faster RCNN提出的,在高效完成目标检测的同时实现了高质量的实例分割
Faster R-CNN系列改进回顾
R-CNN回顾
Fast R-CNN回顾
Faster R-CNN回顾
Mask R-CNN相对于Faster R-CNN的改进主要有三点
引入FPN结构进行特征提取
采用RoI Align代替RoI pooling
在分类和回归的分支基础上,加入Mask分支
特征金字塔FPN使用单一尺寸的特征(Faster R-CNN)的做法,在经过CNN逐层的下采样,到达最后特征层的时候图片中小物体的有效信息较少,检测性能急剧下降 (图b)
而图像金字塔 (图a) 将输入图片做成多个尺寸,来生成不同尺度的特征来解决多尺度的问题,这种做法计算量大,非常耗时
特征层分层预测 (图c) 语义信息差距太大,高分辨率的低层特征不具备足够的检测能力
基于以上几种做法,提出了特征金字塔FPN (图d),从高层携带信息传给低层,再分层预测
首先自底向上提取语义信息,然后依次进行上采样,各层进行$1\times 1$卷积降低通道数 (使通道数变为256) ...