HICO-DET数据集
文献-Learning to Detect Human-Object Interaction
概述:2018年由密歇根大学和华盛顿大学共同提出HICO-DET数据集
关键词:数据集
论文地址:https://www.yuque.com/ugdongzhou/io8kmc/1661139
数据集: http://www-personal.umich.edu/~ywchao/hico/
主要贡献
提出一个新的benchmark ——HICO-DET,提供了超过150,000个标注后的人类-物体组合,包含600个HOI类别,即每个HOI类别平均250个组合实例。
提出了基于人-物区域的卷积神经网络HO-RCNN。分两步,1. 使用最先进的人体和物体检测器生成人体-物体区域对的proposal;2. 将每个人-物框proposal送入CNN,以生成HOI分类分数。
数据集三个benchmark
Full—— 所有的600个HOI分类
Rare ——138个HOI类别(少于10个训练实例)
Non-Rare ——462个HOI类别(大于等于10个训练实例)
两种评估方法
Known ...
图解HTTP总结
参考资料上野宣. 图解 HTTP[M]. 人民邮电出版社, 2014.
一 、基础概念请求和响应报文客户端发送一个请求报文给服务器,服务器根据请求报文中的信息进行处理,并将处理结果放入响应报文中返回给客户端。
请求报文结构:
第一行是包含了请求方法、URL、协议版本;
接下来的多行都是请求首部 Header,每个首部都有一个首部名称,以及对应的值。
一个空行用来分隔首部和内容主体 Body
最后是请求的内容主体
12345678910111213GET http://www.example.com/ HTTP/1.1Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9Accept-Encoding: gzip, deflateAccept-Language: zh-CN,zh;q=0.9,en;q=0.8Cache-Control: max-age=0Host: www. ...
Leetcode总结—二叉树的遍历
二叉树是面试中常见的题目类型,这里,针对 leetcode 前200道题中的二叉树相关问题进行总结与思考,力求烂熟于心,能根据题目名回忆起题目的具体描述,进而用简洁的语言描述出算法的核心。具体的题目答案可打开 leetcode 查看历史提交记录。
二叉树的遍历(binary-tree-traversal)
二叉树的遍历是指从根结点出发,按照某种次序依次访问二叉树中所有结点,使得每个结点被访问一次且仅被访问一次。
为什么研究二叉树的遍历?
因为计算机只会处理线性序列,而我们研究遍历,就是把树中的结点变成某种意义的线性序列,这给程序的实现带来了好处。
1 三种基本遍历方式首先是二叉树的遍历方式,最简单基础的也就是前序(preorder)、中序(inorder)、后序(postorder)三种遍历方式,对应题目 144.二叉树的前序遍历 、94. 二叉树的中序遍历 、145. 二叉树的后序遍历。
前中后,指的是根节点相对于左右结点的访问顺序
先序:考察到一个节点后,即刻输出该节点的值,并继续遍历其左右子树。(根左右)
中序:考察到一个节点后,将其暂存,遍历完左子树后,再输出该节点的值, ...
Linux常用命令
一、文件/文件夹管理1234567891011121314151617181920212223242526272829303132333435363738#列出当前目录文件(不包括隐含文件) ls #列出当前目录文件(包括隐含文件)ls -a #列出当前目录下文件的详细信息 ls -l #筛选命令,比如我想查找当前目录下的 markdown 文件ls -lh | grep .md#回当前用户的宿主目录 cd#回当前目录的上一级目录 cd .. #回上一次所在的目录 cd - #来指出当前所在的路径pwd#创建一个目录 mkdir 目录名 #删除一个空目录 rmdir 空目录名 #删除一个文件或多个文件 rm 文件名 文件名 #删除一个非空目录下的一切 rm -rf 非空目录名 #创建空文件touch 文件名#删除文件rm -rf 文件名#查看文件cat 文件名【显示全部内容,文件太大无法全部显示】cat -n 文件名 【查看内容,并添加行号】#拷贝到目标位置,或者新位置cp原文件名或目录名 目标位置 mv 原文件名或目录名 新文件名或目录
二、系统信息管理1234567891011 ...
使用LXD搭建多人共用GPU
1、 背景对实验室多台工作站的多块GPU进行合理的管理和使用分配规划及申请/授权/使用自动管理,希望工作站可以作为服务器使用,能够多人同时使用,互不影响。
2、需求
不同用户之间不能相互影响且可以同时使用
用户注册登录使用需要被授权
用户要能方便地访问自己的“机器”
用户要有足够大的权限,能自由地安装程序,能自由地访问网络
用户不被允许直接操作宿主机
3、具体方案3.1、LXD/ZFS 安装及配置LXD 软件安装sLXD:用于创建和管理容器ZFS:用于管理物理磁盘,支持 LXD 高级功能,负责容器存储。Bridge-Utils:用于搭建网桥,负责容器上网。
1sudo apt-get install lxd zfsutils-linux bridge-utils
初始化 LXD运行 sudo lxd init 进行 LXD 初始化配置,选项如下图:
LXD Clustering:不需要
new storage pool:需要创建一个存储池
Name of storage pool:给存储池命名
storage backend:存储后端,使用 ZFS
Create a new Z ...
论文-时空双流Two Stream及衍生方法
1. Two-Stream Convolutional Networks-2014NIPS
概述:基于 RGB 视频的动作识别方法中 Two Stream 的开山之作关键词:Two Stream , optical flow ,论文地址:https://arxiv.org/pdf/1406.2199.pdf论文翻译地址:https://blog.csdn.net/liuxiao214/article/details/78377791
主要贡献
首先,论文提出了 two-stream 结构的 CNN,由空间和时间两个维度的网络组成。
其次,作者提出了利用网络训练多帧密度光流,以此作为输入,能在有限训练数据的情况下取得不错的结果。
最后,采用多任务训练的方法将两个行为分类的数据集联合起来,增加训练数据,最终在两个数据集上都取得了更好的效果。(作者提到,联合训练也可以去除过拟合的可能)
原理图网络架构对与两个分支使用了相同的 2D CNN 网络结构,其网络结构见下图
在空间部分,以单个帧上的外观形式,携带了视频描绘的场景和目标信息。 其自身静态外表是一个很有用的线索,因为一些动作 ...
论文-3D卷积 C3D 及衍生方法
1. (C3D)Learning spatiotemporal features with 3d convolutional networks-2015ICCV-facebook
概述:采用 3D 卷积和 3D Pooling 构建了网络。 通过 3D 卷积,C3D 可以直接处理视频(或者说是视频帧的 volume)关键词:C3D,速度快,模型简单论文地址:https://arxiv.org/pdf/1412.0767.pdf论文翻译地址:https://www.jianshu.com/p/09d1d8ffe8a4caff 源码:https://github.com/facebook/C3D
主要贡献1)与 2DCNN 相比,3DCNN 更适合时空特征学习;
2)对于 3D ConvNet 而言,在所有层使用 3×3×3 的小卷积核效果最好;
3)我们通过简单的线性分类器学到的特征名为 C3D(Convolutional 3D),在 4 个不同的基准上优于现有的方法,并在其他 2 个基准上与目前最好的方法相当。
此外,特征是紧凑的:在 UCF101 数据集上得到 52.8%的准确 ...
SSM框架整合
1. 环境配置1.1 新建一Maven项目!ssmbuild , 添加web的支持1.2 导入相关的pom依赖!123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566<dependencies> <!--Junit--> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency> <!--数据库驱动--> <dependency> <groupId>mysql</groupId> <artifac ...
MySQL基础入门
下面是根据开源项目 21分钟MySQL基础入门 做的学习笔记
W3SCHOOL上的教程链接
开始使用MySQL版本: Server version: 8.0.20 MySQL Community Server - GPL
MySQL为关系型数据库,一个关系型数据库是由一个或数个表格组成,如下图:))
表头: 每一列的名称;
列(col): 具有相同数据类型的数据的集合
行(row) : 每一行用来描述某个人/物的具体信息;
值(value) : 行的具体信息, 每个值必须与该列的数据类型相同;
键(key) : 表中用来识别某个特定的人\物的方法, 键的值在当前列中具有唯一性。
登录MySQL在cmd中输入:mysql -h 主机名 -u 用户名 -p参数说明:
-h : 指定客户端所要登录的 MySQL 主机名, 登录本机(localhost 或 127.0.0.1)该参数可以省略;
-u : 登录的用户名;
-p : 告诉服务器将会使用一个密码来登录, 如果所要登录的用户名密码为空, 可以忽略此选项。
如果登录本机的MySQL数据库,只需要输入:mysql -u r ...
JDBC核心技术
此笔记是观看 此视频 做的笔记,供学习参考用。
第1章:JDBC概述1.1 数据的持久化
持久化(persistence):把数据保存到可掉电式存储设备中以供之后使用。大多数情况下,特别是企业级应用,数据持久化意味着将内存中的数据保存到硬盘上加以”固化”,而持久化的实现过程大多通过各种关系数据库来完成。
持久化的主要应用是将内存中的数据存储在关系型数据库中,当然也可以存储在磁盘文件、XML数据文件中。
1.2 Java中的数据存储技术
在Java中,数据库存取技术可分为如下几类:
JDBC直接访问数据库
JDO (Java Data Object )技术
第三方O/R工具,如Hibernate, Mybatis 等
JDBC是java访问数据库的基石,JDO、Hibernate、MyBatis等只是更好的封装了JDBC。
1.3 JDBC介绍
JDBC(Java Database Connectivity)是一个独立于特定数据库管理系统、通用的SQL数据库存取和操作的公共接口(一组API),定义了用来访问数据库的标准Java类库,(java.sql, ...
机器学习算法实现
机器学习算法实现
😄 本仓库是《scikit-learn 机器学习 常用算法及编程实战》的学习笔记,使用sklearn实现常用的机器学习算法,附有代码、文档以及相关数据集。项目地址: https://github.com/DongZhouGu/scikit-learn-ml
😄也可以到我的网站上阅读
K-近邻算法
线性回归算法
逻辑回归算法
决策树算法
支持向量机SVM
朴素贝叶斯算法
PCA算法
K-均值算法
scikit-learn是一个开源的Python语言机器学习工具包。它涵盖了几乎所有主流机器学习算法的实现,并且提供了一致的调用接口。它基于Numpy和SciPy等Python数值计算库,提供了高效的算法实现。总结起来,scikit-learn工具包有以下几个优点:
文档齐全:官方文档齐全,更新及时。
接口易用:针对所有的算法提供了一致的接口调用规则,不管是KNN、K-Means还是PCA。
算法全面:涵盖主流机器学习任务的算法,包括回归算法、分类算法、聚类分析、数据降维处理等。
当然,scikit-learn不支持分布式计算,不适合用来处理超大型数据,但这并不影响 ...
scikit-learn系列九:K-均值
项目地址传送门,欢迎 star 和 fork !K-Means聚类算法聚类,简单来说,就是将一个庞杂数据集中具有相似特征的数据自动归类到一起,称为一个簇,簇内的对象越相似,聚类的效果越好。它是一种无监督的学习(Unsupervised Learning)方法,不需要预先标注好的训练集。聚类与分类最大的区别就是分类的目标事先已知,例如猫狗识别,你在分类之前已经预先知道要将它分为猫、狗两个种类;而在你聚类之前,你对你的目标是未知的,同样以动物为例,对于一个动物集来说,你并不清楚这个数据集内部有多少种类的动物,你能做的只是利用聚类方法将它自动按照特征分为多类,然后人为给出这个聚类结果的定义(即簇识别)。例如,你将一个动物集分为了三簇(类),然后通过观察这三类动物的特征,你为每一个簇起一个名字,如大象、狗、猫等,这就是聚类的基本思想。
至于“相似”这一概念,是利用距离这个评价标准来衡量的,我们通过计算对象与对象之间的距离远近来判断它们是否属于同一类别,即是否是同一个簇。至于距离如何计算,科学家们提出了许多种距离的计算方法,其中欧式距离是最为简单和常用的,除此之外还有曼哈顿距离和余弦相 ...