[移动开发] 2021-07-23 Week1 基于截图的钓鱼网站检测、中小微企业安全现状调查

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 移动开发 -> 2021-07-23 Week1 基于截图的钓鱼网站检测、中小微企业安全现状调查 -> 正文阅读

[移动开发]2021-07-23 Week1 基于截图的钓鱼网站检测、中小微企业安全现状调查

Phishpedia: A Hybrid Deep Learning Based Approach to Visually Identify Phishing Webpages

使用机器学习方法，利用屏幕截图，检测钓鱼网站。

过去的方法，要么是准确率低，要么是缺乏解释性。该方法在准确率的同时提供了解释性，并且不需要大量的钓鱼网站作为训练集。
在这里插入图片描述
检测分为两步：识别UI组件 + 识别商标brand。识别UI组件第一个是基于HTML，第二个是基于和目标网站的对比，但识别商标是个很麻烦的事，作者认为只需要关注top 100的网站的商标即可，经验研究表明大部分攻击者会选择知名网站来进行高仿。

此外，提供了一个公开的钓鱼网站数据集。

个人认为，因为前人更多关注的是整个截图的相似性，只考虑了图片本身，忽略了其他信息。本文引入了对UI组件本身的check，并且单独分离出了商标作为特征，因而取得了改进效果。但存疑的两个地方是，第一个是只选择商标的一个很小的子集，是否真能起到很好的效果；第二个是仍然需要不小的训练集，只不过训练集从钓鱼网站本身变成了商标啥的，相当于玩了一个文字游戏，让人以为是无监督（或者半监督）方法。

A Large-Scale Interview Study on Information Security in and Attacks against Small and Medium-sized Enterprises

很少见的经验研究，以调查形式开展。主要是回答了几个关于中小微企业安全现状的问题，得到了一些结论。