为了防止xss以及csrf+xss的漏洞,后台统一对字符串进行了转码
结果如下:
原文: JavaScript高级程序设计
编码: JavaScript高级程序设计
前端写了一段如下代码:
function u2str(text){ // transform text in utf8 format to string
return unescape(text.replace(/&#/g,'%u').replace(/;/g,''));
}
对普通的中文没问题,但是对上面的中英文加载的文本,这个函数就会返回乱码。
这种&#打头的utf8文本该怎么显示呀?
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
最后总算解决了,&#后面是5个数字,是10进制的= =b 所以不能直接用%替换
function u2str(text){ return $('<p></p>').html(text).text(); }这样转回来之后不能防xss漏洞,填入html之前仍然需要转义,不过总算可以和后台交流了。
可以使用原生的Javascript代码来进行转义。该编码其实不是utf8,而是unicode编码。这里的字符实际上是html实体。
var decodeHtmlEntity = function(str) { return str.replace(/&#(\d+);/g, function(match, dec) { return String.fromCharCode(dec); }); };输入:
输出:
JavaScript高级程序设计以下代码用于将正常的字符转变为html实体
var encodeHtmlEntity = function(str) { var buf = []; for (var i=str.length-1;i>=0;i--) { buf.unshift(['&#', str[i].charCodeAt(), ';'].join('')); } return buf.join(''); };输入:
输出:
高级程序设计Github gist: https://gist.github.com/4174511