又发现了一个.net 的bug!最近在使用正则表达式的时候发现:在忽略大小写的时候,匹配值从0xff 到0xffff之间的所有字符,正则表达式竟然也能匹配两个ASCII字符:i(code: 0x69)和I(code: 0x49);但是仍然不能匹配其他的ASCII字母和数字。
比如以下的代码就是用来测试用正则表达式匹配从0xff到0xffff的字符。而值范围在0到0xfe的所有字符是不能被匹配的。
1234567891011121314151617Regex regex = new Regex(@”[/u00FF-/uFFFF]+”);
// The characters, whoes value are smaller than 0xff, are not expected to be matched.
for (int i = 0; i < 0xff; i++) {
string s = new string(new char[] { (char)i });
Debug.Assert(
!regex.IsMatch(s),
string.Format(“The character was not expected to be matched: 0x{0:X}!”, i));
}
// However, the characters whoes value are greater than 0xfe are expected to be matched.
for (int i = 0xff; i <= 0xffff; i++) {
string s = new string(new char[] { (char)i });
Debug.Assert(
regex.IsMatch(s),
string.Format(“The character was expected to be matched: 0x{0:X}!”, i));
}
这时的运行结果是正常的,没有任何的断言错误出现。
然而当使用忽略大小写的匹配模式时,结果就不一样了。将上面代码中的第一行改成:
1Regex regex = new Regex(@”[/u00FF-/uFFFF]+”, RegexOptions.IgnoreCase);
程序运行的时候就会有两处断言错误。它们分别是字符值为73和105,也就是小写字母i和大写字母 I。 这个bug非常奇怪,别的字符都很正常!而且用javascript脚本在IE(版本是6.0)里面运行也同样有这么bug存在(比如下面这段代码)。然而在Firefox中运行就是没有问题的。还是Firefox好啊,呵呵!
1234567891011121314151617var re = /[/u00FF-/uFFFF]+/;
// var re = /[/u00FF-/uFFFF]+/i;
for(var i=0; i<0xff; i++) {
var s = String.fromcharCode( i );
if ( re.test(s) ){
alert( ’Should not be matched: ’ + i + ’!’ );
}
}
for(var i=0xff; i<=0xffff; i++) {
var s = String.fromcharCode( i );
if ( !re.test(s) ){
alert( ’Should be matched: ’ + i + ’!’ );
}
}
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
使用Cassandra进行.Net编程
本文将介绍如何针对特定的架构设计实现特定的功能. 最终实现基于Dotnet Cassandra存储的应用开发。
-
如何在SQL Server中使用正则表达式
正则表达式是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。本文就将为您讲解如何在SQL Server中使用正则表达式。
-
.net连接Sybase数据库的几种方法
在本文中,作者向我们介绍了使用.net连接Sybase数据库的几种方式和配置,其中包括了ODBC方式、OLEDB方式等。
-
使用.NET程序远程连接Oracle数据库
.net 远程连接Oracle数据库看起来挺简单的,但实际做起来还是遇到不少问题。作者将在本文中分享一些使用.net连接Oracle数据库的经验。