Bfor.cn
潇笑不是潇潇
http://xiaoxiao.bfor.cnRSS ﹥收藏
 
網絡日誌
 
.net正则表达式性能问题. 
發佈於:2009-7-18 1:07


之前在web程序中错误的使用了RegexOptions.Compiled 选项,导致每个页面打开整度慢了接近0.5秒..
因为是在httpModule里过滤关键字,对性能比较敏感,做了个简单测试.
 

 

Stopwatch w = new Stopwatch();
           w.Start();
           Regex r = new Regex(@".*", RegexOptions.Compiled );
             Match m = r.Match("aaa");
             if (m.Success)
             {
                 w.Stop();
                 Response.Write(w.Elapsed.TotalSeconds.ToString("0.0000000"));
              
             }

不加RegexOptions.Compiled ,计时器显示0.0000x,添加RegexOptions.Compiled 后计数器显示0.00x
如果正则式写的在复杂一些,那么仅编译时间都要0.x秒了. 看来大部分应用使用RegexOptions.Compiled 反而会降低性能,除非是很BT的应用

.net的正则表达使用NFA引擎,NFA引擎正则式的写法对性能的很大. 


 Regex r = new Regex(@"(a|[^a]+)*^" );
 string  str="111111111111111111111111111111111";
Match m = r.Match(str);
             if (m.Success)
             {
                 Response.Write(w.Elapsed.TotalSeconds.ToString("0.0000000"));
              
             }
只要str长度超过26基本上很匹配难完成.
以下这些都类似
(b|[^b]+)*^
(c|[^c]+)*^

 不过要完全弄懂NFA还是DFA不容易,Jeffrey的书写的不错,但弄懂这二种机制,总好还是看看编译原理
  

【閱讀34877】 【評論1】
評分統計
評論
【1樓】回复: .net正则表达式性能问题.
洋字母对我来书简直就是天书!
發布者 wangru  -  2009-11-26 12:58
發布評論
名稱:
密碼:(遊客無須)
您的網絡日誌URL(可選):
標題:
評論
驗證碼:
 換一個

  
      
添加表情: