<iframe align="center" marginwidth="0" marginheight="0" src="http://www.zealware.com/csdnblog336280.html" frameborder="0" width="336" scrolling="no" height="280"></iframe>
用IE WebControl解析网页得到特定网页中的特定数据:
Set oDocument = Form2.m_IE.Document
Set oelement = oDocument.Forms("searchdetail")
Set oListTableElement = oelement.children(0).children(0)
这样的好处是简单,但坏处是:如何读取以及节点值究竟是什么含意这些信息,不太好抽取出来放到外面,作为灵活配置的文件。
因为它属于一个Childnodes一个Childnodes这么遍历的,无法灵活设定深度以及含义。
又体验了一把正则表达式,专门处理了特定站点HTML,由于我要处理的页面中总包含某些的固定代码。
发现下面的式子可以把一系列值解析到一个又一个的MatchCollection中。
我用的是"The Regulator"工具,试验结果如下:
也就是Collection“hiddentonenames”总是XX名的集合,按序排列;
Collection“hiddenspnames”总是XX名的集合,按序排列;
以此类推。
在C#中,可以用如下代码得到各个集合的值:
foreach(Match match in matchCollection)
{
Group groupToneNames = match.Groups["hiddentonenames"];
Group groupSpNames = match.Groups["hiddenspnames"];
Group groupSingers = match.Groups["hiddensingers"];
}
这样,我可以针对这各种门派的Portal风格写出专门的正则表达式,但让他们输出的Collections名字都是一样的,从而让获取一个铃声的各个字段的代码固定下来。
以后更新,只需要修改各个门派的正则表达式即可。
另外非常感谢王辉的《Web页面爬行实践》精彩文章!
分享到:
相关推荐
C# 正则表达式 集合 C# 正则表达式 集合 C# 正则表达式 集合
使用正则表达式来判断用户输入的IP地址格式是否正确
正则表达式测试工具C#完整源码,包括查找和替换功能,标注显示匹配结果。
c#使用正则表达式验证身份证号码,工程完全可以运行,方便大家参考和学习
C#,VS2010,利用正则表达式验证网址(url),
c#的正则表达式c#的正则表达式c#的正则表达式
一些资料关于 SQL 语法分析;用正则表达式解析C#文件;使用正则表达式实现的语法分析引擎(C#源代码) ;SQL Server 2005正则表达式使模式匹配和数据提取变得更容易;
日期正则一般是对格式有要求,且数据不是直接由用户输入时使用。因应用场景的不同,写出的正则也不同,复杂程度也自然不同。正则的书写需要根据具体情况具体分析,一个基本原则就是:只写合适的,不写复杂的。 对于...
日期正则一般是对格式有要求,且数据不是直接由用户输入时使用。因应用场景的不同,写出的正则也不同,复杂程度也自然不同。正则的书写需要根据具体情况具体分析,一个基本原则就是:只写合适的,不写复杂的。 对于...
C#中的常用正则表达式总结 C#中的常用正则表达式总结 C#中的常用正则表达式总结
邮箱及密码的正则表达式验证(C#)
书中提供了上百种可以在实战中使用的实例,以帮助读者使用正则表达式来处理数据和文本。对于如何使用正则表达式来解决性能不佳、误报、漏报等常见的错误以及完成一些常见的任务,《正则表达式经典实例》给出了涉及...
C#中使用正则表达式验证Email格式、IP地址格式和URL网址格式
C#中使用正则表达式详解C#中使用正则表达式详解
C#计算器实验~ -使用正则表达式解决~ -依据windows自带计算器为参考~ -附有源程序~
正则表达式验证格式
C#验证类(使用正则表达式) 在日常开发中很有用的哦,
C#字符串和正则表达式参考手册》》》》》》》》》》》
C#正则表达式的使用,希望大家可以学习学习! [C#] bool IsValidEmail(string strIn) { // Return true if strIn is in valid e-mail format. return Regex.IsMatch(strIn, @"^([\w-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3...