北京 | 上海 | 天津 | 重庆 | 广州 | 深圳 | 珠海 | 汕头 | 佛山 | 中山 | 东莞 | 南京 | 苏州 | 无锡 | 常州 | 南通 | 扬州 | 徐州 | 杭州 | 温州 | 宁波 | 台州 | 福州 | 厦门 | 泉州 | 龙岩 | 合肥 | 芜湖 | 成都 | 遂宁 | 长沙 | 株洲 | 湘潭 | 武汉 | 南昌 | 济南 | 青岛 | 烟台 | 潍坊 | 淄博 | 济宁 | 太原 | 郑州 | 石家庄 | 保定 | 唐山 | 西安 | 大连 | 沈阳 | 长春 | 昆明 | 兰州 | 哈尔滨 | 佳木斯 | 南宁 | 桂林 | 海口 | 贵阳 | 西宁 | 乌鲁木齐 | 包头 |
参照上例子采集不到数据,自动编号增加了,内容都是空的,老师给看看,谢谢!
需要采集的网址:http://www.safe.gov.cn//AppStructured/hlw/RMBQuery.do
我写的表达式
<tr class="first" onMouseover='this.style.backgroundColor="(?:.*?)"' onMouseout='this.style.backgroundColor="(?:.*?)"'>[\s\S]*?<td td width="(?:.*?)" align="center" >[\s\S]*?(.*?)</td>[\s\S]*?<td td width="(?:.*?)" align="center" >[\s\S]*?(.*?)</td>