文章来源:https://www.cnblogs.com/feiwu123/p/5531432.html
逻辑:把网页代码读到字符串中,通过正则表达式筛选出指定的数据,然后变成二维数组,插入到数据库里。
<?phppublic function spider_j($page){$url="http://aaa/bbb".$page."_0/";$fcontents=file_get_contents($url);$table_data = preg_match_all('#<table>(.*?)</table>#si',$fcontents,$match);$table_data = $match[0][0];$table_array = explode('<tr>',$table_data);$data = array();for($i=2;$i<count($table_array);$i++){$data[$i] = explode('</td>',$table_array[$i]);for($j = 0;$j<count($data[$i]);$j++){$data[$i][$j] = preg_replace('/\s(?=\s)/','',trim(strip_tags($data[$i][$j])));}$data[$i][6] = date('Y-m-d');}$kname = array('ID', 'GAMENAME', 'GATEGORY','BETA', 'DATA', 'DOWNLOAD','THEDATE');foreach($data as $key=>&$val){$val = array_combine($kname,$val);}for($i=2;$i<(count($data)+2);$i++){$this->db06->insert('TBL_J',$data[$i]);}}public function spider(){for($i=1;$i<11;$i++){$this->spider_j($i);}}
