提交 60ccfd9e 作者: 薛凌堃

山东省人民政府

上级 ff6db068
import time
import time
......@@ -61,6 +61,7 @@ def getDataJson(page):
def getContent(url, publishDate, num):
id_list = []
soup = getSoup(url)
policy.paserUrl(soup, url)
contentWithTag = soup.find('div', class_='wip_art_con')
a_list = contentWithTag.find_all('a')
num_ = 1
......@@ -166,7 +167,7 @@ def doJob():
for data_ in data_json:
data_ = data_.replace('\\', '')
soup = BeautifulSoup(data_, 'lxml')
data = getData(soup, num)
getData(soup, num)
num += 1
......
Markdown 格式
0%
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论