提交 e9855b39 作者: XveLingKun

联合国代码判重

上级 8304c904
......@@ -180,10 +180,10 @@ def doJob():
publishDate = publishDate.strftime("%Y-%m-%d %H:%M:%S")
if publishDate < '2023-01-20':
continue
# is_href = db_storage.find_one({'网址': href})
# if is_href:
# log.info(f'{href}===已采集')
# continue
is_href = db_storage.find_one({'网址': href})
if is_href:
log.info(f'{href}===已采集')
continue
div.find_all('div')[0].extract()
div.find('span', class_='Z3988').extract()
contentWithTag = div
......
Markdown 格式
0%
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论