提交 e9855b39 作者: XveLingKun

联合国代码判重

上级 8304c904
...@@ -180,10 +180,10 @@ def doJob(): ...@@ -180,10 +180,10 @@ def doJob():
publishDate = publishDate.strftime("%Y-%m-%d %H:%M:%S") publishDate = publishDate.strftime("%Y-%m-%d %H:%M:%S")
if publishDate < '2023-01-20': if publishDate < '2023-01-20':
continue continue
# is_href = db_storage.find_one({'网址': href}) is_href = db_storage.find_one({'网址': href})
# if is_href: if is_href:
# log.info(f'{href}===已采集') log.info(f'{href}===已采集')
# continue continue
div.find_all('div')[0].extract() div.find_all('div')[0].extract()
div.find('span', class_='Z3988').extract() div.find('span', class_='Z3988').extract()
contentWithTag = div contentWithTag = div
......
Markdown 格式
0%
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论