Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
Z
zzsn_spider
概览
概览
详情
活动
周期分析
版本库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
1
合并请求
1
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
丁双波
zzsn_spider
Commits
6cdfccca
提交
6cdfccca
authored
2月 04, 2024
作者:
LiuLiYuan
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
国研网增量修改 02/04
上级
9dbcd59d
显示空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
2 行增加
和
11 行删除
+2
-11
gyw.py
comData/policylaw/gyw/gyw.py
+2
-11
没有找到文件。
comData/policylaw/gyw/gyw.py
浏览文件 @
6cdfccca
...
@@ -248,23 +248,15 @@ def doJob():
...
@@ -248,23 +248,15 @@ def doJob():
source
=
data
[
'source'
]
source
=
data
[
'source'
]
summary
=
data
[
'summary'
]
summary
=
data
[
'summary'
]
publishdate
=
data
[
'deliveddate'
]
publishdate
=
data
[
'deliveddate'
]
if
publishdate
<
'2023-05-25'
:
pageFlg
=
False
break
chnid
=
data
[
'chnid'
]
chnid
=
data
[
'chnid'
]
leafid
=
data
[
'leafid'
]
leafid
=
data
[
'leafid'
]
code
=
data
[
'code'
]
.
split
(
'_'
)[
1
]
code
=
data
[
'code'
]
.
split
(
'_'
)[
1
]
href
=
f
'https://d.drcnet.com.cn/eDRCnet.common.web/DocDetail.aspx?chnid={chnid}&leafid={leafid}&docid={code}&uid=8007&version=YDYL'
href
=
f
'https://d.drcnet.com.cn/eDRCnet.common.web/DocDetail.aspx?chnid={chnid}&leafid={leafid}&docid={code}&uid=8007&version=YDYL'
is_href
=
db_storage
.
find_one
({
'网址'
:
href
})
is_href
=
db_storage
.
find_one
({
'网址'
:
href
})
if
is_href
:
if
is_href
:
continue
pageFlg
=
False
break
driver
.
get
(
href
)
driver
.
get
(
href
)
# js = "return action=document.body.scrollHeight"
# new_height = driver.execute_script(js)
# for i in range(0, new_height, 300):
# driver.execute_script(js)
# driver.execute_script('window.scrollTo(0, %s)' % (i))
# time.sleep(1)
try
:
try
:
WebDriverWait
(
driver
,
5
)
.
until
(
WebDriverWait
(
driver
,
5
)
.
until
(
EC
.
presence_of_element_located
((
By
.
ID
,
'AttachmentDownload'
))
EC
.
presence_of_element_located
((
By
.
ID
,
'AttachmentDownload'
))
...
@@ -339,7 +331,6 @@ def doJob():
...
@@ -339,7 +331,6 @@ def doJob():
log
.
error
(
f
'{href}===传输失败'
)
log
.
error
(
f
'{href}===传输失败'
)
num
+=
1
num
+=
1
time
.
sleep
(
5
)
time
.
sleep
(
5
)
pageFlg
=
False
else
:
else
:
break
break
log
.
info
(
f
'{country}===共采集{num}条'
)
log
.
info
(
f
'{country}===共采集{num}条'
)
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论