Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
Z
zzsn_spider
概览
概览
详情
活动
周期分析
版本库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
1
合并请求
1
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
丁双波
zzsn_spider
Commits
6e34ed73
提交
6e34ed73
authored
12月 18, 2023
作者:
薛凌堃
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
政策法规脚本维护
上级
6a49a9de
隐藏空白字符变更
内嵌
并排
正在显示
3 个修改的文件
包含
16 行增加
和
9 行删除
+16
-9
reits.py
REITs专题数据/reits.py
+6
-5
gwyfile.py
comData/policylaw/gwyfile.py
+5
-2
gwyparts.py
comData/policylaw/gwyparts.py
+5
-2
没有找到文件。
REITs专题数据/reits.py
浏览文件 @
6e34ed73
impor
t
os
impor
t
os
...
...
@@ -963,11 +963,11 @@ def guizhou():
if
__name__
==
"__main__"
:
# file_path = f'data/REITs贵州省人民政府.xlsx'
# wb = policy.createfile(file_path)
#
reform()
reform
()
# shenzhen()
#
zhengquanqihuo()
#
sse()
zhengquanqihuo
()
sse
()
hebei
()
#
guizhou()
guizhou
()
# zhengquanqihuo()
\ No newline at end of file
comData/policylaw/gwyfile.py
浏览文件 @
6e34ed73
...
...
@@ -122,8 +122,11 @@ def get_content1():
child_type
=
source
.
split
(
'<td class="w340 zcwj_ztfl">'
)[
1
]
.
split
(
'</td>'
)[
0
]
# 主题分类
contentWithTag
=
i_soup
.
find
(
'div'
,
class_
=
'wrap mxxgkwrap mxxgkwrap_gwywj'
)
.
find
(
'table'
,
class_
=
'border-table noneBorder pages_content'
)
# 去除扫一扫
contentWithTag
.
find
(
'div'
,
attrs
=
{
'id'
:
'div_div'
})
.
decompose
()
try
:
# 去除扫一扫
contentWithTag
.
find
(
'div'
,
attrs
=
{
'id'
:
'div_div'
})
.
decompose
()
except
:
pass
content
=
contentWithTag
.
text
# 不带标签正文
fu_jian_soup
=
contentWithTag
.
find_all
(
'a'
)
time
.
sleep
(
0.5
)
...
...
comData/policylaw/gwyparts.py
浏览文件 @
6e34ed73
...
...
@@ -44,7 +44,9 @@ def get_content2():
start_time
=
time
.
time
()
num
=
0
count
=
0
result_list
=
[
'外交部'
,
'国家发展和改革委员会'
,
'教育部'
,
'科学技术部'
,
'工业和信息化部'
,
'国家民族事务委员会'
,
'公安部'
,
'国家安全部'
,
'民政部'
,
'司法部'
,
'财政部'
,
result_list
=
[
'外交部'
,
'国家发展和改革委员会'
,
'教育部'
,
'科学技术部'
,
'工业和信息化部'
,
'国家民族事务委员会'
,
'公安部'
,
'国家安全部'
,
'民政部'
,
'司法部'
,
'财政部'
,
'人力资源和社会保障部'
,
'自然资源部'
,
'生态环境部'
,
'住房和城乡建设部'
,
'交通运输部'
,
'水利部'
,
'农业农村部'
,
'商务部'
,
'文化和旅游部'
,
'国家卫生健康委员会'
,
'退役军人事务部'
,
...
...
@@ -55,7 +57,8 @@ def get_content2():
'中国科学院'
,
'中国社会科学院'
,
'中国工程院'
,
'中国气象局'
,
'中国银行保险监督管理委员会'
,
'中国证券监督管理委员会'
,
'国家粮食和物资储备局'
,
'国家能源局'
,
'国家国防科技工业局'
,
'国家烟草专卖局'
,
'国家移民管理局'
,
'国家林业和草原局'
,
'国家铁路局'
,
'中国民用航空局'
,
'国家邮政局'
,
'国家文物局'
,
'国家中医药管理局'
,
'国家矿山安全监察局'
,
'国家外汇管理局'
,
'国家移民管理局'
,
'国家林业和草原局'
,
'国家铁路局'
,
'中国民用航空局'
,
'国家邮政局'
,
'国家文物局'
,
'国家中医药管理局'
,
'国家矿山安全监察局'
,
'国家外汇管理局'
,
'国家药品监督管理局'
,
'国家知识产权局'
,
'国家档案局'
,
'国家保密局'
,
'国家密码管理局'
,
'国家宗教事务局'
,
'国务院台湾事务办公室'
,
'国家乡村振兴局'
,
'国家电影局'
]
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论