Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
Z
zzsn_spider
概览
概览
详情
活动
周期分析
版本库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
王景浩
zzsn_spider
Commits
331279ef
提交
331279ef
authored
11月 16, 2023
作者:
薛凌堃
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
新增企业自动化
上级
480932b7
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
23 行增加
和
19 行删除
+23
-19
baseinfo1113.py
comData/BaseInfo_qcc/baseinfo1113.py
+23
-19
没有找到文件。
comData/BaseInfo_qcc/baseinfo1113.py
浏览文件 @
331279ef
...
...
@@ -430,10 +430,7 @@ def spiderinfo(company_url, securitiesCode, securitiesShortName, listingDate, ca
data_businfo
[
list
(
data_businfo
.
keys
())[
-
1
]]
=
value
else
:
data_businfo
[
list
(
data_businfo
.
keys
())[
-
1
]]
=
td
.
text
.
replace
(
'复制'
,
''
)
.
replace
(
'
\n
'
,
''
)
.
replace
(
' '
,
''
)
data_businfo
[
list
(
data_businfo
.
keys
())[
-
1
]]
=
td
.
text
.
replace
(
'复制'
,
''
)
.
replace
(
'
\n
'
,
''
)
.
replace
(
' '
,
''
)
result_dict
=
getinfo
(
data_businfo
,
data_baseinfo
)
...
...
@@ -576,26 +573,33 @@ if __name__ == '__main__':
if
company_field
==
''
or
company_field
is
None
:
# 本轮结束后没有新增的企业要采集
file
.
deleteFile
(
file_name
)
time
.
sleep
(
20
)
flag
=
True
while
flag
:
time
.
sleep
(
5400
)
company_field
=
baseCore
.
redicPullData
(
'BaseInfoEnterprise:gnqy_socialCode'
)
if
company_field
:
flag
=
False
baseCore
.
r
.
lpush
(
'BaseInfoEnterprise:gnqy_socialCode'
,
company_field
)
continue
continue
social_code
=
company_field
.
split
(
'|'
)[
0
]
com_name
=
company_field
.
split
(
'|'
)[
2
]
#
ynDomestic = company_field.split('|')[15]
#
countryName = company_field.split('|')[16]
#
securitiesCode = company_field.split('|')[17]
#
securitiesShortName = company_field.split('|')[18]
#
listingDate = company_field.split('|')[21]
#
category = company_field.split('|')[19]
#
exchange = company_field.split('|')[20]
ynDomestic
=
''
countryName
=
''
securitiesCode
=
''
securitiesShortName
=
''
listingDate
=
''
category
=
''
exchange
=
''
ynDomestic
=
company_field
.
split
(
'|'
)[
15
]
countryName
=
company_field
.
split
(
'|'
)[
16
]
securitiesCode
=
company_field
.
split
(
'|'
)[
17
]
securitiesShortName
=
company_field
.
split
(
'|'
)[
18
]
listingDate
=
company_field
.
split
(
'|'
)[
21
]
category
=
company_field
.
split
(
'|'
)[
19
]
exchange
=
company_field
.
split
(
'|'
)[
20
]
#
ynDomestic = ''
#
countryName = ''
#
securitiesCode = ''
#
securitiesShortName = ''
#
listingDate = ''
#
category = ''
#
exchange = ''
count
=
redaytowork
(
com_name
,
social_code
,
securitiesCode
,
securitiesShortName
,
listingDate
,
category
,
exchange
,
ynDomestic
,
countryName
,
file_name
)
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论