Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
Z
zzsn_spider
概览
概览
详情
活动
周期分析
版本库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
1
合并请求
1
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
丁双波
zzsn_spider
Commits
4956d261
提交
4956d261
authored
11月 01, 2023
作者:
薛凌堃
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
企业动态内容小于300过滤掉
上级
35396c0b
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
5 行增加
和
1 行删除
+5
-1
tyc_qydt_add.py
comData/Tyc/tyc_qydt_add.py
+2
-0
wxList.py
comData/weixin_solo/wxList.py
+3
-1
没有找到文件。
comData/Tyc/tyc_qydt_add.py
浏览文件 @
4956d261
...
...
@@ -158,6 +158,8 @@ def beinWork(tyc_code, social_code,start_time):
contentText
=
smart
.
extract_by_url
(
link
)
.
text
#不带标签正文
content
=
smart
.
extract_by_url
(
link
)
.
cleaned_text
if
len
(
content
)
<
300
:
continue
# time.sleep(3)
except
Exception
as
e
:
contentText
=
''
...
...
comData/weixin_solo/wxList.py
浏览文件 @
4956d261
...
...
@@ -49,6 +49,7 @@ def getSourceInfo(infoSourceCode):
sql
=
f
"SELECT site_uri,id,site_name,info_source_code from info_source where info_source_code = '{infoSourceCode}' "
cursor
.
execute
(
sql
)
row
=
cursor
.
fetchone
()
cnx
.
commit
()
dic_url
=
{
'url_'
:
row
[
0
],
'sid'
:
row
[
1
],
...
...
@@ -143,6 +144,7 @@ def updateCookieToken(token,cookies):
def
getToken
():
cursor_
.
execute
(
f
"select token,cookies from weixin_tokenCookies where fenghao_time < DATE_SUB(NOW(), INTERVAL 2 HOUR) order by update_time asc limit 1"
)
row
=
cursor_
.
fetchall
()
cnx_
.
commit
()
if
row
:
pass
else
:
...
...
@@ -159,7 +161,7 @@ def getPageData(dic_url,page):
info_source_code
=
dic_url
[
'info_source_code'
]
biz
=
dic_url
[
'biz'
]
fakeid
=
biz
+
'=='
tokenAndCookie
=
getToken
()
tokenAndCookie
=
getToken
()
if
tokenAndCookie
:
pass
else
:
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论