Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
Z
zzsn_spider
概览
概览
详情
活动
周期分析
版本库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
王景浩
zzsn_spider
Commits
17e7120f
提交
17e7120f
authored
10月 24, 2023
作者:
薛凌堃
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
test
上级
55d1a789
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
21 行增加
和
5 行删除
+21
-5
test.py
test.py
+21
-5
没有找到文件。
test.py
浏览文件 @
17e7120f
...
...
@@ -46,6 +46,11 @@ import requests, time, random, json, pymysql, redis
import
urllib3
from
bs4
import
BeautifulSoup
from
selenium
import
webdriver
from
selenium.webdriver.chrome.service
import
Service
from
selenium.webdriver.common.by
import
By
from
selenium.webdriver.common.action_chains
import
ActionChains
from
selenium.webdriver.support.ui
import
WebDriverWait
from
selenium.webdriver.support
import
expected_conditions
as
EC
from
obs
import
ObsClient
from
kafka
import
KafkaProducer
...
...
@@ -89,10 +94,21 @@ if __name__=="__main__":
browser
.
get
(
url
)
# 可改动
time
.
sleep
(
20
)
page_source
=
browser
.
page_source
soup
=
BeautifulSoup
(
page_source
,
'html.parser'
)
img_url
=
soup
.
select
(
'img[id="captchaImg"]'
)[
0
][
'src'
]
screen_img_path
=
"D:/screen/xxx.png"
out_img_path
=
"D:/out/xxx.png"
ele
=
driver
.
find_element
(
By
.
ID
,
'XXXX'
)
browser
.
find_element
(
By
.
ID
,
'pName'
)
.
send_keys
(
'北京远翰国际教育咨询有限责任公司'
)
code
=
use_ocr
(
out_img_path
)
验证码输入框元素
.
send_keys
(
code
)
browser
.
find_element
(
By
.
ID
,
'yzm'
)
.
send_keys
(
yzm
)
browser
.
find_element
(
By
.
ID
,
'searchForm'
)
.
click
()
wait
=
WebDriverWait
(
browser
,
30
)
wait
.
until
(
EC
.
presence_of_element_located
((
By
.
TAG_NAME
,
"body"
)))
# screen_img_path = "D:/screen/xxx.png"
# out_img_path = "D:/out/xxx.png"
# ele = driver.find_element(By.ID, 'XXXX')
#
# code = use_ocr(out_img_path)
# 验证码输入框元素.send_keys(code)
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论