Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
Z
zzsn_spider
概览
概览
详情
活动
周期分析
版本库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
王景浩
zzsn_spider
Commits
adb1e05d
提交
adb1e05d
authored
1月 11, 2024
作者:
薛凌堃
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
1/11
上级
0dffe4be
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
7 行增加
和
5 行删除
+7
-5
test.py
百度翻译/test.py
+7
-5
没有找到文件。
百度翻译/test.py
浏览文件 @
adb1e05d
#百度翻译
不登录翻译1000字 登录翻译5000字
#百度翻译
不登录翻译1000字 登录翻译5000字
...
...
@@ -2,7 +2,7 @@
import
re
import
string
import
time
from
urllib.parse
import
quote
import
pymongo
from
bs4
import
BeautifulSoup
from
selenium
import
webdriver
...
...
@@ -23,6 +23,7 @@ class Translate():
# self._lang_list_original = ["中文", "英语", "韩语", "法语", "日语", "希腊语", "俄语"]
# self._num = len(self._lang_list)
self
.
url
=
"https://fanyi.baidu.com/#{}/{}/{}"
# self.url = "https://fanyi.baidu.com/#"
self
.
header
=
{
"User-Agent"
:
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1"
}
...
...
@@ -64,7 +65,8 @@ class Translate():
pass
else
:
word_type
=
lang
url
=
self
.
url
.
format
(
word_type
,
'zh'
,
sentence_
)
url_
=
self
.
url
.
format
(
word_type
,
'zh'
,
sentence_
)
url
=
quote
(
url_
,
safe
=
'/:#'
)
browser
.
set_page_load_timeout
(
10
)
try
:
browser
.
get
(
url
)
...
...
@@ -193,8 +195,8 @@ class Translate():
if
lang
==
'zh'
:
return
contentWithTag
for
tag
in
html
.
find_all
(
text
=
True
):
sentence
=
str
(
tag
)
# sentence = " 実際に働き手の数が8がけ(8割)になる16年後、介護のようなケアサービスを今のような形で受けることは困難になると予測される。
"
#
sentence = str(tag)
sentence
=
"95
%
say hello
"
if
sentence
==
'
\n
'
or
sentence
==
'
\t
'
or
sentence
==
' '
:
continue
if
self
.
is_punctuation
(
sentence
):
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论