Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
meta_crawler
概览
概览
详情
活动
周期分析
版本库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
统计图
问题
0
议题
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
代码片段
成员
成员
折叠边栏
关闭边栏
活动
图像
聊天
创建新问题
作业
提交
问题看板
Open sidebar
刘伟刚
meta_crawler
Commits
019f8b31
提交
019f8b31
authored
9月 06, 2022
作者:
liuweigang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
采集代码更新6
上级
fb9e509a
隐藏空白字符变更
内嵌
并排
正在显示
3 个修改的文件
包含
13 行增加
和
9 行删除
+13
-9
MetaBaiduSearchThread.java
.../src/main/java/com/zzsn/search/MetaBaiduSearchThread.java
+3
-0
RecorderUtil.java
...arch/src/main/java/com/zzsn/search/util/RecorderUtil.java
+1
-1
MetaSouGouSearchThread.java
...src/main/java/com/zzsn/search/MetaSouGouSearchThread.java
+9
-8
没有找到文件。
baidu_search/src/main/java/com/zzsn/search/MetaBaiduSearchThread.java
浏览文件 @
019f8b31
package
com
.
zzsn
.
search
;
import
cn.hutool.core.date.DateUtil
;
import
com.fasterxml.jackson.databind.ObjectMapper
;
import
com.zzsn.cache.JedisUtil
;
import
com.zzsn.cache.MemcachedUtils
;
...
...
@@ -649,6 +650,8 @@ public class MetaBaiduSearchThread implements Runnable {
clbAnsProcessitem
.
setOrigin
(
docInfo
.
getOrigin
());
clbAnsProcessitem
.
setPublishDate
(
docInfo
.
getPublishDate
());
clbAnsProcessitem
.
setSourceAddress
(
docInfo
.
getSourceaddress
());
String
now
=
DateUtil
.
now
();
clbAnsProcessitem
.
setCreateDate
(
now
);
clbAnsProcessitem
.
setSource
(
"3"
);
return
clbAnsProcessitem
;
}
...
...
baidu_search/src/main/java/com/zzsn/search/util/RecorderUtil.java
浏览文件 @
019f8b31
...
...
@@ -337,7 +337,7 @@ public class RecorderUtil {
// docstr = seleniumTime.getScopehtmlByProxy(urlList.get(i));
if
(
StringUtils
.
isEmpty
(
docstr
)){
try
{
Thread
.
sleep
(
1000
*
5
);
Thread
.
sleep
(
1000
*
2
);
SeleniumTime
seleniumTime2
=
new
SeleniumTime
();
docstr
=
seleniumTime2
.
getScopehtml
(
urlList
.
get
(
i
));
}
catch
(
InterruptedException
e
)
{
...
...
sougou_crawler/src/main/java/com/zzsn/search/MetaSouGouSearchThread.java
浏览文件 @
019f8b31
...
...
@@ -90,14 +90,14 @@ public class MetaSouGouSearchThread implements Runnable {
return
;
}
for
(
String
kWord
:
keyWords
)
{
try
{
boolean
sismember
=
JedisUtil
.
sismember
(
cache_key
,
kWord
);
if
(
sismember
)
{
continue
;
}
}
catch
(
Exception
e
){
log
.
info
(
"缓存出问题"
);
}
//
try {
//
boolean sismember = JedisUtil.sismember(cache_key, kWord);
//
if (sismember) {
//
continue;
//
}
//
}catch (Exception e){
//
log.info("缓存出问题");
//
}
String
url1
=
Constants
.
META_SEARCH_URL
;
// String[] kwords=kWord.split("\\+");
String
url
=
""
;
...
...
@@ -362,6 +362,7 @@ public class MetaSouGouSearchThread implements Runnable {
// 加入缓存池中
System
.
out
.
println
(
"加入缓存池"
);
// JedisUtil.sadd(rediskey, cwbm.getSourceaddress());
// addressList.add(docInfo.getSourceaddress());
// MemcachedUtils.set(key,addressList,60*60*24);
JedisUtil
.
setString
(
Constants
.
SOURCEADDRESS
+
"_"
+
orgId
+
"_"
+
cwbm
.
getSourceaddress
(),
"1"
,-
1
);
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论