From e7ac2c0bbfef366449a5bebe403aad80ec15d38b Mon Sep 17 00:00:00 2001
From: Joseph Cheung <luxtiasco@outlook.com>
Date: Wed, 8 Mar 2023 00:14:33 +0800
Subject: [PATCH] c

---
 searx/webapp.py  | 30 ++++++++++++++++++++++++++++++
 searx/webapp1.py | 32 +++++++++++++++++++++++++++++++-
 2 files changed, 61 insertions(+), 1 deletion(-)

diff --git a/searx/webapp.py b/searx/webapp.py
index 51b1fa285..75fdb4310 100755
--- a/searx/webapp.py
+++ b/searx/webapp.py
@@ -19,6 +19,7 @@ import re
 import datetime
 from textrank4zh import TextRank4Keyword, TextRank4Sentence
 import pycorrector
+import threading
 
 from timeit import default_timer
 from html import escape
@@ -663,6 +664,26 @@ def keytext():
         res.append(item.sentence)
     return Response(json.dumps(res), mimetype='application/json')
 
+def process_result(result):
+    url_pattern = re.compile(r'^(https?://)?([a-z0-9-]+\.)+[a-z0-9-]+\.[a-z]+/?$')
+    # 判断URL是否符合要求
+    if not url_pattern.match(result['url']):
+        return
+    # 发起GET请求访问API
+    query_url=re.sub(r'https?://', '', result['url'])
+    try:
+        response = requests.get(f'https://noisy-dust-b504.marduk.workers.dev/siteOwner?{query_url}', timeout=5)
+    except requests.exceptions.Timeout:
+        print(f'Request timeout for {result["url"]}')
+        return
+    except requests.exceptions.RequestException as e:
+        print(f'Request error for {result["url"]}: {e}')
+        return
+    
+    # 判断返回值是否为'null'，如果不是则更新title
+    if response.text != 'null':
+        result['title'] += ' 此网站主人是:' +response.text
+
 @app.route('/search', methods=['GET', 'POST'])
 def search():
     """Search query in q and return results.
@@ -810,6 +831,15 @@ def search():
                         # return index_error(output_format, gettext('No item found')), 500
                         results.remove(res)
                 except:pass
+        threads = []
+        for result in results:
+            t = threading.Thread(target=process_result, args=(result,))
+            t.start()
+            threads.append(t)
+        
+        # 等待所有线程执行完毕
+        for t in threads:
+            t.join()
         for res in results:
             if 'engine' in res and res['engine'] == 'twitter':
                 try:
diff --git a/searx/webapp1.py b/searx/webapp1.py
index 22a328c71..3d8bad224 100644
--- a/searx/webapp1.py
+++ b/searx/webapp1.py
@@ -19,6 +19,7 @@ import re
 import datetime
 from textrank4zh import TextRank4Keyword, TextRank4Sentence
 import pycorrector
+import threading
 
 from timeit import default_timer
 from html import escape
@@ -663,6 +664,26 @@ def keytext():
         res.append(item.sentence)
     return Response(json.dumps(res), mimetype='application/json')
 
+def process_result(result):
+    url_pattern = re.compile(r'^(https?://)?([a-z0-9-]+\.)+[a-z0-9-]+\.[a-z]+/?$')
+    # 判断URL是否符合要求
+    if not url_pattern.match(result['url']):
+        return
+    # 发起GET请求访问API
+    query_url=re.sub(r'https?://', '', result['url'])
+    try:
+        response = requests.get(f'https://noisy-dust-b504.marduk.workers.dev/siteOwner?{query_url}', timeout=5)
+    except requests.exceptions.Timeout:
+        print(f'Request timeout for {result["url"]}')
+        return
+    except requests.exceptions.RequestException as e:
+        print(f'Request error for {result["url"]}: {e}')
+        return
+    
+    # 判断返回值是否为'null'，如果不是则更新title
+    if response.text != 'null':
+        result['title'] += ' 此网站主人是:' +response.text
+
 @app.route('/search', methods=['GET', 'POST'])
 def search():
     """Search query in q and return results.
@@ -810,6 +831,15 @@ def search():
                         # return index_error(output_format, gettext('No item found')), 500
                         results.remove(res)
                 except:pass
+        threads = []
+        for result in results:
+            t = threading.Thread(target=process_result, args=(result,))
+            t.start()
+            threads.append(t)
+        
+        # 等待所有线程执行完毕
+        for t in threads:
+            t.join()
         for res in results:
             if 'engine' in res and res['engine'] == 'twitter':
                 try:
@@ -839,7 +869,7 @@ def search():
             res['content'] = res['content'].replace("Retweeted.","Reposted.")     
             res['content'] = res['content'].replace("Learn more.","")     
             res['content'] = res['content'].replace("Show replies.","")      
-            res['content'] = res['content'].replace("See new Tweets. ","")
+            res['content'] = res['content'].replace("See new Tweets. ","") 
             if "作者简介：金融学客座教授，硕士生导师" in res['content']:  res['content']=res['title']  
             res['content'] = res['content'].replace("You're unable to view this Tweet because this account owner limits who can view their Tweets.","Private Tweet.")      
             res['content'] = res['content'].replace("Twitter for Android · ","")