Merge pull request #2 from Dimlitter/Dimlitter-patch-1

LittleYe233 · web-flow · commit 827a2f0b73f4 · 2022-02-10T22:13:45.000+08:00
Add files via upload
diff --git a/auto_comment_plus.py b/auto_comment_plus.py
@@ -19,6 +19,7 @@
 
 jieba.setLogLevel(jieba.logging.INFO)
 
+
 with open(CONFIG_PATH, 'r', encoding='utf-8') as f:
     cfg = yaml.safe_load(f)
 ck = cfg['user']['cookie']
@@ -32,15 +33,14 @@
 
 
 # 评价生成
-def generation(pname, _class=0, _type=1):
+def generation(pname, _class=0):
     list = ['商品名']
     list.clear()
     list.append(pname)
     for item in list:
         spider = jdspider.JDSpider(item)
-        result = spider.getData(3, 3)  # 这里可以自己改
+        result = spider.getData(4, 3) #这里可以自己改
 
-    # 0是追评 1是评价
     # class 0是评价 1是提取id
     try:
         name = jieba.analyse.textrank(pname, topK=5, allowPOS='n')[0]
@@ -49,30 +49,15 @@ def generation(pname, _class=0, _type=1):
     if _class == 1:
         return name
     else:
-        datas = {
-            1: {
-                "开始": result,
-                "中间": result,  # 重复的几率不大，相信我（
-                "结束": result
-            },
-            0: {
-                "开始": result,
-                "中间": result,
-                "结束": result
-            }
-        }
-        if _type == 1:
-            comments = datas[_type]
-            return random.randint(3, 5), (
-                random.choice(comments["开始"]) +
-                random.choice(comments["中间"]) +
-                random.choice(comments["结束"])).replace("$", name)
-        elif _type == 0:
-            comments = datas[_type]
-            return (
-                random.choice(comments["开始"]) +
-                random.choice(comments["中间"]) +
-                random.choice(comments["结束"])).replace("$", name)
+        comments = ''
+        if len(result) > 8 :
+            for i in range(8):
+                comments = comments + result.pop()
+        else:
+            for i in range(len(result)):
+                comments = comments + result.pop()
+            return 5, (
+                comments.replace("$", name))
 
 
 # 查询全部评价
@@ -122,7 +107,6 @@ def ordinary(N):
             print(f"\t{i}.开始评价订单\t{oname}[{oid}]")
             url2 = "https://club.jd.com/myJdcomments/saveProductComment.action"
             xing, Str = generation(oname)
-            xing = 5  # 写死五星
             print(f'\t\t评价内容,星级{xing}：', Str)
             data2 = {
                 'orderId': oid,
@@ -133,7 +117,7 @@ def ordinary(N):
                 'anonymousFlag': '1'
             }
             pj2 = requests.post(url2, headers=headers, data=data2)
-            time.sleep(20)
+            time.sleep(10)
     N['待评价订单'] -= 1
     return N
 
@@ -187,7 +171,7 @@ def sunbw(N):
             'saveStatus': 3
         }, headers=headers)
         print('完成')
-        time.sleep(50)
+        time.sleep(5)
         N['待晒单'] -= 1
     return N
 
@@ -218,7 +202,7 @@ def review(N):
         pid, oid = _id.replace(
             'http://club.jd.com/afterComments/productPublish.action?sku=',
             "").split('&orderId=')
-        context = generation(oname, _type=0)
+        context = generation(oname)
         print(f'\t\t追评内容：{context}')
         req_url1 = requests.post(url1, headers=headers, data={
             'orderId': oid,
@@ -228,7 +212,7 @@ def review(N):
             'score': 5
         })
         print('完成')
-        time.sleep(30)
+        time.sleep(10)
         N['待追评'] -= 1
     return N
 
@@ -271,7 +255,7 @@ def Service_rating(N):
         }
         pj1 = requests.post(url1, headers=headers, data=data1)
         print("\t\t", pj1.text)
-        time.sleep(25)
+        time.sleep(15)
         N['服务评价'] -= 1
     return N
 
diff --git a/jdspider.py b/jdspider.py
@@ -74,9 +74,9 @@ def getData(self, maxPage, score,):  # maxPage是爬取评论的最大页数，
         for j in range(sum):
             id = self.productsId[j]
             header = self.getHeaders(id)
-            for i in range(1, maxPage):
-                param, url = self.getParamUrl(id, i, score)
-                print(">>>>>>>>>>>>>>>>第：%d 个，第 %d 页" % (j, i))
+            for i in range(1,maxPage):
+                param,url = self.getParamUrl(id,i,score)
+                print("正在爬取评论信息>>>>>>>>>第：%d 个，第 %d 页"%(j,i))
                 try:
                     response = requests.get(url, headers=header, params=param)
                 except Exception as e:
@@ -110,15 +110,33 @@ def getData(self, maxPage, score,):  # maxPage是爬取评论的最大页数，
         # 存入列表,简单处理评价
         remarks = []
         for i in range(len(comments)):
-            rst = re.findall(zhon.hanzi.sentence, comments[i])
-            if len(rst) == 0 or rst == ["。"] or rst == ["？"] or rst == ["！"] or rst == ["."] or rst == [","] or rst == ["?"] or rst == ["!"]:
-                logging.warning("拆分失败或结果不符(去除空格和标点符号)：%s" % (rst))
+            rst = re.findall(zhon.hanzi.sentence,comments[i])
+            if len(rst) == 0 or rst == ['。'] or rst == ['？'] or rst == ['！'] or rst == ['.'] or rst == [','] or rst == ['?'] or rst == ['!']:
+                logging.warning("拆分失败或结果不符(去除空格和标点符号)：%s"%(rst))
             else:
                 remarks.append(rst)
         result = self.solvedata(remarks=remarks)
-        if len(result) == 0:
-            logging.warning("当前商品没有评价,强制退出程序，请自行评价")
-            sys.exit(0)
+        if len(result)==0:
+            logging.warning("当前商品没有评价,使用默认评价")
+            result = ["考虑买这个$之前我是有担心过的，因为我不知道$的质量和品质怎么样，但是看了评论后我就放心了。",
+                    "买这个$之前我是有看过好几家店，最后看到这家店的评价不错就决定在这家店买 ",
+                    "看了好几家店，也对比了好几家店，最后发现还是这一家的$评价最好。",
+                    "看来看去最后还是选择了这家。",
+                    "之前在这家店也买过其他东西，感觉不错，这次又来啦。",
+                    "这家的$的真是太好用了，用了第一次就还想再用一次。",
+                    "收到货后我非常的开心，因为$的质量和品质真的非常的好！",
+                    "拆开包装后惊艳到我了，这就是我想要的$!",
+                    "快递超快！包装的很好！！很喜欢！！！",
+                    "包装的很精美！$的质量和品质非常不错！",
+                    "收到快递后迫不及待的拆了包装。$我真的是非常喜欢",
+                    "真是一次难忘的购物，这辈子没见过这么好用的东西！！",
+                    "经过了这次愉快的购物，我决定如果下次我还要买$的话，我一定会再来这家店买的。",
+                    "不错不错！",
+                    "我会推荐想买$的朋友也来这家店里买",
+                    "真是一次愉快的购物！",
+                    "大大的好评!以后买$再来你们店！(￣▽￣)",
+                    "真是一次愉快的购物！"
+                    ]
         return result
 
     def solvedata(self, remarks):